A Curva de Aprendizagem: como os Centros de Pesquisa e Desenvolvimento da Samsung
O Galaxy AI1 já ajudou milhões de pessoas em todo o mundo a se conectarem e se comunicarem. Os recursos de Inteligência Artificial nos dispositivos Galaxy compatíveis, baseados em grandes modelos de linguagem (LLMs), como Tradução Simultânea2, Intérprete3, Notas Inteligentes4 e Assistente de Busca, agora suportam 16 idiomas, com mais quatro previstos até o final do ano.
O processo de desenvolvimento dos recursos de idiomas para o Galaxy AI exigiu muito tempo e dedicação, pois cada idioma possui uma estrutura e uma cultura únicas. Pesquisadores da Samsung em diversas regiões – Brasil, China, Índia, Indonésia, Japão, Jordânia, Polônia e Vietnã – compartilharam os desafios e as conquistas que marcaram o desenvolvimento do Galaxy AI. A Samsung Newsroom preparou um resumo das suas histórias abaixo.
Desenvolvimento de um modelo de tradução
Os recursos do Galaxy AI, como o Tradução Simultânea, incluem três processos principais: reconhecimento automático de fala (ASR), tradução automática neural (NMT) e conversão de texto em fala (TTS).
O Centro de Pesquisa e Desenvolvimento da Samsung no Vietnã (SRV) enfrentou obstáculos com modelos de reconhecimento automático de fala (ASR), pois o vietnamita é um idioma com seis tons distintos. A complexidade adicionada pelos tons torna o reconhecimento por Inteligência Artificial mais complicado, pois as nuances linguísticas são mais sutis e variadas. Para superar esse obstáculo, o SRV desenvolveu um modelo capaz de distinguir quadros de áudio mais curtos, com cerca de 20 milissegundos.
O Centro de Pesquisa e Desenvolvimento da Samsung na Polônia (SRPOL) enfrentou o enorme desafio de treinar modelos de tradução automática neural (NMT) para um continente tão diversificado como a Europa. Aproveitando sua vasta experiência em projetos que cobrem mais de 30 idiomas e quatro fusos horários, o SRPOL conseguiu superar a dificuldade de traduzir frases intraduzíveis e lidar com expressões idiomáticas que podem não ter equivalentes diretos em outros idiomas.
O Centro de Pesquisa e Desenvolvimento da Samsung na Jordânia (SRJO) adaptou o árabe – um idioma falado em mais de 20 países e com cerca de 30 dialetos – para o Galaxy AI. Criar um modelo de conversão de texto em fala (TTS) não foi uma tarefa fácil, pois os diacríticos e as orientações de pronúncia são amplamente compreendidos pelos falantes nativos de árabe, mas estão ausentes na escrita. Com base em um sofisticado modelo de previsão para diacríticos ausentes, o SRJO conseguiu publicar um modelo de linguagem que compreende diferentes dialetos e consegue responder em árabe padrão.
A importância dos dados
Ao longo do processo de treinamento do Galaxy AI em cada idioma, um tema central foi a importância da colaboração aberta com instituições locais. A qualidade dos dados utilizados diretamente a precisão dos sistemas de ASR, NMT e TTS. Assim, a Samsung trabalhou com vários parceiros para obter e analisar dados que refletissem o jargão, dialetos e outras variações regionais.
Cada idioma tem um conjunto distinto de qualidades que representam desafios na criação de um modelo de idioma de IA para ele. Os tons aumentam a complexidade para idiomas tonais como o vietnamita |
O Centro de Pesquisa e Desenvolvimento da Samsung na Índia-Bangalore (SRI-B) colaborou com o Vellore Institute of Technology para proteger quase um milhão de linhas de dados de áudio segmentados e selecionados, incluindo fala, palavras e comandos de conversação. Os alunos tiveram experiência prática em um projeto da vida real, e orientação de especialistas da Samsung. O rico banco de dados resultante ajudou o SRI-B a treinar o Galaxy AI em hindi, cobrindo mais de 20 dialetos regionais e suas respectivas inflexões tonais, pontuação e coloquialismos.
Os conhecimentos linguísticos locais foram essenciais para o desenvolvimento do modelo de espanhol latino-americano, devido à diversidade dentro da língua que reflete a diversidade de cada país. Por exemplo, a palavra para “piscina” pode variar para “alberca” no México, “piscina” na Colômbia, Bolívia e Venezuela, ou “pileta” na Argentina, Paraguai e Uruguai, dependendo da região.
O Centro de Pesquisa e Desenvolvimento da Samsung no Brasil (SRBR) colaborou com os institutos de ciência e tecnologia SiDi e Sidia para coletar e gerenciar grandes volumes de dados. Esse trabalho incluiu a refinação e aprimoramento das fontes de áudio e texto, essenciais para o desenvolvimento do modelo de espanhol latino-americano do Galaxy AI.
O Centro de Pesquisa e Desenvolvimento da Samsung na China-Beijing (SRC-B) e o Centro de Pesquisa e Desenvolvimento da Samsung na China-Guangzhou (SRC-G) estabeleceram parcerias com as empresas chinesas Baidu e Meitu, aproveitando sua expertise no desenvolvimento de grandes modelos de linguagem (LLM), como ERNIE Bot e MiracleVision, respectivamente. Como resultado, o Galaxy AI agora suporta os dois principais modos do chinês: mandarim e cantonês.
Além da colaboração externa, a diligência e os recursos internos foram igualmente essenciais.
O bahasa indonésio é um idioma caracterizado pelo uso extensivo de significados contextuais e implícitos, que se baseiam em pistas sociais e situacionais. Os pesquisadores do Centro de Pesquisa e Desenvolvimento da Samsung na Indonésia (SRIN) realizaram gravações em cafeterias e ambientes de trabalho para capturar ruídos ambientais autênticos que poderiam interferir na entrada de áudio. Esse trabalho de campo ajudou o modelo a aprender a reconhecer informações relevantes a partir da entrada verbal, aprimorando, assim, a precisão do reconhecimento de fala.
No japonês, há muitos homônimos devido ao número limitado de sons no idioma, o que exige que muitas palavras sejam interpretadas com base no contexto. O Centro de Pesquisa e Desenvolvimento da Samsung no Japão (SRJ) utilizou o Samsung Gauss, o LLM interno da empresa, para estruturar frases contextuais com palavras ou expressões relevantes para cada cenário, ajudando o modelo de Inteligência Artificial a distinguir homônimos.
Rede global de pesquisa da Samsung
Os profissionais de diversos institutos de pesquisa e desenvolvimento da Samsung maximizaram o uso da rede global de pesquisa da empresa.
Antes de abordar o hindi, o SRI-B colaborou com equipes de todo o mundo para desenvolver modelos de linguagem de Inteligência Artificial para inglês britânico, inglês da Índia e da Austrália, bem como tailandês, vietnamita e indonésio. Engenheiros de outros centros de pesquisa da Samsung viajaram até Bangalore, na Índia, para integrar os idiomas vietnamita, tailandês e indonésio ao Galaxy AI.
Funcionários e colaboradores posam em frente ao Samsung R&D Institute India-Bangalore (SRI-B) |
O SRPOL tinha vasta experiência no desenvolvimento de modelos ASR, NMT e TTS para uma infinidade de idiomas. Protagonista crucial na expansão linguística do Galaxy AI, o SRPOL colaborou com institutos em todos os continentes para apoiar o SRJO com dialetos árabes e o SRBR com o português do Brasil e o espanhol da América Latina.
Desenvolvedores da Samsung em cada uma dessas localidades aprenderam a trabalhar em conjunto, superando fronteiras e fusos horários. Os desenvolvedores do SRIN, por exemplo, observaram os costumes locais de jejum na Índia quando se encontraram com seus colegas do SRI-B. Muitos refletiram com orgulho e gratidão sobre seu trabalho, reconhecendo as implicações duradouras desse projeto na língua, cultura, patrimônio e identidade.
Esforços contínuos à medida que a jornada avança
A Samsung apresentou recentemente o Galaxy AI em seus mais recentes dobráveis e wearables – o Galaxy Z Fold6, Galaxy Z Flip6, Galaxy Watch7 e Galaxy Watch Ultra. Desde o seu lançamento no início deste ano, o Galaxy AI já foi usado em mais de 100 milhões de dispositivos.
“Esperamos alcançar 200 milhões de dispositivos até o final de 2024”, afirmou Won-joon Choi, vice-presidente executivo e chefe do escritório de pesquisa e desenvolvimento móvel, Mobile eXperience Business da Samsung Electronics, em um painel de discussão recente.
No meio desta missão de democratizar a Inteligência Artificial, é fundamental refletir sobre as conquistas e o progresso alcançados, que possibilitaram o desenvolvimento desta tecnologia segura e inclusiva, que beneficiará a humanidade e melhorará vidas. Ao expandir o ecossistema Galaxy AI com mais funcionalidades, idiomas e variações regionais, a Samsung está promovendo intercâmbios interculturais de maneiras inéditas, concretizando sua visão de “Inteligência Artificial para Todos”.
1 Galaxy AI é a inteligência artificial da Samsung. A Samsung não faz promessas ou garantias quanto à precisão, completude ou confiabilidade das saídas fornecidas pelas funcionalidades de IA. O login na conta Samsung pode ser necessário para usar determinadas funcionalidades de IA da Samsung.
2 Tradução Simultânea requer uma conexão de rede e login na conta Samsung. A Tradução Simultânea está disponível apenas no aplicativo Samsung Phone pré-instalado. Certos idiomas podem exigir o download de pacotes de idiomas. A disponibilidade do serviço pode variar conforme o idioma. A precisão dos resultados não é garantida.
3 O Intérprete requer login na Conta Samsung. Certos idiomas podem exigir o download de pacotes de idiomas. A disponibilidade do serviço pode variar conforme o idioma. A precisão dos resultados não é garantida. A disponibilidade e os recursos suportados podem variar conforme país, região ou operadora. A disponibilidade dos idiomas suportados pode variar.
4 O recurso Notas Inteligentes requer uma conexão de rede e login na conta Samsung. Existe um limite de caracteres. A disponibilidade do serviço pode variar conforme o idioma. A precisão dos resultados não é garantida.