Meta lança IA para tradução de texto e fala em cerca de 100 idiomas

Listen to this article

A Meta lançou uma inteligência artificial de tradução multimodal com suporte a cerca de 100 idiomas. A novidade é chamada SeamlessM4T (“Massively Multilingual & Multimodal Machine Translation”, ou “Máquina de Tradução Massiva, Multilingual e Multimodal”, em tradução livre), está disponível em código aberto e consegue transcrever a partir de comandos de texto ou fala.

O grande diferencial do Seamless M4T é a versatilidade para traduzir a partir de um único comando de entrada: a plataforma consegue transformar o mesmo modelo em texto ou áudio e ainda identifica diferentes idiomas usados na mesma frase. Dessa forma, o usuário não precisa criar comandos diferentes caso precise alterar o idioma ou o formato da tradução final.

Segundo a desenvolvedora, a plataforma tem as seguintes capacidades:

  • Reconhecimento automático de fala para cerca de 100 idiomas;
  • Tradução de fala para texto em cerca de 100 idiomas;
  • Tradução de fala para fala em cerca de 100 idiomas de entrada e 36 idiomas de saída;
  • Tradução de texto para texto para cerca de 100 idiomas;
  • Tradução de texto para fala em cerca de 100 idiomas de entrada e 36 idiomas de saída.

Ainda de acordo com a Meta, o Seamless M4T representa um “avanço significativo no campo de fala para fala e fala para texto ao solucionar os desafios de cobertura limitada de idiomas e dependência de sistemas separados”. A tecnologia de IA consegue criar um modelo unificado, capaz de suportar diversos idiomas e fontes diferentes.

Exemplo do SeamlessM4T em uso — ferramenta traduz para texto e áudio a partir de uma única fonte (Imagem: Captura de tela/André Magalhães/Canaltech)
Exemplo do SeamlessM4T em uso — ferramenta traduz para texto e áudio a partir de uma única fonte (Imagem: Captura de tela/André Magalhães/Canaltech)

Os testes publicados pela empresa revelam que a nova tecnologia teve performance muito positiva para os idiomas compatíveis e a função multitarefas entre reconhecimento de fala e as conversões de fala para texto, fala para fala, texto para fala e texto para texto. Além disso, experimentos sobre a precisão do reconhecimento de áudio mostraram resultados de ponta.

Meta e tradução

A dona do Facebook desenvolveu diversas ferramentas de inteligência artificial para tradução. Um exemplo é o modelo de texto para texto No Language Left Behind, lançado no ano passado com suporte a 200 idiomas e integrado à Wikipedia como um dos provedores para converter textos.

A empresa ainda lançou o Universal Speech translator, o primeiro sistema com suporte à tradução fala para fala do idioma Hokkien, usado no sudeste asiático, com poucos registros escritos.

Ferramenta sem licença comercial

A Meta disponibilizou a tecnologia do SeamlessM4T sob a licença CC BT-NC 4.0 da Creative Commons para pesquisadores e desenvolvedores, com permissões para compartilhar e adaptar o conteúdo. Além disso, também divulgou os metadados do SeamlessAlign, considerado o maior conjunto aberto de dados de tradução multimodal até o momento, com mais de 270 mil horas de falas e ajustes de texto.

A decisão segue a abordagem da Meta de disponibilizar várias tecnologias de IA em código aberto — a empresa também liberou o código do AudioCraft, IA generativa para conversão de texto em música.

 

 

 

 

 

 

João Marcelo de Assis Peres

joao.marcelo@guiadocftv.com.br

GuiadoCFTV

Avalie esta notícia, mande seus comentários e sugestões. Encontrou alguma informação incorreta ou algum erro no texto?

Importante: ‘Todos os Conteúdos divulgados decorrem de informações provenientes das fontes aqui indicadas, jamais caberá ao Guia do CFTV qualquer responsabilidade pelo seu conteúdo, veracidade e exatidão. Tudo que é divulgado é de exclusiva responsabilidade do autor e ou fonte redatora.’

Quer enviar suas notícias? Envie um e-mail para noticias@guiadocftv.com.br

Deixe um comentário

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *

Esse site utiliza o Akismet para reduzir spam. Aprenda como seus dados de comentários são processados.