Meta cria novo modelo de linguagem de aprendizado de máquina

O sucesso do OpenAI vem chamando a atenção de diversas empresas, dentre elas a Meta, empresa-mãe do Facebook. Para se aproximar das ferramentas de aprendizado de máquina, Mark Zuckerberg lançou um novo gerador de linguagem AI chamado LLaMA.

A novidade não é como ChatGPT ou Bing e não é um sistema com o qual qualquer um possa conversar. Em vez disso, é uma ferramenta de pesquisa que a Meta diz que está compartilhando na esperança de “democratizar o acesso neste campo importante e em rápida mudança”. Em outras palavras: ajudar os especialistas a desvendar os problemas dos modelos de linguagem da IA, desde o viés e a toxicidade até a tendência de simplesmente inventar informações.

Para esse fim, a Meta está lançando o LLaMA (que na verdade não é um sistema único, mas um quarteto de modelos de tamanhos diferentes) sob “uma licença não comercial focada em casos de uso de pesquisa”, com acesso concedido a grupos como universidades, ONGs e laboratórios industriais.

A Meta afirma que a segunda versão menor do modelo LLaMA, LLaMA-13B, tem desempenho melhor do que o popular modelo GPT-3 da OpenAI “na maioria dos benchmarks”, enquanto o maior, LLaMA-65B é “competitivo com os melhores modelos”, como o Chinchilla70B da DeepMind e o PaLM 540B do Google. 

“Hoje estamos lançando um novo modelo de linguagem grande de IA de última geração chamado LLaMA, projetado para ajudar os pesquisadores a avançar em seu trabalho. Os LLMs se mostraram muito promissores na geração de texto, conversas, resumo de material escrito e tarefas mais complicadas, como resolver teoremas matemáticos ou prever estruturas de proteínas. A Meta está comprometida com esse modelo aberto de pesquisa e disponibilizaremos nosso novo modelo para a comunidade de pesquisa de IA”, disse o CEO Mark Zuckerberg em um post no Facebook.


Por Paulo Paolucci
Divulga mais Brasil