Grandes modelos de linguagem, como GPT e Llama, estão no centro dos avanços mais recentes da inteligência artificial. No entanto, compreender como esses sistemas tomam decisões e garantir sua confiabilidade continua sendo um desafio. Parte desse problema reside no alto custo computacional necessário para analisar, testar e ajustar o comportamento desses modelos em larga escala. Pesquisadores da Universidade de Manchester, na Inglaterra, afirmam ter dado um passo importante para superar essa limitação.
Liderada pelos cientistas brasileiros Danilo Carvalho e André Freitas, a equipe desenvolveu duas novas estruturas de software, denominadas LangVAE e LangSpace, que reduzem significativamente o consumo de hardware e energia necessários para estudar e controlar os grandes modelos de linguagem. Os resultados foram divulgados em um artigo publicado no repositório científico arXiv. A nova abordagem cria representações compactadas da linguagem gerada pelos próprios modelos de IA.
Em vez de modificar diretamente os grandes modelos de linguagem, os pesquisadores tratam seus padrões internos de linguagem como estruturas geométricas, utilizando pontos, distâncias e formas em um espaço matemático que pode ser medido, comparado e ajustado. Essa metodologia permite interpretar e influenciar o comportamento dos modelos com técnicas muito mais eficientes do que as atualmente utilizadas. Os autores afirmam que o método reduz o uso de recursos computacionais em mais de 90% em comparação com abordagens tradicionais de análise e controle.
O ganho de eficiência pode ampliar significativamente o acesso à pesquisa em inteligência artificial explicável. Com custos menores, mais universidades, startups e equipes industriais poderão investigar como esses sistemas funcionam e como torná-los mais previsíveis e seguros. Danilo Carvalho destaca que a técnica reduz de forma significativa as barreiras de entrada para o desenvolvimento e a experimentação de modelos de IA explicáveis e controláveis. Além disso, essa inovação pode diminuir o impacto ambiental da pesquisa em inteligência artificial e acelerar a utilização de modelos confiáveis em aplicações críticas, como na área da saúde.
Descubra mais sobre Euclides Diário
Assine para receber nossas notícias mais recentes por e-mail.






