Carregando...

Silo AI lança posto de controle em missão para democratizar LLMs

Um ano se passou desde que a OpenAI lançou o ChatGPT no mundo e popularizou termos como modelo fundamental, LLM e GenAI. No entanto, os benefícios prometidos do trabalho generativo IA ainda é muito mais provável que a tecnologia seja derivada por aqueles que falam inglês, em vez de outras línguas.

Existem mais de 7.000 idiomas no mundo. No entanto, a maioria das grandes linguagens modelos (LLMs) funcionam muito mais eficazmente em inglês. Naturalmente, isto ameaça amplificar os preconceitos linguísticos no que diz respeito ao acesso ao conhecimento, à investigação, à inovação — e à vantagem competitiva para as empresas.

Em novembro, a Silo AI da Finlândia lançou seu LLM europeu aberto multilíngue Poro 34B, desenvolvido em colaboração com a Universidade de Turku. Não é pouca coisa, considerando que o desenvolvimento do modelo só começou em setembro de 2023.

Junto com isso, a empresa revelou um programa de checkpoint de pesquisa que irá liberar checkpoints conforme o modelo for concluído (os três primeiros pontos foram anunciados com o modelo no mês passado).

O

Os últimos rumores do cenário tecnológico da UE, uma história do nosso sábio e velho fundador Boris e alguma arte de IA questionável. É grátis, toda semana, na sua caixa de entrada. Inscreva-se agora!

Agora, a empresa, por meio de sua filial SiloGen, treinou mais de 50% do modelo e acaba de publicar os próximos dois checkpoints do programa. Com esses cinco pontos de verificação agora concluídos, o Poro 34B mostrou o melhor desempenho da categoria para idiomas com poucos recursos, como o finlandês (em comparação com Llama, Mistral, FinGPT, etc.) — sem comprometer o desempenho em inglês.

O pesquisador Sampo Pyysalo, do TurkuNLP, diz que espera ter treinado totalmente o modelo nas próximas semanas. Como próximo passo, o modelo adicionará suporte para outros idiomas nórdicos, incluindo sueco, norueguês, dinamarquês e islandês.

“É imperativo para a soberania digital da Europa ter acesso a modelos linguísticos alinhados com os valores, a cultura e as línguas europeias. Estamos orgulhosos de ver que o Poro apresenta o melhor desempenho da categoria em um idioma de poucos recursos como o finlandês”, disse o cofundador e CEO da Silo AI, Peter Sarlin, à TNW. “Em linha com a intenção de abranger todas as línguas europeias, é um passo natural começar com uma extensão às línguas nórdicas.”

Além disso, a SiloGen iniciou o treinamento do Poro 2. Por meio de uma parceria com a organização sem fins lucrativos LAION (Rede Aberta de Inteligência Artificial em Grande Escala), agregará multimodalidade ao modelo.

“Também é natural ampliar o Poro com visão”, acrescentou Sarlin. “Assim como os dados textuais, vemos um potencial ainda maior para a IA generativa consolidar grandes quantidades de dados de diferentes modalidades.”

LAION afirma estar “apaixonado por avançar no campo do aprendizado de máquina para um bem maior”. De acordo com as intenções da Silo AI de construir seu modelo GenAI e a missão geral da LAION de aumentar o acesso a modelos e conjuntos de dados de ML em grande escala, o Poro 2 estará disponível gratuitamente sob a licença Apache 2.0.

O Silo AI, que se autodenomina “o maior laboratório privado de IA da Europa”, foi lançado há mais de cinco anos com a ideia de que a Europa precisava de um carro-chefe da IA. A empresa está sediada em Helsinque, Finlândia, e desenvolve soluções e produtos baseados em IA para habilitar dispositivos inteligentes, veículos autônomos, indústria 4.0 e cidades inteligentes. Atualmente, a Silo AI conta com mais de 300 funcionários e também possui escritórios na Suécia, Dinamarca, Holanda e Canadá.