Carregando...

Nvidia traz compatibilidade generativa de IA para plataformas robóticas

Provavelmente não será uma surpresa para você saber que a IA generativa tem sido um tema quente no mundo da robótica. Há uma série de ideias diferentes circulando sobre as melhores maneiras de adotar as tecnologias emergentes, desde comandos de linguagem natural até design. Coloquei a questão da IA ​​generativa a Deepu Talla, vice-presidente da Nvidia e gerente geral de Embedded & Edge Computing, durante uma recente visita à sede da empresa em South Bay.

“Acho que isso fala nos resultados. Já dá para ver a melhoria da produtividade”, disse-me o executivo. “Ele pode escrever um e-mail para mim. Não está exatamente certo, mas não preciso começar do zero. Está me dando 70%. Há coisas óbvias que você já pode ver que são definitivamente uma função passo a passo melhor do que como eram antes. Resumindo algo não é perfeito. Não vou deixar que seja lido e resumido para mim. Então, já podemos ver alguns sinais de melhorias de produtividade.”

Acontece que a Nvidia estava a apenas algumas semanas de anunciar suas novidades relacionadas ao assunto. O anúncio da ROSCon vem junto com várias outras notícias relacionadas às suas diversas ofertas de robótica, incluindo a disponibilidade geral das plataformas Nvidia Isaac ROS 2.0 e Nvidia Isaac Sim 2023.

Os sistemas estão adotando a IA generativa, o que deve contribuir para acelerar sua adoção entre os roboticistas. Afinal, como observa a Nvidia, cerca de 1,2 milhão de desenvolvedores fizeram interface com as plataformas Nvidia AI e Jetson. Isso inclui alguns clientes de renome como AWS, Cisco e John Deere.

Uma das partes mais interessantes aqui é o Jetson Generative AI Lab, que dá aos desenvolvedores acesso a grandes modelos de linguagem de código aberto. A empresa escreve:

O NVIDIA Jetson Generative AI Lab fornece aos desenvolvedores acesso a ferramentas e tutoriais otimizados para implantação de LLMs de código aberto, modelos de difusão para gerar imagens impressionantes interativamente, modelos de linguagem de visão (VLMs) e transformadores de visão (ViTs) que combinam IA de visão e processamento de linguagem natural para fornecer uma compreensão abrangente da cena.

A chegada desses tipos de modelos pode ajudar os sistemas a determinar um curso de ação em circunstâncias nas quais eles ainda não foram treinados (por si só, a simulação só vai até certo ponto). Afinal de contas, embora locais como armazéns e fábricas sejam mais estruturados do que, digamos, uma autoestrada, ainda existem inúmeras variáveis ​​a enfrentar. A ideia é poder ajustar rapidamente e oferecer uma interface de linguagem mais natural para os sistemas.

“A IA generativa acelerará significativamente as implantações de IA na borda com melhor generalização, facilidade de uso e maior precisão do que era possível anteriormente”, disse Talla em comunicado vinculado às notícias de hoje. “Esta maior expansão de software de nossas estruturas Metropolis e Isaac no Jetson, combinada com o poder dos modelos de transformadores e IA generativa, atende a essa necessidade.”

As versões mais recentes das plataformas também trazem melhorias na percepção e simulação.