D-ID, a startup com sede em Tel Aviv mais conhecida como a tecnologia por trás dos vídeos virais de fotos animadas de família, está trazendo sua tecnologia de vídeo de IA para um novo aplicativo móvel, lançado hoje. Originalmente disponível como uma plataforma web, os D-IDs Estúdio de Realidade Criativa permite que os usuários carreguem uma imagem estática e um script e depois transformem isso em um vídeo gerado por IA. A tecnologia pode ser usada para criar representações digitais de si mesmos, de figuras históricas, de personagens fictícios, de apresentadores ou de embaixadores de marcas.
Nos primeiros casos de uso, a empresa tinha como alvo treinamento e educação corporativos, comunicação interna e externa de empresas e marketing e vendas de produtos, relatou o TechCrunch anteriormente.
Agora disponível no celular, os usuários farão o download do aplicativo D-ID no Loja de aplicativos ou Google Play e depois crie uma conta ou faça login, se já estiver registrado. Na tela de seleção, você pode escolher uma “pessoa digital” pré-fabricada fornecida pelo D-ID ou fazer upload de uma imagem da biblioteca de fotos do seu telefone. Em seguida, você inserirá o texto que deseja que a pessoa digital diga, escolhendo entre 119 idiomas, além de escolher entre opções de voz masculina e feminina. Você também pode escolher o tom do discurso – como alegre, animado, amigável, esperançoso, noticiário, triste, gritante, aterrorizado, hostil, sussurrante e outros.
Créditos da imagem: FEZ
Para funcionar, a D-ID está aproveitando uma combinação de tecnologias de IA proprietárias e de código aberto para alimentar suas plataformas, diz Gil Perry, CEO da D-ID.
“Em sua essência está um modelo fundamental capaz de gerar quadros de vídeo com base na entrada de áudio. Todos os seus produtos são alimentados por sua API robusta com a capacidade de renderizar vídeo a 100 FPS, líder do setor, quatro vezes mais rápido do que a renderização em tempo real”, diz ele.
“O público principal são os entusiastas da IA, mas é relevante para quem deseja postar vídeos com pessoas digitais, sejam versões de si mesmos ou de qualquer pessoa que possam imaginar – personagens históricos, personagens fictícios, ancestrais, etc.”, diz Perry. “O aplicativo permite a geração de vídeos em qualquer lugar, reduzindo o custo de produção em escala, e permite flexibilidade para produzir vídeos em qualquer lugar.”
Créditos da imagem: FEZ
Os vídeos podem ter até 10 minutos de duração e estão sujeitos às mesmas moderação políticas como a versão web – ou seja, a empresa está trabalhando para garantir que a tecnologia não seja usada para deepfakes que propagam desinformação e campanhas de desinformação. A empresa tem também se comprometeu a respeitar os direitos autorais, aderir aos regulamentos de IA e não licenciar conscientemente sua tecnologia ao que chama de “áreas contenciosas”, incluindo partidos políticos, editores de pornografia, organizações terroristas e armas ou fabricantes de armas.
Antes do lançamento móvel, a versão desktop do Creative Reality Studio recebeu 60.000 novas inscrições por dia, com mais de 150 milhões de vídeos já feitos usando a plataforma, disse Perry. Além disso, a API do serviço conta com mais de 200 mil usuários.
Com sua chegada aos dispositivos móveis, o D-ID é capaz de alcançar um mercado mais amplo, incluindo usuários que priorizam os dispositivos móveis ou apenas os dispositivos móveis. Isso inclui tanto usuários existentes que estão interessados em usar uma versão mais enxuta do estúdio para dispositivos móveis, quanto novos usuários do público em geral, incluindo consumidores.
O novo serviço móvel será baseado em assinatura, com planos a partir de US$ 5,99 por mês. Os usuários já assinantes da versão desktop podem manter seus planos existentes. Um teste gratuito de 14 dias também está disponível.
Embora sediada em Tel Aviv, a D-ID tem funcionários em outros mercados ao redor do trabalho, o que lhe permite continuar as operações durante a guerra Israel-Hamas.
“Nossas equipes em Israel e em todo o mundo estão trabalhando para garantir o mais alto nível de suporte e serviço”, afirma Perry. “Deve-se notar que a nossa equipa na Ucrânia está a operar com diligência extra, em grande solidariedade com a situação em Israel”, acrescenta.
Créditos da imagem: FEZ
A D-ID arrecadou US$ 25 milhões na Série B no ano passado, após o lançamento de seu projeto Deep Nostalgia e seu spin-off, LiveStory. Esses dois projetos envolveram a animação de fotos históricas de familiares, sendo que o último adicionou áudio. Os vídeos se tornaram virais à medida que as pessoas usavam a tecnologia para criar fotos faladas de entes queridos ou ancestrais há muito perdidos. Desde então, a D-ID também tem trabalhado para criar uma interface fotorrealista para ChatGPT, bem como para seu software Creative Reality Studio, como parte de seus esforços mais amplos de desenvolvimento de IA.