Carregando...

Nova ferramenta de IA visa democratizar a geração de imagens em alta resolução

No mundo da geração de imagens de IA, ferramentas como DALL-E e Midjourney estão na vanguarda – e não apenas por causa de seu desempenho de alta resolução. A formação destes modelos requer investimentos e recursos tão substanciais que conduz inevitavelmente a serviços centralizados e ao acesso pago por utilização.

Uma nova ferramenta de IA desenvolvida pela Universidade de Surrey visa inverter esta tendência e democratizar a tecnologia, abrindo a geração de imagens de alta resolução a um público mais vasto.

Batizado de DemoFusion, o modelo permite aos usuários gerar imagens de alta qualidade sem a necessidade de assinar um serviço ou possuir um computador muito potente. Na verdade, o sistema requer apenas uma GPU RTX 3090 de nível consumidor, que pode ser encontrada em qualquer PC para jogos de gama média ou Mac M1.

A IA é essencialmente uma extensão plug-and-play do modelo de código aberto Stable Diffusion XL (SDXL), que gera imagens com resolução de 1024×1024. DemoFusion permite aumento de resolução de 4x, 16x ou até mais — com algumas linhas simples de código e sem qualquer treinamento adicional. A única compensação de acordo com a equipe é “um pouco mais de paciência”. Tentamos na TNW e demora cerca de seis minutos.

Gerador de imagem SDXL vs DemoFusion AI
Crédito: Universidade de Surrey
Do lado esquerdo: o resultado por SDXL. Do lado direito, o resultado da DemoFusion. Crédito: Universidade de Surrey

Para alcançar esses resultados de alta resolução, os cientistas primeiro geraram imagens de baixa resolução e depois as aprimoraram usando um processo chamado upscaling progressivo. Isso melhora os detalhes e a resolução do SDXL, trabalhando em imagens em patches.

Obtenha seu ingresso AGORA para a Conferência TNW – Traga seus colegas para obter as melhores ofertas

Liberte a inovação, conecte-se com milhares de amantes da tecnologia e molde o futuro de 20 a 21 de junho de 2024.

“Pela primeira vez, nossa técnica exclusiva permite que os usuários aprimorem suas imagens geradas por IA sem a necessidade de grande poder computacional ou qualquer retreinamento do modelo”, disse o professor Yi-Zhe Song.

“A arte e as imagens digitais são um meio poderoso ao qual todos deveriam ter acesso – não apenas um punhado de empresas ricas. É por isso que disponibilizamos publicamente o DemoFusion. Acreditamos que pode enriquecer nossas vidas e todos deveriam poder usá-lo.”

A nova técnica é disponível on-line no jornal “DemoFusion: Democratizando a geração de imagens de alta resolução sem $$$.”

Ainda não se sabe se o DemoFusion ganhará força suficiente para competir com gigantes como o DALL-E da OpenAI, mas sua criação é um passo importante para abrir o potencial de geração de imagens da IA ​​ao público e à comunidade tecnológica em geral.