A NVIDIA revela o modelo de IA generativo de texto para 3D LATTE3D apelidado de "impressora 3D virtual"

O LATTE3D pode interpretar prompts de texto altamente específicos para gerar um modelo 3D (Fonte da imagem: NVIDIA)

A equipe de pesquisa de IA da NVIDIA revelou um novo modelo generativo que pode transformar comandos de texto em modelos 3D em um segundo, pronto (ou pelo menos próximo disso) para aplicações como desenvolvimento de jogos, design e robótica. Até o momento, o modelo só foi treinado para gerar "animais e objetos do cotidiano", mas outras categorias podem ser adicionadas. A velocidade quase instantânea deve transformar muitos fluxos de trabalho.

Vishal Bhardwaj (traduzido por Ninh Duy), Publicado 03/25/2024 🇺🇸 🇩🇪 ...

AI 3D Printing Nvidia Virtual Reality (VR) / Augmented Reality (AR)

Embora os modelos de IA para geração de imagens e vídeos estejam dominando as notícias há algum tempo, a NVIDIA deu um passo na direção lógica seguinte com o LATTE3D, um novo modelo de IA generativo que transforma comandos de texto em modelos 3D completos em menos de um segundo. Anunciado no evento Evento NVIDIA GTC na semana passadaa tecnologia é apresentada como sendo semelhante a uma "impressora 3D virtual", pois pode fornecer instantaneamente modelos 3D "em um formato popular usado para aplicativos de renderização padrão", prontos para serem implantados no desenvolvimento de videogames, publicidade, projetos de design ou qualquer aplicativo que exija um ambiente virtual, incluindo VR e AR.

A IA geradora de texto para 3D não é uma tecnologia nova, e o próprio documento de pesquisa da NVIDIA https://research.nvidia.com/labs/toronto-ai/LATTE3D/ coloca o LATTE3D contra vários sistemas existentes, como MVDream, 3DTopia e LGM. A grande vantagem do LATTE3D é a velocidade. Em testes comparativos, outros modelos de IA levam de 20 segundos a mais de 30 minutos para gerar um resultado, enquanto o LATTE3D produz uma renderização comparável (e geralmente de qualidade superior) em apenas 400 milissegundos.

O LATTE3D trabalha separadamente na geometria e na textura 3D para criar um modelo realista (Fonte da imagem: NVIDIA)

O resultado quase instantâneo é o que dá ao LATTE3D uma vantagem sobre outros modelos de IA (Fonte da imagem: NVIDIA)

Com mais tempo, o LATTE3D refina ainda mais o resultado (Fonte da imagem: NVIDIA)

Deve-se observar que, assim como na impressão 3D, a qualidade do resultado do LATTE3D e de outros modelos de IA melhora com o passar do tempo. A vantagem é que, diferentemente da impressão 3D, é possível optar por priorizar a velocidade em detrimento da qualidade no início e, mais tarde, decidir esperar por um resultado mais refinado, em vez de fixar as configurações desde o início.

Como acontece com qualquer outra IA generativa, o LATTE3D tem o potencial de transformar muitos fluxos de trabalho. Enquanto antes era preciso vasculhar uma biblioteca de ativos 3D ou dedicar preciosas horas de trabalho para criar um objeto simples, com a tecnologia da NVIDIA, basta digitar uma breve descrição e importar o resultado gerado para o aplicativo ou as plataformas de software.

Uma amostra do que o LATTE3D é capaz de fazer (Fonte da imagem: NVIDIA)

Até agora, a equipe de pesquisa só treinou o LATTE3D para criar modelos de objetos do cotidiano e animais, mas isso pode ser expandido para outras categorias com os conjuntos de dados certos. O modelo foi treinado usando as GPUs NVIDIA A100 Tensor Core e, na demonstração da empresa, foi executado em uma única NVIDIA RTX A6000.

Como um projeto de pesquisa, o LATTE3D ainda está em desenvolvimento e, até o momento, não se falou em lançá-lo como um produto ou serviço. Os planos futuros para o projeto incluem a expansão do recurso para "texto para 4D" ou a geração de animações em 3D.

Explore ambientes imersivos de realidade virtual e mista com o headset Meta Quest 3 e os óculos de realidade aumentada XREAL Air 2 Pro, ambos disponíveis na Amazon.

Fonte(s)

Blog da NVIDIA

Fonte(s)

Artigos Relacionados