Notebookcheck Logo

Nova ferramenta de IA de código aberto permite a geração de vídeos muito mais longos e consistentes

Uma imagem gerada por IA de uma girafa
ⓘ Gemini
Uma imagem gerada por IA de uma girafa
Pesquisadores do Instituto Federal Suíço de Tecnologia de Lausanne (École polytechnique fédérale de Lausanne) desenvolveram um novo sistema chamado Stable Video Infinity (SVI) para lidar com a deriva nos modelos de geração de vídeo.

Se o senhor já usou modelos de geração de vídeo, há uma coisa que é consistente em todos eles: eles são limitados a clipes curtos, geralmente entre 5 e 20 segundos. O motivo dessa limitação se deve a algo chamado "drift" O desvio faz com que as cenas e os personagens percam cada vez mais suas características quadro a quadro, resultando em um resultado incoerente ao longo do tempo.

Agora, para resolver esse problema, os pesquisadores do laboratório Visual Intelligence for Transportation (VITA) da EPFL desenvolveram um novo método de treinamento chamado "retreinamento por reciclagem de erros" Em vez de descartar as falhas e deformidades que ocorrem naturalmente durante a geração, essa abordagem as alimenta intencionalmente de volta ao modelo.

O Prof. Alexandre Alahi compara o processo ao "treinamento de um piloto em um clima turbulento em vez de em um céu azul claro" Ao aprender com seus próprios erros, a IA se torna robusta o suficiente para se estabilizar quando os erros inevitavelmente aparecem, em vez de entrar em uma espiral de aleatoriedade.

Esse método alimenta o novo sistema Stable Video Infinity (SVI). Ao contrário dos modelos atuais, que geralmente se desfazem após 30 segundos, o SVI pode gerar vídeos coerentes e de alta qualidade com duração de vários minutos ou mais. O sistema já está causando impacto na comunidade tecnológica; seu código-fonte aberto no GitHub obteve mais de 2.000 estrelas, e a pesquisa foi aceita para apresentação na Conferência Internacional de 2026 sobre Representações de Aprendizagem (ICLR).

A equipe também está lançando o LayerSync, um método complementar que permite que a IA corrija sua lógica interna na geração de vídeo, imagem e som. Juntas, essas ferramentas prometem projetar sistemas autônomos melhores e desbloquear o potencial de uma mídia geradora verdadeiramente longa.

Fonte(s)

Please share our article, every link counts!
Mail Logo
> Análises e revisões de portáteis e celulares > Notícias > Arquivo de notícias 2026 02 > Nova ferramenta de IA de código aberto permite a geração de vídeos muito mais longos e consistentes
Chibuike Okpara, 2026-02-10 (Update: 2026-02-10)