Notebookcheck Logo

Pesquisadores do Google revelam o Genie - uma IA que sabe como criar cenas de minijogos a partir de imagens de exemplo

O Google Genie AI pode criar uma cena de minijogo jogável a partir de uma única imagem de entrada. (Fonte: Imagem gerada por IA Dall-E 3)
O Google Genie AI pode criar uma cena de minijogo jogável a partir de uma única imagem de entrada. (Fonte: Imagem gerada por IA Dall-E 3)
Os pesquisadores do Google DeepMind revelaram o Genie, a primeira IA de ambiente interativo generativo do mundo. Essa IA pode examinar uma imagem de um exemplo de jogo de plataforma 2D e, em seguida, criar uma cena de minijogo jogável. A IA não precisa de informações adicionais para fazer isso.

Pesquisadores do Google DeepMind revelaram o Genie, a primeira IA de ambiente interativo generativo do mundo. A IA pode criar uma cena jogável depois de olhar para uma imagem de um jogo de exemplo. Isso abre a porta para que os gamers criem jogos jogáveis sem programação.

O Genie é treinado em jogabilidade de plataforma 2D, observando 30.000 horas de vídeos (6,8 milhões de clipes de 16 segundos). A IA simplifica o que vê ao representar as imagens de vídeo e as ações que vê como conjuntos de números, da mesma forma que um ser humano usa palavras para descrever uma cena de jogo.

Uma vez treinado, um único exemplo de uma cena de jogo é tudo o que o Genie precisa para criar uma mini-cena jogável. Nos bastidores, a IA pode ampliar a imagem inicial usando métodos sofisticados para gerar partes ausentes de uma imagem, de modo que o Genie possa desenhar novas partes do mundo do jogo à medida que o jogador avança. Ele faz isso consultando os milhões de clipes que viu ao dar ao personagem ações jogáveis, como correr ou pular.

É importante ressaltar que o Genie aprende as ações observando a jogabilidade, e não por meio da indicação de humanos. Assim, quando há uma ponte com um vão, a IA sabe, com base no que viu, que um personagem provavelmente precisará pular o vão e o faz quando o jogador humano pressiona o botão para cima em um controle.

Tudo isso requer um enorme poder de computação para treinamento (milhares de teraflops ao longo de semanas em computadores com centenas de chips) e jogabilidade, que só pode ser feita a um superlento 1 quadro por segundo.

Para os mais técnicos, os quadros de vídeo e as ações latentes inferidas são tokenizados utilizando o VQ-VAE de van den Oord. As ações latentes especificadas pelo usuário, juntamente com os quadros de vídeo tokenizados, são inseridas no modelo dinâmico utilizando o transformador MaskGIT de Chang de Chang para gerar tokens de quadros iterativos que são usados para gerar vídeos de saída utilizando o MaskViT de Gupta. Os transformadores ST adotados de Xu são usados em todo o processo para incluir a atenção temporal, além da espacial, para melhorar as previsões e reduzir os requisitos de memória.

Portanto, até que chegue o dia em que os computadores sejam potentes o suficiente para criar jogos de plataforma 2D completamente por conta própria, aproveite os jogos de plataforma clássicos com um console de jogos portátil(como este da Amazon).

O Google Genie pode criar cenas reproduzíveis a partir de imagens ou desenhos de exemplo. Consulte o site do Genie para obter exemplos adicionais. (Fonte: Google DeepMind)
O Google Genie pode criar cenas reproduzíveis a partir de imagens ou desenhos de exemplo. Consulte o site do Genie para obter exemplos adicionais. (Fonte: Google DeepMind)
Please share our article, every link counts!
> Análises e revisões de portáteis e celulares > Arquivo de notícias 2024 03 > Pesquisadores do Google revelam o Genie - uma IA que sabe como criar cenas de minijogos a partir de imagens de exemplo
David Chien, 2024-03- 6 (Update: 2024-03- 6)