Notebookcheck Logo

O Google apresenta o Gemini 2.5 Flash Image "nano-banana" com maior consistência de edição

O modelo "nano-banana" do Google DeepMind oferece edições precisas de imagens (Fonte da imagem: Gemini)
O modelo "nano-banana" do Google DeepMind oferece edições precisas de imagens (Fonte da imagem: Gemini)
O novo Gemini 2.5 Flash Image do Google DeepMind, apelidado de "nano-banana", promete um controle mais refinado sobre a edição de imagens por IA. Ele mantém a consistência dos caracteres em todas as cenas, permite edições com várias voltas e mescla imagens com instruções em linguagem natural, além de adicionar marcas d'água visíveis e invisíveis para maior segurança.

O Google DeepMind está lançando o Gemini 2.5 Flash Image, também chamado de "nano-banana", para o aplicativo Gemini e para desenvolvedores por meio da API Gemini, Google AI Studio e Vertex AI. Essa atualização aborda uma reclamação frequente das ferramentas de imagem de IA: pequenas edições que acabam alterando a imagem inteira. O Google descreve esse lançamento como uma melhoria na qualidade e no controle em comparação com as versões anteriores.

O principal recurso é a consistência dos personagens. O senhor pode manter uma pessoa, um animal de estimação ou um produto com a mesma aparência em diferentes cenas, mesmo que mude as roupas, os penteados, os períodos de tempo ou as configurações. O modelo também pode combinar várias imagens em uma, fazer alterações específicas usando instruções em linguagem natural e usar o conhecimento de mundo do Gemini durante a criação e a edição de imagens.

O senhor pode usar essa ferramenta para colocar o mesmo personagem em diferentes cenários, mostrar um produto de vários ângulos ou manter as imagens da marca consistentes em todas as campanhas. A edição multivariada permite que o senhor continue fazendo alterações, como adicionar móveis e decoração a uma sala para testar ideias. O senhor também pode misturar designs, adicionar um padrão de uma imagem a um objeto em outra ou misturar uma pessoa e um animal de estimação em uma nova cena.

O preço é transparente para os desenvolvedores: O Gemini 2.5 Flash Image custa US$ 30 por um milhão de tokens de saída. Cada imagem conta como 1.290 tokens de saída, o que equivale a aproximadamente US$ 0,039 por imagem. Outras modalidades de entrada e saída seguem o preço padrão do Gemini 2.5 Flash.

Por segurança, as imagens geradas incluem uma marca de IA visível e uma marca d'água digital SynthID invisível. O Google diz que o SynthID ainda pode ser detectado após edições comuns, o que deve ajudar a verificar as origens das imagens, já que a mídia sintética se torna mais difícil de reconhecer.

O Google afirma que as primeiras visualizações classificam esse modelo como um dos principais modelos de edição de imagens. A edição integrada do aplicativo Gemini agora mantém detalhes sutis em suas fotos. O usuário pode fazer upload de uma foto, solicitar alterações, combinar imagens com seu animal de estimação, trocar fundos para experimentar um novo papel de parede ou se colocar em diferentes cenas. O senhor também pode usar a imagem editada no Gemini para criar um vídeo curto.

Fonte(s)

Google (em inglês)

Please share our article, every link counts!
Mail Logo
> Análises e revisões de portáteis e celulares > Arquivo de notícias 2025 08 > O Google apresenta o Gemini 2.5 Flash Image "nano-banana" com maior consistência de edição
Nathan Ali, 2025-08-28 (Update: 2025-08-28)