O Google DeepMind está lançando o Gemini 2.5 Flash Image, também chamado de "nano-banana", para o aplicativo Gemini e para desenvolvedores por meio da API Gemini, Google AI Studio e Vertex AI. Essa atualização aborda uma reclamação frequente das ferramentas de imagem de IA: pequenas edições que acabam alterando a imagem inteira. O Google descreve esse lançamento como uma melhoria na qualidade e no controle em comparação com as versões anteriores.
O principal recurso é a consistência dos personagens. O senhor pode manter uma pessoa, um animal de estimação ou um produto com a mesma aparência em diferentes cenas, mesmo que mude as roupas, os penteados, os períodos de tempo ou as configurações. O modelo também pode combinar várias imagens em uma, fazer alterações específicas usando instruções em linguagem natural e usar o conhecimento de mundo do Gemini durante a criação e a edição de imagens.
O senhor pode usar essa ferramenta para colocar o mesmo personagem em diferentes cenários, mostrar um produto de vários ângulos ou manter as imagens da marca consistentes em todas as campanhas. A edição multivariada permite que o senhor continue fazendo alterações, como adicionar móveis e decoração a uma sala para testar ideias. O senhor também pode misturar designs, adicionar um padrão de uma imagem a um objeto em outra ou misturar uma pessoa e um animal de estimação em uma nova cena.
O preço é transparente para os desenvolvedores: O Gemini 2.5 Flash Image custa US$ 30 por um milhão de tokens de saída. Cada imagem conta como 1.290 tokens de saída, o que equivale a aproximadamente US$ 0,039 por imagem. Outras modalidades de entrada e saída seguem o preço padrão do Gemini 2.5 Flash.
Por segurança, as imagens geradas incluem uma marca de IA visível e uma marca d'água digital SynthID invisível. O Google diz que o SynthID ainda pode ser detectado após edições comuns, o que deve ajudar a verificar as origens das imagens, já que a mídia sintética se torna mais difícil de reconhecer.
O Google afirma que as primeiras visualizações classificam esse modelo como um dos principais modelos de edição de imagens. A edição integrada do aplicativo Gemini agora mantém detalhes sutis em suas fotos. O usuário pode fazer upload de uma foto, solicitar alterações, combinar imagens com seu animal de estimação, trocar fundos para experimentar um novo papel de parede ou se colocar em diferentes cenas. O senhor também pode usar a imagem editada no Gemini para criar um vídeo curto.
Fonte(s)
Google (em inglês)
Os Top 10
» Os Top 10 Portáteis Multimídia
» Os Top 10 Portáteis de Jogos
» Os Top 10 Portáteis Leves para Jogos
» Os Top 10 Portáteis Acessíveis de Escritório/Empresariais
» Os Top 10 Portáteis Premium de Escritório/Empresariais
» Os Top 10 dos Portáteis Workstation
» Os Top 10 Subportáteis
» Os Top 10 Ultrabooks
» Os Top 10 Conversíveis
» Os Top 10 Tablets
» Os Top 10 Smartphones
» A melhores Telas de Portáteis Analisadas Pela Notebookcheck
» Top 10 dos portáteis abaixo dos 500 Euros da Notebookcheck
» Top 10 dos Portáteis abaixo dos 300 Euros