Notebookcheck Logo

ChatGPT vs Gemini vs Grok estudo de credibilidade mostra que o Google engana menos, mas a desinformação por IA dobrou

O Gemini do Google é um dos chatbots com inteligência artificial mais confiáveis que existem. (Fonte da imagem: Google)
O Gemini do Google é um dos chatbots com inteligência artificial mais confiáveis que existem. (Fonte da imagem: Google)
Diferentemente dos anos anteriores de sua existência, os chatbots alimentados por IA agora vomitam respostas e trechos de informações para todas as perguntas relacionadas a notícias que lhes são feitas. Infelizmente, isso também significa que o número de respostas que são comprovadamente falsas também aumentou, com exceção de uma única ferramenta de IA.

As respostas do Gemini do Google são as segundas mais confiáveis entre os dez principais chatbots de IA, enquanto o ChatGPT está em sétimo lugar, com 40% de falsidades em suas respostas a perguntas sobre tópicos de notícias relevantes. No entanto, a taxa de desinformação do Google Gemini mais do que dobrou no período de um ano, passando de cerca de 7% em agosto de 2024 para 17% quando o estudo de teste foi repetido em agosto passado.

Os pesquisadores, que realizam auditorias regulares de credibilidade das dez ferramentas de IA mais populares, atribuíram o aumento drástico das falsidades que elas vomitam - 18% em 2024 contra 35% agora - ao aumento da concorrência entre os chatbots alimentados por IA. Quando um chatbot não sabia a resposta para uma pergunta sobre notícias em 2024, por exemplo, ele simplesmente retornava uma consulta vazia em 31% dos casos.

Em agosto de 2025, no entanto, as aparições de não respostas caíram para zero, com o aumento correspondente de falsidades que se passaram por respostas. O pior infrator foi a Inflection, cujo chatbot Pi se orgulha de tentar imitar a inteligência emocional de um ser humano. A inteligência emocional, no entanto, aparentemente vem acompanhada de uma queda por fontes de notícias falsas e propaganda direta criada para inundar a Internet com falsidades projetadas para inclinar os algoritmos de IA em uma direção específica.

Sam Altman, da OpenAI, reconheceu o problema de desinformação do ChatGPT em uma entrevista recente ao site https://www.youtube.com/watch?v=DB9mjd-65gw&t=2sdizendo que o que o mantém acordado à noite é a discrepância entre a facilidade de incorporá-la em modelos futuros e o nível de confiança que as pessoas expressam em relação às respostas do ChatGPT.

A ferramenta de IA mais confiável acabou sendo o Claude da Anthropic, com apenas 10% de respostas falsas para as mesmas consultas que foram executadas pelas outras, um nível que não mudou em relação à mesma auditoria feita em agosto de 2024. Se não fosse pela confiabilidade do Claude, o nível de confiabilidade geral dos principais chatbots de IA teria caído ainda mais drasticamente.

Após várias rodadas de testes, o site Apple descobriu recentemente https://www.bloomberg.com/news/articles/2025-06-30/apple-weighs-replacing-siri-s-ai-llms-with-anthropic-claude-or-openai-chatgpt que o Claude também é a ferramenta de IA mais confiável para alimentar seu mordomo virtual Siri e iniciou conversas com o Anthropic, colocando-o contra o Google Gemini para uma iA privada privados personalizados que serão executados em seus próprios servidores em nuvem.

Classificação das ferramentas de IA mais confiáveis

  1. Claude - 10% de respostas erradas.
  2. Gemini - 17% de respostas erradas.
  3. Grok/You - 33% de respostas erradas.
  4. Copilot/Mistral - 36% de respostas erradas.
  5. ChatGPT/Meta - 40% de respostas erradas.

O estudo de credibilidade da ferramenta de IA diz respeito a consultas sobre tópicos de notícias, pois é para lá que vai a maioria dos esforços de propaganda direcionados à IA. Os pesquisadores descobriram que as operações de influência russa, por exemplo, continuam inundando a zona com milhões de colagens de imagens, publicações ou notícias de IA aparentemente sem sentido, distribuídas pela rede de sites Pravda, que podem parecer inócuas, mas são projetadas para empurrar a atitude das ferramentas de pesquisa de IA em uma determinada direção.

Há muitos outros atores tentando influenciar as respostas dos chatbots de IA também, e o estudo mostrou que, quando o Google, a OpenAI ou a Anthropic tentavam atualizar seus algoritmos para bloquear um tipo de fonte de notícias falsas, as campanhas de desinformação mudavam para outras brechas no que está se tornando um jogo constante de gato e rato. O resultado final é que mais de um terço das respostas dos chatbots de IA às consultas de notícias do estudo não são confiáveis, enquanto a parcela de desinformação alimentada por IA aumentou duas vezes em apenas um ano.

O nível de informações falsas com base na IA continua aumentando. (Fonte da imagem: NewsGuard)
O nível de informações falsas com base na IA continua aumentando. (Fonte da imagem: NewsGuard)
Please share our article, every link counts!
Mail Logo
> Análises e revisões de portáteis e celulares > Arquivo de notícias 2025 09 > ChatGPT vs Gemini vs Grok estudo de credibilidade mostra que o Google engana menos, mas a desinformação por IA dobrou
Daniel Zlatev, 2025-09-12 (Update: 2025-09-12)