Pouco mais de dois anos após seu lançamento, o Grok da xAI se tornou o principal modelo de linguagem de IA, superando o ChatGPT da OpenAI, o Gemini do Google ou o DeepSeek, bem como o Meta e o Anthropic. O Grok chegará aos carros da Tesla na próxima semana, disse Elon Musk.
De acordo com testes independentes realizados por terceiros, o recém-lançado Grok 4 agora está no topo da tabela de desempenho dos modelos públicos de IA. A força motriz por trás da melhoria de 10 vezes no raciocínio entre o Grok 3 e o Grok 4 foram os clusters de computação de IA que a xAI construiu com velocidade vertiginosa, dobrando-os para 200.000 GPUs no caminho para o milhão planejado.
A equipe da xAI entrou em contato com o pessoal por trás do exigente teste de desempenho ARC-AGI e pediu que eles executassem seus conjuntos de testes de IA, com resultados surpreendentes:
Primeiro, os fatos: O Grok 4 é agora o modelo disponível publicamente com melhor desempenho no ARC-AGI. Ele supera até mesmo as soluções criadas para fins específicos enviadas ao Kaggle. Em segundo lugar, o ARC-AGI-2 é difícil para os modelos atuais de IA. Para obter uma boa pontuação, os modelos precisam aprender uma mini habilidade a partir de uma série de exemplos de treinamento e, em seguida, demonstrar essa habilidade no momento do teste. A pontuação máxima anterior foi de aproximadamente 8% (pelo Opus 4). Abaixo de 10% há ruído. Ao obter 15,9% de quebra dessa barreira de ruído, o Grok 4 está demonstrando níveis diferentes de zero de inteligência fluida
Outro testador independente de IA, a Artificial Analysis, disse que
"executou nosso conjunto completo de benchmarks e o Grok 4 alcançou um Índice de Inteligência da Artificial Analysis de 73, à frente do OpenAI o3 em 70, do Google Gemini 2.5 Pro em 70, do Anthropic Claude 4 Opus em 64 e do DeepSeek R1 0528 em 68"
De acordo com Elon Musk na apresentação de lançamento do Grok 4, o modelo da xAI agora é mais inteligente do que todos os estudantes de pós-graduação em todas as disciplinas combinadas. Com sua típica arrogância, o CEO da Tesla afirmou que o Grok 4 será capaz de descobrir "novas tecnologias" como medicamentos ou avanços na engenharia por conta própria no próximo ano.
Ainda assim, ele admitiu que o Grok ainda será ruim no reconhecimento de imagens no próximo mês e abordou as recentes respostas supremacistas controvérsia dizendo que"quando o Grok dá muito errado, isso geralmente se deve a algo tolo que fizemos, como um prompt de sistema ruim ou dar muito peso a fontes tendenciosas"
Musk precisa bombear o Grok 4, pois sua xAI está introduzindo um nível premium pago pela primeira vez. Chamado de SuperGrok Heavy, ele custa a partir de US$ 300/mês e inclui o que está no nível SuperGrok de US$ 30/mês, que dá acesso inicial ao Grok 4, além de acesso à plataforma Grok 4 Heavy, que oferece limites de taxa mais altos e acesso antecipado a novos recursos.
O uso do Grok 3 permanecerá gratuito para o público em geral, enquanto todos os assinantes do X Premium+ terão acesso ao Grok 4 na camada SuperGrok.
Os Top 10
» Os Top 10 Portáteis Multimídia
» Os Top 10 Portáteis de Jogos
» Os Top 10 Portáteis Leves para Jogos
» Os Top 10 Portáteis Acessíveis de Escritório/Empresariais
» Os Top 10 Portáteis Premium de Escritório/Empresariais
» Os Top 10 dos Portáteis Workstation
» Os Top 10 Subportáteis
» Os Top 10 Ultrabooks
» Os Top 10 Conversíveis
» Os Top 10 Tablets
» Os Top 10 Smartphones
» A melhores Telas de Portáteis Analisadas Pela Notebookcheck
» Top 10 dos portáteis abaixo dos 500 Euros da Notebookcheck
» Top 10 dos Portáteis abaixo dos 300 Euros