A Anthropic lançou o Claude Sonnet 4.5, sua mais recente IA com desempenho de codificação aprimorado, projetada para ajudar melhor os desenvolvedores de software a codificar aplicativos.
O Sonnet 4.5 apresenta bons benchmarks em vários dos principais benchmarks de codificação de IA, incluindo SWE-bench e Terminal-Bench. A IA tem uma capacidade aprimorada de usar ferramentas de computador para realizar tarefas de forma autônoma, como visto em seu principal resultado de benchmark OSWorld permitindo que ela crie um clone funcional do site claude.ai por conta própria funcionando por conta própria.
As habilidades aprimoradas da IA permitem que ela responda a solicitações nos campos financeiro, jurídico, médico e STEM melhor do que os modelos anteriores da Anthropic, mas o Claude Sonnet 4.5 só consegue obter uma pontuação entre C e D ao responder a esses tipos de solicitações. Ele também tem um desempenho ruim em tarefas de raciocínio visual durante o teste de benchmark MMMU em comparação com outros modelos de IA.
Os hackers vão querer ficar com outros modelos de IA para fazer coisas ruins, como realizar ataques de injeção de prompt, porque o Sonnet 4.5 tem a menor taxa de sucesso entre todos os modelos de IA testados.
Os usuários que gostam de um bate-papo picante com IA acharão o último Claude decepcionante devido à sua taxa reduzida de falar espontaneamente sobre espiritualidade. O modelo também expressa positividade sobre si mesmo com menos frequência, o que torna a conversa mais monótona.
Os leitores interessados em conversar com o Claude Sonnet 4.5 podem baixar o aplicativo para smartphones aqui ou acessar a IA no site da Anthropic. Aqueles que realmente colocam a IA para trabalhar podem usar uma Plaud Note para colocar Claude para trabalhar resumindo e transcrevendo reuniões de stand-up.
Fonte(s)
Os Top 10
» Os Top 10 Portáteis Multimídia
» Os Top 10 Portáteis de Jogos
» Os Top 10 Portáteis Leves para Jogos
» Os Top 10 Portáteis Acessíveis de Escritório/Empresariais
» Os Top 10 Portáteis Premium de Escritório/Empresariais
» Os Top 10 dos Portáteis Workstation
» Os Top 10 Subportáteis
» Os Top 10 Ultrabooks
» Os Top 10 Conversíveis
» Os Top 10 Tablets
» Os Top 10 Smartphones
» A melhores Telas de Portáteis Analisadas Pela Notebookcheck
» Top 10 dos portáteis abaixo dos 500 Euros da Notebookcheck
» Top 10 dos Portáteis abaixo dos 300 Euros