Os novos modelos de código aberto da OpenAI podem ser executados em seu PC

Ambos os modelos podem ser baixados gratuitamente e executados localmente em PCs e laptops. (Fonte da imagem: OpenAI)

Pela primeira vez em seis anos, a OpenAI lançou dois novos modelos com pesos abertos que podem ser baixados, gratuitamente, e executados localmente em seu PC ou laptop. O último modelo de código aberto da empresa foi o GPT-2 em 2019.

Rohith Bhaskar (traduzido por Ninh Duy), Publicado 08/06/2025 🇺🇸 🇪🇸 ...

A OpenAI anunciou o lançamento do gpt-oss-120b e do gpt-oss-20b, dois modelos de peso aberto que são gratuitos para download e podem ser executados localmente em seu sistema. É o primeiro lançamento de código aberto da empresa desde o lançamento do GPT-2 em 2019.

O Gpt-oss-120b é o modelo de 117 bilhões de parâmetros que requer 80 GB de VRAM para ser executado. O menor gpt-oss-20b, o modelo de 21 bilhões de parâmetros, pode caber em uma única GPU com 16 GB de VRAM. Ambos os modelos estão disponíveis sob uma licença Apache 2.0 flexível.

A OpenAI diz que o "lançamento é um passo significativo em seu compromisso com o ecossistema de código aberto, em linha com sua missão declarada de tornar os benefícios da IA amplamente acessíveis" A empresa quer que eles sirvam como uma ferramenta de baixo custo para desenvolvedores, pesquisadores e empresas executarem e personalizarem com eficiência.

Qual é o desempenho deles?

O gpt-oss-120b marcou 2.622 pontos no teste de codificação do Codeforces com ferramentas, com desempenho quase igual ao do o3 e do o4-mini da empresa, e superou confortavelmente o o3-mini em ambos os testes, marcando 2.643 pontos sem ferramentas.

O gpt-oss-20b obteve 2516 pontos com ferramentas, com desempenho equivalente ao do com o3 e o4-mini, e 2230 sem ferramentas, superando por pouco o o3-mini. A OpenAI diz que o 120b se sai ainda melhor em consultas relacionadas à saúde e matemática do que o o4-mini, enquanto o 20b supera o o3-mini.

Ambos os modelos têm desempenho competitivo com o o3 e o o4-mini. (Fonte da imagem: OpenAI)

A OpenAI afirma que tanto o 120b quanto o 20b tendem a alucinar muito mais do que modelos de raciocínio como o3 e o4-mini. Em testes, eles descobriram que ambos os modelos de peso aberto alucinaram de 49% a 53% em seus benchmarks internos que testam os modelos em seu conhecimento sobre as pessoas.

No teste Humanity's Last Exam, ambos os modelos apresentaram precisão competitiva em relação ao o3 e ao o4-mini. (Fonte da imagem: OpenAI)

Ambos os modelos podem ser baixados do espaço oficial do Hugging Face e vêm nativamente quantizados em MXFP4 para maior eficiência. Eles também podem ser implantados livremente em plataformas como Microsoft Azure, Hugging Face, vLLM, Ollama e llama.cpp, LM Studio, AWS, Fireworks, Together AI e muito mais.

A OpenAI espera que esses modelos "reduzam as barreiras para mercados emergentes, setores com recursos limitados e organizações menores que podem não ter o orçamento ou a flexibilidade para adotar modelos proprietários"

Quanto ao motivo pelo qual eles abriram um novo modelo seis anos após o último, a empresa diz que quer "tornar a IA amplamente acessível e benéfica para todos"