InícioJogosNVIDIA estabele uma parceria com a OpenAI para potenciar modelos de IA...

NVIDIA estabele uma parceria com a OpenAI para potenciar modelos de IA mais rápidos e eficientes

Modelos gpt-oss permitem executar IA avançada localmente em PCs e workstations com GPUs RTX, abrindo uma nova era de inteligência artificial pessoal

A NVIDIA estabeleceu uma parceria com a OpenAI para disponibilizar uma nova geração de modelos de inteligência artificial abertos diretamente ao público. A grande novidade é que uma IA de última geração, anteriormente restrita a data centers na Cloud, poderá funcionar em acesso local e com grande desempenho em computadores pessoais e estações de trabalho com placas gráficas GeForce RTX.

Este lançamento assinala o início de uma nova era de inteligência artificial local, mais rápido e eficiente que é potenciado pelas capacidades das Placas Gráficas GeForce RTX e RTX PRO. Foram disponibilizadas duas versões diferentes dos modelos, desenvolvidas para abranger diferentes níveis de hardware:

  • gpt-oss-20b: Otimizado para PCs equipados com RTX AI com pelo menos 16 GB de memória gráfica (VRAM), por exemplo consegue atingir velocidades até 250 tokens por segundo numa RTX 5090.
  • gpt-oss-120b: Um modelo mais robusto que é indicado para estações de trabalho profissionais com Placas Gráficas RTX PRO.

Ambos os modelos foram treinados com as Placas Gráficas NVIDIA H100 e são os primeiros a incorporar MXFP4, uma técnica que melhora a precisão e fidelidade dos modelos sem sacrificar o desempenho.

Destaques técnicos:

  • Capacidade de contexto até 131.072 tokens, uma das mais elevadas na inferência local.
  • Estrutura baseada em arquitetura mixture-of-experts (MoE).
  • Suporte para raciocínio passo-a-passo (chain-of-thought), execução de instruções e integração com ferramentas.

Como começar a explorar os modelos com RTX

A NVIDIA indicou três formas práticas de experimentar os modelos gpt-oss com placas gráficas RTX:

  • Ollama
    Uma das maneiras mais simples de testar os modelos. A aplicação tem interface intuitiva e suporte completo para sistemas equipados com componentes RTX.
  • Llama.cpp (via GitHub)
    Em colaboração com a comunidade open-source, a NVIDIA está a otimizar o desempenho com ferramentas como CUDA Graphs, que reduzem o tempo de execução.
  • Microsoft AI Foundry Local (versão de pré-visualização)
    Nos sistemas Windows, os programadores podem executar o seguinte comando no terminal: “Foundry model run gpt-oss-20b”.
Bruno Reis
Bruno Reis
Vindo de vários mundos e projetos, juntou-se à redação do Otakupt em 2020, pronto para informar todos os leitores com a sua experiência nas várias áreas da cultura alternativa. Assistiu de perto ao nascimento dos videojogos em Portugal até à sua atualidade, devora tudo o que seja japonês (menos a gastronomia), mas é também adepto de grandes histórias e personagens sejam essas produzidas em qualquer parte do globo terrestre.

Artigos Relacionados

1 COMENTÁRIO

Subscreve
Notify of
guest

1 Comentário
Mais Antigo
Mais Recente
Inline Feedbacks
View all comments
Kisama404 v2
Kisama404 v2
6 , Agosto , 2025 22:50

Parece que o mundo dos falsos frames está para durar. Quando deixa de ser possível melhorar o hardware, inventasse evolução com o software.

Last edited 7 meses atrás by Kisama404 v2
- Publicidade -

Notícias

Populares