A DeepSeek-V4-Pro é o modelo de topo da série V4, apresentada em pré-visualização a 24 de abril de 2026. É um modelo de mistura de especialistas com 1,6 biliões de parâmetros totais e 49 mil milhões ativados, disponibilizado com pesos abertos sob licença MIT. Toda a série suporta uma janela de contexto de um milhão de tokens.

O modelo distingue-se pela arquitetura de atenção híbrida, que torna o contexto longo muito mais eficiente: num cenário de 1M tokens, precisa de uma fração dos FLOPs de inferência por token e da cache face à geração anterior, a V3.2. Funciona em três modos de raciocínio, Non-Think para respostas rápidas, Think High para análise mais cuidada e Think Max para o esforço máximo, recomendado com pelo menos 384K tokens de contexto.

No seu modo Think Max, a DeepSeek descreve a V4-Pro como o melhor modelo aberto disponível atualmente, com desempenho de topo em programação e raciocínio. Atinge 80,6% no SWE-bench Verified, 93,5% no LiveCodeBench, um rating de 3206 no Codeforces e 90,1% no GPQA Diamond. Além dos pesos no Hugging Face, está disponível na API alojada da DeepSeek.

Funcionalidades

  • Janela de contexto de 1M tokens
  • Modos de raciocínio Non-Think, Think High e Think Max
  • Arquitetura de atenção híbrida
  • Pesos abertos sob licença MIT

Especificações

Janela de contexto
1M tokens
Saída máxima
384K tokens
Entradas
Texto
Saídas
Texto
Lançamento
24 Abr
Pesos abertos
MIT

Benchmarks

Benchmark Resultado Fonte
SWE-bench Verified modo Think Max 80,6%
LiveCodeBench modo Think Max 93,5%
Codeforces rating, modo Think Max 3206
GPQA Diamond modo Think Max 90,1%
MMLU-Pro modo Think Max 87,5%

Resultados reportados pelo laboratório que criou o modelo. Cada linha liga à fonte original.

Algo incorreto? Ajuda-nos a melhorar