DeepSeek-V4-Pro

Modelo modelosprogramacaoagentes-iapesquisa

O modelo aberto mais capaz da DeepSeek para raciocínio, código e tarefas agênticas, com contexto de 1M tokens.

DeepSeek

Atualizado 1 Jun

Sim

Open Source

Grátis

Pesos abertos sob licença MIT, descarregáveis no Hugging Face. Na API alojada da DeepSeek, o deepseek-v4-pro custa 1,74 USD por milhão de tokens de entrada e 3,48 USD por milhão de saída.

A DeepSeek-V4-Pro é o modelo de topo da série V4, apresentada em pré-visualização a 24 de abril de 2026. É um modelo de mistura de especialistas com 1,6 biliões de parâmetros totais e 49 mil milhões ativados, disponibilizado com pesos abertos sob licença MIT. Toda a série suporta uma janela de contexto de um milhão de tokens.

O modelo distingue-se pela arquitetura de atenção híbrida, que torna o contexto longo muito mais eficiente: num cenário de 1M tokens, precisa de uma fração dos FLOPs de inferência por token e da cache face à geração anterior, a V3.2. Funciona em três modos de raciocínio, Non-Think para respostas rápidas, Think High para análise mais cuidada e Think Max para o esforço máximo, recomendado com pelo menos 384K tokens de contexto.

No seu modo Think Max, a DeepSeek descreve a V4-Pro como o melhor modelo aberto disponível atualmente, com desempenho de topo em programação e raciocínio. Atinge 80,6% no SWE-bench Verified, 93,5% no LiveCodeBench, um rating de 3206 no Codeforces e 90,1% no GPQA Diamond. Além dos pesos no Hugging Face, está disponível na API alojada da DeepSeek.

Benchmarks

Benchmark	Resultado	Fonte
SWE-bench Verified modo Think Max	80,6%
LiveCodeBench modo Think Max	93,5%
Codeforces rating, modo Think Max	3206
GPQA Diamond modo Think Max	90,1%
MMLU-Pro modo Think Max	87,5%

Resultados reportados pelo laboratório que criou o modelo. Cada linha liga à fonte original.

DeepSeek-V4-Pro

Funcionalidades

Especificações

Benchmarks