A DeepSeek-V4-Pro é o modelo de topo da série V4, apresentada em pré-visualização a 24 de abril de 2026. É um modelo de mistura de especialistas com 1,6 biliões de parâmetros totais e 49 mil milhões ativados, disponibilizado com pesos abertos sob licença MIT. Toda a série suporta uma janela de contexto de um milhão de tokens.
O modelo distingue-se pela arquitetura de atenção híbrida, que torna o contexto longo muito mais eficiente: num cenário de 1M tokens, precisa de uma fração dos FLOPs de inferência por token e da cache face à geração anterior, a V3.2. Funciona em três modos de raciocínio, Non-Think para respostas rápidas, Think High para análise mais cuidada e Think Max para o esforço máximo, recomendado com pelo menos 384K tokens de contexto.
No seu modo Think Max, a DeepSeek descreve a V4-Pro como o melhor modelo aberto disponível atualmente, com desempenho de topo em programação e raciocínio. Atinge 80,6% no SWE-bench Verified, 93,5% no LiveCodeBench, um rating de 3206 no Codeforces e 90,1% no GPQA Diamond. Além dos pesos no Hugging Face, está disponível na API alojada da DeepSeek.
Funcionalidades
- Janela de contexto de 1M tokens
- Modos de raciocínio Non-Think, Think High e Think Max
- Arquitetura de atenção híbrida
- Pesos abertos sob licença MIT
Especificações
- Janela de contexto
- 1M tokens
- Saída máxima
- 384K tokens
- Entradas
- Texto
- Saídas
- Texto
- Lançamento
- 24 Abr
- Pesos abertos
- MIT
Benchmarks
Resultados reportados pelo laboratório que criou o modelo. Cada linha liga à fonte original.