O Qwen3.6-35B-A3B é a primeira variante de pesos abertos da geração Qwen3.6, a série de modelos de linguagem da equipa Qwen da Alibaba. Usa uma arquitetura de mistura de especialistas com 35 mil milhões de parâmetros no total e apenas 3 mil milhões ativos por inferência, o que lhe dá desempenho de topo a um custo computacional reduzido. Os pesos estão disponíveis sob licença Apache 2.0 no Hugging Face e no ModelScope.

A geração concentra os ganhos em código agêntico: o modelo lida com fluxos de frontend e raciocínio ao nível de repositórios com mais precisão do que o Qwen3.5-35B-A3B, subindo de 70,0% para 73,4% no SWE-bench Verified e de 40,5% para 51,5% no Terminal-Bench 2.0.

Aceita texto, imagens e vídeo como entrada e devolve texto, com uma janela de contexto nativa de 262 mil tokens que se estende até cerca de um milhão através de YaRN. É uma escolha prática para quem quer um modelo capaz a correr na própria infraestrutura, sem depender de uma API fechada.

Funcionalidades

  • Pesos abertos sob licença Apache 2.0
  • Arquitetura MoE (35B totais, 3B ativos)
  • Janela de contexto de 262K tokens, extensível até 1M
  • Entrada multimodal (texto, imagem e vídeo)

Especificações

Janela de contexto
262K tokens (até 1M com YaRN)
Entradas
Texto · Imagem · Vídeo
Saídas
Texto
Lançamento
16 Abr
Pesos abertos
Apache 2.0

Benchmarks

Benchmark Resultado Fonte
SWE-bench Verified 73,4% +3,4 vs Qwen3.5-35B-A3B
SWE-bench Multilingual 67,2% +6,9 vs Qwen3.5-35B-A3B
Terminal-Bench 2.0 51,5% +11 vs Qwen3.5-35B-A3B
LiveCodeBench v6 80,4% +5,8 vs Qwen3.5-35B-A3B
GPQA 86,0% +1,8 vs Qwen3.5-35B-A3B
AIME26 92,7% +1,7 vs Qwen3.5-35B-A3B
MMLU-Pro 85,2% −0,1 vs Qwen3.5-35B-A3B

Resultados reportados pelo laboratório que criou o modelo. Cada linha liga à fonte original.

Algo incorreto? Ajuda-nos a melhorar