O Qwen3.6-35B-A3B é a primeira variante de pesos abertos da geração Qwen3.6, a série de modelos de linguagem da equipa Qwen da Alibaba. Usa uma arquitetura de mistura de especialistas com 35 mil milhões de parâmetros no total e apenas 3 mil milhões ativos por inferência, o que lhe dá desempenho de topo a um custo computacional reduzido. Os pesos estão disponíveis sob licença Apache 2.0 no Hugging Face e no ModelScope.
A geração concentra os ganhos em código agêntico: o modelo lida com fluxos de frontend e raciocínio ao nível de repositórios com mais precisão do que o Qwen3.5-35B-A3B, subindo de 70,0% para 73,4% no SWE-bench Verified e de 40,5% para 51,5% no Terminal-Bench 2.0.
Aceita texto, imagens e vídeo como entrada e devolve texto, com uma janela de contexto nativa de 262 mil tokens que se estende até cerca de um milhão através de YaRN. É uma escolha prática para quem quer um modelo capaz a correr na própria infraestrutura, sem depender de uma API fechada.
Funcionalidades
- Pesos abertos sob licença Apache 2.0
- Arquitetura MoE (35B totais, 3B ativos)
- Janela de contexto de 262K tokens, extensível até 1M
- Entrada multimodal (texto, imagem e vídeo)
Especificações
- Janela de contexto
- 262K tokens (até 1M com YaRN)
- Entradas
- Texto · Imagem · Vídeo
- Saídas
- Texto
- Lançamento
- 16 Abr
- Pesos abertos
- Apache 2.0
Benchmarks
Resultados reportados pelo laboratório que criou o modelo. Cada linha liga à fonte original.