O Llama 4 Maverick é o modelo de pesos abertos de topo da Meta, com 17 mil milhões de parâmetros ativos distribuídos por 128 especialistas (400 mil milhões de parâmetros no total) numa arquitetura de mistura de especialistas. É multimodal de raiz, aceitando texto e imagem como entrada e produzindo texto, com uma janela de contexto de 1 milhão de tokens. Os pesos estão disponíveis para descarregar e alojar, sob a Llama 4 Community License.

Vocacionado para raciocínio, programação, compreensão de imagens e tarefas multilingues (incluindo português), o Maverick destina-se a quem quer correr um modelo capaz na própria infraestrutura ou através de APIs de fornecedores cloud. Suporta doze línguas de forma nativa, entre elas o português.

Face à geração anterior, o salto é claro. Nos resultados oficiais da Meta, o Maverick passa de 73,4% para 80,5% no MMLU-Pro e de 49,0% para 69,8% no GPQA Diamond, em comparação com o Llama 3.1 405B, com melhorias semelhantes em código (LiveCodeBench, de 27,7% para 43,4%) e em raciocínio sobre imagens, apesar de ativar muito menos parâmetros por inferência.

Funcionalidades

  • Multimodal nativo (texto e imagem)
  • Arquitetura de mistura de especialistas (128 especialistas)
  • Janela de contexto de 1M tokens
  • Pesos abertos para descarregar e alojar

Especificações

Janela de contexto
1M tokens
Entradas
Texto · Imagem
Saídas
Texto
Conhecimento até
Agosto de 2024
Lançamento
5 Abr 2025
Pesos abertos
Llama 4 Community License

Benchmarks

Benchmark Resultado Fonte
MMLU-Pro 80,5% +7,1 vs Llama 3.1 405B
GPQA Diamond 69,8% +20,8 vs Llama 3.1 405B
MMMU 73,4% +4 vs Llama 3.1 405B
MathVista 73,7% +3 vs Llama 3.1 405B
LiveCodeBench 43,4% +15,7 vs Llama 3.1 405B
MGSM 92,3% +0,7 vs Llama 3.1 405B

Resultados reportados pelo laboratório que criou o modelo. Cada linha liga à fonte original.

Algo incorreto? Ajuda-nos a melhorar