O Llama 4 Maverick é o modelo de pesos abertos de topo da Meta, com 17 mil milhões de parâmetros ativos distribuídos por 128 especialistas (400 mil milhões de parâmetros no total) numa arquitetura de mistura de especialistas. É multimodal de raiz, aceitando texto e imagem como entrada e produzindo texto, com uma janela de contexto de 1 milhão de tokens. Os pesos estão disponíveis para descarregar e alojar, sob a Llama 4 Community License.
Vocacionado para raciocínio, programação, compreensão de imagens e tarefas multilingues (incluindo português), o Maverick destina-se a quem quer correr um modelo capaz na própria infraestrutura ou através de APIs de fornecedores cloud. Suporta doze línguas de forma nativa, entre elas o português.
Face à geração anterior, o salto é claro. Nos resultados oficiais da Meta, o Maverick passa de 73,4% para 80,5% no MMLU-Pro e de 49,0% para 69,8% no GPQA Diamond, em comparação com o Llama 3.1 405B, com melhorias semelhantes em código (LiveCodeBench, de 27,7% para 43,4%) e em raciocínio sobre imagens, apesar de ativar muito menos parâmetros por inferência.
Funcionalidades
- Multimodal nativo (texto e imagem)
- Arquitetura de mistura de especialistas (128 especialistas)
- Janela de contexto de 1M tokens
- Pesos abertos para descarregar e alojar
Especificações
- Janela de contexto
- 1M tokens
- Entradas
- Texto · Imagem
- Saídas
- Texto
- Conhecimento até
- Agosto de 2024
- Lançamento
- 5 Abr 2025
- Pesos abertos
- Llama 4 Community License
Benchmarks
Resultados reportados pelo laboratório que criou o modelo. Cada linha liga à fonte original.