Gemini 3.5 Flash é o modelo rápido e eficiente da Google, pensado para escalar trabalho de IA com baixa latência e custo controlado. Em relação ao Gemini 3 Flash, melhora em toda a linha de benchmarks agênticos e de uso de ferramentas, com saltos grandes em código de terminal, uso de computador e raciocínio abstrato.

Mantém a entrada multimodal (texto, imagem, áudio e vídeo) e uma janela de contexto de 1M tokens, o que o torna uma boa escolha por omissão para fluxos de alto volume, escalando para o Gemini 3.1 Pro quando a tarefa precisa de mais profundidade. Está disponível no Google AI Studio, na Gemini API e no Vertex AI.

Funcionalidades

Baixa latência
Multimodal (texto, imagem, áudio, vídeo)
Janela de contexto de 1M tokens
Uso de ferramentas nativo

Especificações

Janela de contexto: 1M tokens
Saída máxima: 64K tokens
Entradas: Texto · Imagem · Áudio · Vídeo
Saídas: Texto
Lançamento: 19 Mai
Pesos abertos: Não

Benchmarks

Benchmark	Resultado	Fonte
SWE-bench Pro público	55,1% +5,5 vs Gemini 3 Flash
Terminal-Bench 2.1	76,2% +18,2 vs Gemini 3 Flash
OSWorld-Verified	78,4% +13,3 vs Gemini 3 Flash
Humanity's Last Exam	40,2% +6,5 vs Gemini 3 Flash
ARC-AGI-2	72,1% +38,5 vs Gemini 3 Flash
MMMU-Pro	83,6% +2,4 vs Gemini 3 Flash
MCP Atlas	83,6% +21,6 vs Gemini 3 Flash

Resultados reportados pelo laboratório que criou o modelo. Cada linha liga à fonte original.

Algo incorreto? Ajuda-nos a melhorar