Gemini 3.5 Flash é o modelo rápido e eficiente da Google, pensado para escalar trabalho de IA com baixa latência e custo controlado. Em relação ao Gemini 3 Flash, melhora em toda a linha de benchmarks agênticos e de uso de ferramentas, com saltos grandes em código de terminal, uso de computador e raciocínio abstrato.

Mantém a entrada multimodal (texto, imagem, áudio e vídeo) e uma janela de contexto de 1M tokens, o que o torna uma boa escolha por omissão para fluxos de alto volume, escalando para o Gemini 3.1 Pro quando a tarefa precisa de mais profundidade. Está disponível no Google AI Studio, na Gemini API e no Vertex AI.

Funcionalidades

  • Baixa latência
  • Multimodal (texto, imagem, áudio, vídeo)
  • Janela de contexto de 1M tokens
  • Uso de ferramentas nativo

Especificações

Janela de contexto
1M tokens
Saída máxima
64K tokens
Entradas
Texto · Imagem · Áudio · Vídeo
Saídas
Texto
Lançamento
19 Mai
Pesos abertos
Não

Benchmarks

Benchmark Resultado Fonte
SWE-bench Pro público 55,1% +5,5 vs Gemini 3 Flash
Terminal-Bench 2.1 76,2% +18,2 vs Gemini 3 Flash
OSWorld-Verified 78,4% +13,3 vs Gemini 3 Flash
Humanity's Last Exam 40,2% +6,5 vs Gemini 3 Flash
ARC-AGI-2 72,1% +38,5 vs Gemini 3 Flash
MMMU-Pro 83,6% +2,4 vs Gemini 3 Flash
MCP Atlas 83,6% +21,6 vs Gemini 3 Flash

Resultados reportados pelo laboratório que criou o modelo. Cada linha liga à fonte original.

Algo incorreto? Ajuda-nos a melhorar