Gemini 3.5 Flash é o modelo rápido e eficiente da Google, pensado para escalar trabalho de IA com baixa latência e custo controlado. Em relação ao Gemini 3 Flash, melhora em toda a linha de benchmarks agênticos e de uso de ferramentas, com saltos grandes em código de terminal, uso de computador e raciocínio abstrato.
Mantém a entrada multimodal (texto, imagem, áudio e vídeo) e uma janela de contexto de 1M tokens, o que o torna uma boa escolha por omissão para fluxos de alto volume, escalando para o Gemini 3.1 Pro quando a tarefa precisa de mais profundidade. Está disponível no Google AI Studio, na Gemini API e no Vertex AI.
Funcionalidades
- Baixa latência
- Multimodal (texto, imagem, áudio, vídeo)
- Janela de contexto de 1M tokens
- Uso de ferramentas nativo
Especificações
- Janela de contexto
- 1M tokens
- Saída máxima
- 64K tokens
- Entradas
- Texto · Imagem · Áudio · Vídeo
- Saídas
- Texto
- Lançamento
- 19 Mai
- Pesos abertos
- Não
Benchmarks
Resultados reportados pelo laboratório que criou o modelo. Cada linha liga à fonte original.