Google lança Gemini Deep Research com Interactions API

Introdução

O Google lançou uma versão atualizada do Gemini Deep Research e disponibilizou o agente para desenvolvedores por meio da Interactions API, com acesso pelo Gemini API no Google AI Studio. A promessa é simples, mas poderosa, incorporar o agente de pesquisa do Google diretamente em produtos e fluxos, com execução em segundo plano, gestão de estado no servidor e capacidade de gerar relatórios detalhados com citações.

Na prática, o Gemini Deep Research foi otimizado para tarefas longas de coleta de contexto e síntese. O agente é alimentado pelo Gemini 3 Pro, apontado pelo Google como o modelo mais factual da família, e foi treinado para reduzir alucinações e aumentar a qualidade dos relatórios em investigações complexas. Junto com o anúncio, o Google apresentou o DeepSearchQA, um benchmark aberto para avaliar abrangência em tarefas de pesquisa na web.

O artigo destrincha o que muda para desenvolvedores e equipes de produto. Explica como a Interactions API funciona, como iniciar o Deep Research em background, casos de uso que já fazem sentido, números de benchmarks, custos e limitações, e um guia rápido para começar com segurança.

O que exatamente foi lançado e por que importa

O pacote tem três pilares. Primeiro, o agente Gemini Deep Research foi reimaginado, com melhorias de busca na web e iteração de plano de pesquisa, ele formula consultas, lê resultados, identifica lacunas e volta a pesquisar até consolidar um relatório. Segundo, a Interactions API estreou como uma interface unificada para modelos e agentes, com um endpoint único, suporte a estado no servidor e execução em background. Terceiro, o DeepSearchQA foi aberto para a comunidade como referência para medir a abrangência e a completude de respostas em pesquisas complexas.

Essa combinação importa porque tira o agente do jardim murado e o leva para a sua stack. Em vez de limitar o Deep Research a interfaces do Google, times podem embuti-lo em apps B2B e B2C, workflows internos e pipelines de dados, com controle programático, logs e versionamento, e sem manter loops longos de inferência no cliente.

Como a Interactions API funciona na prática

A Interactions API introduz o recurso Interaction, um registro completo da tarefa, com entradas do usuário, pensamentos do modelo, chamadas de ferramenta, resultados e saídas finais. O mesmo endpoint atende modelos e agentes. Se você especifica o parâmetro model, fala com um modelo como o Gemini 3 Flash Preview. Se usa o parâmetro agent, dialoga com um agente especializado, como o Deep Research, atualmente com o identificador deep-research-pro-preview-12-2025.

O servidor pode armazenar o histórico para você, o que simplifica o código do cliente, evita erros de contexto e pode reduzir custo via cache. A API também aceita execução em background para tarefas longas. Por padrão, Interactions ficam armazenadas para habilitar estado no servidor e background. A retenção é de 55 dias no plano pago e de 1 dia no plano gratuito, com opt-out via store=false, observando que background=true exige store=true.

Um fluxo mínimo em Python com o agente fica assim, útil para iniciar uma pesquisa longa, checar status e obter o relatório final quando completar:

from google import genai
import time

client = genai.Client()

# 1. Inicia o Deep Research em background
initial = client.interactions.create(
    input="Pesquise tendências de RAG corporativo focando 2025 e 2026, cite fontes.",
    agent="deep-research-pro-preview-12-2025",
    background=True
)

# 2. Poll para acompanhar até concluir
while True:
    it = client.interactions.get
    if it.status == "completed":
        print(it.outputs[-1].text)
        break
    elif it.status in ["failed", "cancelled"]:
        print(f"Falhou, status: {it.status}")
        break
    time.sleep(10)

Esse padrão é idêntico ao descrito na documentação oficial, incluindo o uso de background, o polling por status e o ID do agente.

O que há de novo no Gemini Deep Research para desenvolvedores

Pelo lado do agente, o Google destaca melhorias em busca, planejamento iterativo e capacidade de navegar profundamente em sites para extrair dados específicos. O núcleo de raciocínio usa Gemini 3 Pro e foi ajustado para reduzir alucinações e elevar a qualidade do relatório. O Google também cita ganhos de custo para relatórios bem pesquisados, além de métricas de estado da arte em benchmarks como Humanity’s Last Exam, DeepSearchQA e bom desempenho em BrowseComp.

No ecossistema, o Interactions API oferece recursos pensados para apps agentivos modernos, como esquema interpretável para históricos complexos, estado no servidor opcional e execução em background. Também há suporte a ferramentas nativas e a MCP, o protocolo de contexto de modelo, o que abre caminho para orquestrar fluxos com outras fontes e utilitários.

![Ilustração de inteligência artificial e pesquisa]

Benchmarks, métricas e o papel do DeepSearchQA

O Google apresentou o DeepSearchQA como benchmark aberto focado em tarefas de pesquisa de múltiplas etapas, com cadeias causais em vários domínios, avaliando não só precisão pontual, mas a abrangência de respostas. A ideia é medir se o agente realmente vasculha o espaço de informação e retorna um conjunto exaustivo de achados, aproximando a avaliação do que times fazem no mundo real.

Além disso, o cenário mais amplo de agentes de navegação está evoluindo com benchmarks como o BrowseComp, da OpenAI, voltado para avaliar agentes que iteram pela web. O próprio material do BrowseComp discute como o desempenho escala com compute em tempo de teste e como estratégias de agregação, como best-of-N, podem trazer ganhos relevantes. Esses achados contextualizam o avanço do Deep Research e indicam que permitir mais tempo de raciocínio e iteração tende a elevar a qualidade das respostas em agentes de pesquisa.

Como leitura crítica, benchmarks são úteis para balizar progresso, mas seu valor real vem quando conectados a métricas de negócio, por exemplo, redução de horas de analista por relatório, aumento de cobertura de fontes e custo por insight acionável. Em times de produto, vale instrumentar cada etapa, do planejamento à citação, medindo precisão, recall de fontes e tempo de ciclo por tarefa.

Casos de uso práticos que já fazem sentido

Due diligence e inteligência competitiva. O agente percorre web pública, documentos e bases internas, sintetiza riscos, concorrentes, movimentos de mercado e cria relatórios citados que podem alimentar comitês e squads de growth. A documentação do Google posiciona o Deep Research como apropriado para tarefas de longo prazo, com relatórios detalhados e análise comparativa.
Revisões de literatura técnica e científica. Para PMs e tech leads, o agente pode mapear APIs, arquiteturas de referência e papers, sugerindo trilhas de implementação e trade-offs, sempre com links para verificação.
Exploração de mercados e design de ofertas. O agente coleta preços, diferenciais e evidências públicas que suportam decisões de posicionamento e messaging, reduzindo o tempo de mesa.
Pesquisa de políticas e compliance. Em áreas reguladas, o agente acelera o mapeamento de requisitos, embora decisões finais devam passar por revisão humana especializada.

Importante, o Google já vem expandindo o Deep Research para usuários finais no app do Gemini e em produtos como NotebookLM e Search, além de evoluir experiências como personalização, áudio e visualizações. Isso indica uma estratégia de agentes mais ampla, com o Interactions API abrindo a porta para uso programático.

Custos, disponibilidade e limites que você precisa saber

O Deep Research está em preview e, por ora, acessível somente pela Interactions API, não pelo generate_content. A execução é assíncrona, com latência de minutos, e a maioria das tarefas conclui em até 20 minutos, com teto de 60 minutos. A documentação também registra que, até 5 de janeiro de 2026, chamadas à ferramenta Google Search eram gratuitas, com aplicação de preços padrão após essa data. Consulte a página de preços do Gemini API para valores atualizados.

Já a Interactions API está em beta, sujeita a breaking changes. Alguns recursos ainda não são suportados no agente, como ferramentas customizadas via function calling ou servidores MCP remotos, além de ausência de saídas totalmente estruturadas e aprovação humana de planos. Background=true requer store=true e, embora o agente suporte multimodalidade, inputs de áudio não são suportados no momento.

Guia rápido, do zero ao primeiro relatório

Crie a chave no Google AI Studio e instale o SDK mais recente, google-genai no Python a partir da versão 1.55.0 e @google/genai no JavaScript a partir da versão 1.33.0.
Modele o prompt como um briefing de analista. Liste objetivos, escopo, fontes prioritárias e critérios de qualidade, peça citações.
Inicie a interação com agent=deep-research-pro-preview-12-2025 e background=true. Faça polling do status até completed.
Trate erros e timeouts. Se passar do tempo máximo, registre as etapas concluídas e reencadeie com previous_interaction_id para continuar o trabalho.
Pós-processamento. Use um modelo Gemini para refinar formatação, transformar em briefing executivo, tabela comparativa ou plano de ação, ligando as etapas com previous_interaction_id.
Observabilidade e custo. Logue métricas como tempo de pesquisa, páginas visitadas, tamanho dos relatórios e número de citações. Ajuste o nível de esforço conforme o valor do caso de uso.

![Desenvolvedor programando integração de API]

Boas práticas para qualidade e governança

Defina o nível de confiança desejado. Para tarefas sensíveis, aumente o tempo de iteração, peça validação cruzada de fontes e inclua critérios explícitos de abrangência. O material sobre BrowseComp mostra como performance escala com compute em tempo de teste. Em produção, orquestre esse budget por tarefa, não por usuário.
Estruture prompts com plano e checklist. Peça que o agente apresente plano, lacunas, hipóteses e confirmação de cobertura antes de gerar o relatório final.
Amarre fontes internas com File Search ou conectores. Use dados proprietários para contextualizar a pesquisa, mantendo logs e auditoria para conformidade.
Modele contratos de latência. O Deep Research é orientado a qualidade, não a tempo real. Para chat, use um modelo padrão e reserve o agente para análises.
Políticas de retenção. Revise store=true, período de retenção e deleção de interações, especialmente em ambientes regulados.

Onde isso se encaixa no roadmap de produtos de IA

O Interactions API sugere a direção de plataforma agentiva, um plano para conectar modelos, agentes nativos do Google e agentes próprios por uma única API. A documentação indica expansão de agentes embutidos e a possibilidade de trazer seus próprios agentes no futuro. Isso tende a simplificar arquiteturas que hoje combinam várias SDKs e camadas de orquestração.

No lado do usuário final, o Google vem ampliando o Deep Research no app Gemini e explorando formatos como relatórios com visualizações e áudios, sinalizando que a camada de apresentação também vai evoluir. Para quem desenvolve, a mensagem é clara, a fundação para agentes está sendo construída na API, de forma que features de produto possam ser consumidas programaticamente.

Reflexões e insights estratégicos

O agente reduz o atrito onde dói, tarefas que precisam horas de leitura, checagem e síntese. Em muitos times, análises que consumiam uma semana podem virar um ciclo de algumas dezenas de minutos, com checagem humana focada no que importa. O valor emerge quando a equipe mede o que foi poupado de tempo, onde a cobertura de fontes aumentou e quanto cada insight custou.
Benchmarks são úteis para orientar, mas times devem evitar overfitting em placares. O que importa é consistência de qualidade no domínio específico, por exemplo, compliance no setor financeiro ou revisão de literatura biomédica. Isso se alcança com prompts rigorosos, critérios de abrangência, validação cruzada e orquestração de compute conforme a criticidade da tarefa.
A separação entre chat e pesquisa profunda é saudável. Chat atende ao imediato. O Deep Research mira decisões. Organizações que combinam ambos, com roteamento por intenção e SLOs, tendem a colher ganhos práticos sem fricção.

Conclusão

O lançamento do Gemini Deep Research via Interactions API muda o jogo para quem quer levar pesquisa autônoma, com planejamento e citações, para dentro de produtos e operações. O pacote une um agente mais capaz, uma API pensada para estado e tarefas longas e um benchmark aberto para medir abrangência, criando um caminho pragmático para adoção empresarial.

Para aproveitar, comece pequeno, defina casos de alto valor, modele prompts como briefings, implemente observabilidade, ajuste o budget de raciocínio e feche o loop com revisão humana. À medida que o ecossistema de agentes evoluir, a Interactions API tende a se tornar o hub para conectar modelos, agentes nativos e agentes próprios em fluxos de negócio cada vez mais inteligentes.