Microsoft traz Critique e Council ao 365 Researcher

Introdução

A Microsoft 365 Copilot Researcher ganhou dois reforços de peso, Critique e Council, projetados para reduzir erros e ampliar a profundidade das análises com uma abordagem que utiliza mais de um modelo de IA no mesmo fluxo. O movimento mira um problema recorrente, a variabilidade de respostas entre modelos, e coloca o Researcher em vantagem mensurável sobre sistemas de pesquisa profunda de mercado.

Em 30 de março de 2026, a Microsoft publicou que o Researcher com Critique aumentou o escore agregado em +7,0 pontos no benchmark DRACO, 13,88 por cento acima do Perplexity Deep Research baseado em Claude Opus 4.6, o líder reportado no estudo original. A empresa também liberou o Council, que exibe respostas lado a lado de modelos diferentes para revelar convergências, divergências e insights únicos.

O que são Critique e Council, em termos práticos

Critique, camada de revisão automática. Um modelo gera o relatório, outro modelo especializado revisa, aponta falhas e solicita correções antes de o usuário ver o resultado. Na prática, funciona como ter um redator sênior e um revisor rigoroso no mesmo ciclo. Segundo a cobertura da Computerworld, essa separação entre geração e revisão foi central para o ganho de qualidade medido no DRACO.
Council, comparador entre modelos. Vários modelos produzem respostas independentes em paralelo e um “juiz” ajuda a sintetizar pontos de acordo e discordância. Esse modo é útil quando a pergunta é ambígua, multidisciplinar ou sensível a vieses de um único modelo.

Do ponto de vista estratégico, a Microsoft também sinaliza um Copilot menos dependente de um único fornecedor. Reportagem da Axios confirmou que a empresa já usa modelos da OpenAI e da Anthropic nesses fluxos, com promessa de ampliar o leque de modelos até o verão do hemisfério norte de 2026.

Por que a inteligência multimodelo importa agora

Trabalhos de pesquisa corporativa exigem raciocínio em várias camadas, leitura crítica de fontes, verificação de fatos e clareza de apresentação. Em testes internos reportados pela imprensa, os maiores ganhos do Critique apareceram em Amplitude e Profundidade da Análise, seguidos por Qualidade de Apresentação e Exatidão Factual. Esse padrão faz sentido, já que a etapa de crítica força o sistema a justificar melhor premissas, preencher lacunas e cortar exageros.

Há também um argumento econômico e operacional. Usar dois ou mais modelos na mesma consulta aumenta custo e latência. A Axios registrou que o Council pode custar cerca de 2,5 vezes mais do que um fluxo de modelo único, enquanto o Critique adiciona por volta de 20 por cento, números que influenciam quando e como a Microsoft e as empresas clientes escolhem ativar essas capacidades.

![AI research desk with laptop and neural visuals]

O que muda no seu dia a dia com o Researcher

Quando um relatório precisa ser certo o bastante para ir ao comitê de investimentos, o Critique vira meu padrão. Ele exige alguns segundos a mais, mas devolve um sumário com fontes bem amarradas e seções claras. Numa investigação de concorrentes com informações conflitantes, o Council brilha. Ele coloca as versões lado a lado, destaca em que pontos os modelos concordam e onde divergem, e isso acelera uma decisão informada.

Para um gerente de produto que precisa consolidar pesquisas de mercado, a sequência prática fica assim:

Fazer a pergunta no Researcher definindo escopo, por exemplo, web mais arquivos do Teams e do SharePoint.
Ligar o Critique quando a precisão pesa mais que a velocidade.
Se o tema for ambíguo, acionar o Council para ver o contraste entre modelos e capturar insights que um único modelo talvez ignore.
Exportar o relatório com citações e anexar ao plano no Word ou ao deck no PowerPoint.

A própria documentação da Microsoft descreve o Researcher como agente voltado a tarefas complexas e demoradas, com relatórios estruturados e citados, integrado à governança do Microsoft 365. Isso deixa o Copilot Chat como via rápida para tarefas simples, enquanto o Researcher assume o trabalho pesado.

Resultados medidos, não apenas promessas

O ponto alto aqui é ter números públicos. Na postagem oficial de 30 de março de 2026, a Microsoft reportou que o Researcher com Critique superou o melhor sistema publicado no estudo DRACO por 13,88 por cento, com incremento de +7,0 pontos no escore agregado, num conjunto de 100 tarefas complexas em 10 domínios. Essa é a evidência mais concreta de que a abordagem multimodelo está entregando qualidade superior em pesquisa profunda.

Veículos independentes como a Computerworld sintetizaram a mecânica por trás dos ganhos, enfatizando a separação entre quem redige e quem revisa, e a utilidade do Council em exibir concordâncias e divergências entre modelos. Esse desenho imita processos editoriais maduros, o que ajuda a explicar a melhora em profundidade, exatidão e apresentação.

![Data research, charts and notebooks on desk]

Ilustração do artigo

Disponibilidade, custos e o programa Frontier

Segundo a Axios, os modos Critique e Council já estão em uso dentro do ecossistema do Microsoft 365 Copilot, com modelos da OpenAI e da Anthropic, e a Microsoft planeja incluir ainda mais modelos ao longo do verão do hemisfério norte de 2026. O mesmo texto detalha a diferença de custo operacional, que ajuda a decidir quando ativar cada modo.

Complementando, a Microsoft comunicou que o Copilot Cowork e as novidades de orquestração de modelos estão disponíveis no Frontier Program, ambiente de acesso antecipado para recursos avançados do Copilot em cenários reais de trabalho. Para muitas organizações, isso significa que Critique e Council podem aparecer primeiro nesse programa antes de uma liberação mais ampla.

Como habilitar e governar no Microsoft 365

Em ambientes corporativos, a experiência depende da configuração do administrador. A documentação oficial indica que, para usar Claude no Researcher, o admin precisa permitir o acesso aos modelos da Anthropic no centro de administração. O recurso está em rollout gradual e, durante a transição, algumas organizações podem ver limitações até a disponibilidade total. Também é possível gerenciar quais agentes ficam visíveis para grupos específicos.

Boas práticas de governança que aplico nessas ativações:

Definir critérios simples de uso. Critique para relatórios públicos e análises regulatórias. Council quando o tema for ambíguo, com necessidade de triangulação entre modelos.
Monitorar latência e consumo. Se Council multiplicar custo sem ganho de clareza, trocar para Critique ou fluxo de modelo único.
Auditar amostras. Revisar periodicamente relatórios gerados, checando fontes citadas e aderência a políticas internas de dados.

Multimodelo não é bala de prata, é arquitetura

A orquestração entre modelos reduz erros óbvios, mas não substitui políticas de dados, curadoria de fontes e uso responsável. A Axios registra que multimodelo tende a elevar custo e tempo de resposta, um trade-off natural quando o objetivo é precisão. O ganho real aparece quando Critique e Council são combinados com o contexto certo, dados internos governados e uma rotina de verificação posterior.

Mesmo com melhorias em exatidão factual, nenhum benchmark garante valor de negócio por si. A Computerworld chama atenção para o desafio de governança e complexidade operacional, já que o pipeline deixa de ser entrada e saída única e passa a ter rascunho, crítica, deliberação e síntese. É a evolução certa, mas pede maturidade de processos.

Quando usar Critique, quando usar Council

Use Critique quando o foco for precisão com tempo moderado. Exemplos, relatório de due diligence, política pública interna, resposta a RFP.
Use Council quando precisar de pluralidade de pontos de vista. Exemplos, análise de cenário, estudo de tecnologias emergentes sem consenso, avaliação de risco com variáveis qualitativas.
Evite Council em perguntas factuais simples ou com SLA apertado. Nesses casos, custo e latência não compensam.

Essas escolhas, sustentadas pelos dados de DRACO e pela própria arquitetura descrita pela Microsoft, aumentam a previsibilidade de qualidade sem transformar pesquisa em tarefa interminável.

Reflexões e insights

A chegada de Critique e Council ao Researcher marca uma virada na forma de entregar confiabilidade. Em vez de prometer que um único modelo fará tudo, a Microsoft estrutura papéis e põe modelos para checarem uns aos outros. Isso é mais realista e mais próximo de como equipes humanas trabalham em análises complexas.

Outra leitura importante é o caminho para diversidade de modelos. A fala pública de liderança da Microsoft aponta para um Copilot que seleciona e combina modelos de diferentes famílias, o que reduz riscos de lock-in tecnológico e permite aproveitar o que cada laboratório faz de melhor em momentos diferentes. Para o usuário final, isso se traduz em ganhos graduais de qualidade sem ter que reaprender ferramentas.

Conclusão

Critique e Council elevam o Researcher de um bom agente de pesquisa para um orquestrador de qualidade, com ganhos medidos e práticas claras de uso. A combinação de geração, revisão e comparação entre modelos entrega relatórios mais robustos, citados e prontos para decisão, especialmente quando a pergunta exige profundidade.

Para extrair o máximo, vale padronizar quando usar cada recurso, acompanhar latência e custos e alinhar com governança de dados. O futuro do Copilot, pelo que indicam Microsoft e imprensa, será cada vez mais multimodelo, pensado para equilibrar velocidade e rigor conforme o contexto de negócio.