Ilustração abstrata de IA e segurança representando o Projeto Glasswing da Anthropic
Cibersegurança

Glasswing Anthropic acha 10 mil+ vulnerabilidades críticas

Anthropic detalha como o Projeto Glasswing, usando o modelo Mythos Preview, acelerou a descoberta e a validação de falhas críticas em software essencial, com impacto direto na velocidade de correções

Danilo Gato

Danilo Gato

Autor

23 de maio de 2026
9 min de leitura

Introdução

O Projeto Glasswing da Anthropic reporta mais de 10 mil vulnerabilidades críticas ou de alta severidade encontradas com apoio do modelo Mythos Preview, em apenas semanas de colaboração com cerca de 50 parceiros, segundo atualização de 22 de maio de 2026 da própria empresa fonte. O anúncio posiciona o esforço como um divisor de águas na segurança de software, com implicações para provedores de infraestrutura, navegadores, bibliotecas criptográficas e cadeias de supply chain.

A relevância aparece nos números e na diversidade de evidências públicas. Cloudflare, Mozilla, o AI Security Institute do Reino Unido e a plataforma XBOW publicaram medições independentes que corroboram ganhos de escala e de precisão em caça a bugs, além de efeitos colaterais positivos no ritmo de correções de grandes fornecedores como Palo Alto Networks, Microsoft e Oracle fonte, fonte, fonte, fonte, fonte, fonte, fonte, fonte, fonte.

Este artigo aprofunda o que o Glasswing é, como o Mythos Preview performa em cenários reais, o que muda no ciclo de vida de vulnerabilidades, e quais práticas práticas adotar já. A palavra de ordem é equilíbrio, aproveitar o salto de capacidade de descoberta sem sobrecarregar triagem, divulgação e patching.

O que é o Projeto Glasswing e por que importa

O Projeto Glasswing foi lançado para proteger software crítico de forma proativa antes que agentes maliciosos explorem modelos de IA cada vez mais capazes fonte. A atualização de 22 de maio de 2026 apresenta uma linha do tempo curta, porém contundente. Em poucas semanas, parceiros encontraram milhares de falhas classificadas como críticas ou de alta severidade, e a dificuldade deixou de ser descobrir bugs, passou a ser confirmar, divulgar e corrigir em tempo hábil.

Pontos-chave do anúncio da Anthropic, com dados públicos associados:

  • Escala de achados, mais de 10 mil vulnerabilidades críticas ou altas entre cerca de 50 parceiros, com alguns relatando aumento superior a 10 vezes na taxa de descoberta fonte.
  • Evidência de parceiros, a Cloudflare divulgou 2 mil bugs encontrados, sendo 400 de alta ou crítica, com taxa de falso positivo menor que a de testadores humanos segundo a equipe da empresa fonte.
  • Validação independente, o AI Security Institute do Reino Unido reportou que o Mythos Preview foi o primeiro modelo a resolver de ponta a ponta as duas cyber ranges da instituição fonte. A XBOW descreveu ganhos substanciais em benchmarks de exploração na web com precisão sem precedentes por token fonte.
  • Impacto em fornecedores, lançamentos recentes da Palo Alto Networks tiveram mais que 5 vezes o número habitual de patches, a Microsoft projeta volumes maiores por algum tempo, e a Oracle relata aceleração múltipla na detecção e correção fonte, fonte, fonte.

A mensagem central, a fronteira de segurança movida por IA está menos limitada por descoberta e mais por capacidade humana e processual de triagem, comunicação e atualização segura em escala. Em outras palavras, o gargalo migrou.

Como o Mythos Preview performa em campo

Dois estudos de caso públicos ajudam a calibrar expectativas. Primeiro, a Mozilla relatou o endurecimento do Firefox durante testes com o Mythos Preview. No ciclo do Firefox 150, a equipe encontrou e corrigiu 271 vulnerabilidades, mais de 10 vezes o total encontrado no Firefox 148 usando outra configuração de modelo, o que indica salto de produtividade e cobertura fonte, fonte.

Segundo, a Cloudflare publicou um balanço sobre a colaboração no Glasswing, relatando 2 mil bugs, dos quais 400 de alta ou crítica, e destacando uma taxa de falso positivo melhor do que a de investigadores humanos em seus ambientes críticos fonte. Em paralelo, a XBOW comparou o Mythos Preview a outros modelos em benchmark próprio de exploração na web, descrevendo ganhos significativos e precisão token a token incomum fonte.

Complementando, o AI Security Institute pontuou que o modelo foi o primeiro a concluir com sucesso duas trilhas completas de exercícios de ataque multietapas em seus ambientes controlados, um indicativo de planejamento e execução mais robustos fonte.

Esses dados não afirmam onipotência de modelo. Eles sugerem, com base em validações cruzadas, que modelos de classe Mythos elevam substancialmente a velocidade de descoberta, a qualidade dos achados e a capacidade de encadear passos complexos, algo que se traduz em menos tempo de exposição caso o pipeline de triagem e patching acompanhe o ritmo.

![Ilustração de IA em segurança cibernética]

Open source em foco, escala e taxa de verdade

A Anthropic relata a varredura de mais de mil projetos open source com o Mythos Preview, totalizando 23.019 achados, dos quais 6.202 estimados como de alta ou crítica. Entre os 1.752 de alta ou crítica avaliados por seis empresas independentes de pesquisa de segurança, 90,6 por cento foram confirmados como verdadeiros, e 62,4 por cento mantiveram a severidade alta ou crítica após a revisão. O time projeta cerca de 3.900 vulnerabilidades de alta ou crítica validadas ao final da triagem atual, além do que foi encontrado junto aos parceiros do Glasswing fonte.

Um exemplo público, o Mythos Preview detectou e demonstrou exploração em uma falha do wolfSSL que possibilitava a falsificação de certificados, criando condições para phishing avançado contra serviços bancários ou de email. O problema foi corrigido e recebeu o identificador CVE-2026-5194, com detalhamento técnico prometido para divulgação futura fonte, fonte, fonte.

Reflexão útil aqui, ganhos de velocidade expõem outra fragilidade, a capacidade humana, a governança de disclosure e a automação de patch management. A Anthropic divulga inclusive um painel público de acompanhamento do funil de disclosure, registrando a queda esperada de volume em cada etapa, do achado à correção publicada fonte.

O gargalo mudou, o que fazer agora

A Anthropic recomenda encurtar ciclos de patch e facilitar atualizações para usuários finais, enquanto defensores de rede aceleram testes e implantação de correções, complementando com controles críticos alinhados a NIST e NCSC, como hardening de configurações padrão, MFA rigoroso e logging abrangente fonte. Na prática, há quatro movimentos que equipes podem iniciar hoje:

  1. Priorizar patching orientado a risco e janela de exposição, reduzir filas, elevar cadência semanal, e adotar canários e ramp-ups mais agressivos em correções de alta severidade.
  2. Padronizar triagem com automação, usar runbooks claros de validação, agrupar duplicatas e consolidar relatórios em lote para reduzir idas e vindas com maintainers.
  3. Ampliar telemetria e detecção, ativar MFA em todos os domínios, centralizar logs e retenção suficiente para investigação, com testes contínuos do pipeline de resposta.
  4. Revisar superfícies críticas, bibliotecas criptográficas, caminhos de autenticação e parsing são alvos frequentes, reforçar fuzzing e análise estática combinada com modelos.

Atualizações recentes de fornecedores sugerem que a indústria já está respondendo, com aumentos expressivos de volume de patches, como detalhado por Palo Alto Networks, Microsoft e Oracle fonte, fonte, fonte.

Ferramentas e programas que já podem ajudar

Enquanto os modelos de classe Mythos não são liberados ao público por questões de salvaguardas, a Anthropic destaca três frentes complementares já disponíveis ou em acesso qualificado fonte:

  • Claude Security em beta público para clientes Enterprise, escaneia bases de código e propõe correções, com relato de mais de 2.100 vulnerabilidades corrigidas em três semanas usando Claude Opus 4.7 fonte.
  • Cyber Verification Program, flexibiliza salvaguardas para profissionais de segurança em usos legítimos de pesquisa de vulnerabilidades e red teaming fonte.
  • Liberação sob demanda de artefatos e fluxos usados com Mythos Preview, incluindo skills compartilhadas, harness para mapeamento e triagem, e gerador de threat model. A Cisco, parceira do Glasswing, publicou a Foundry Security Spec para apoiar avaliadores a estruturarem medições semelhantes às internas da empresa fonte.

No ecossistema open source, a parceria com o projeto Alpha Omega da OpenSSF objetiva ampliar a capacidade de maintainers no processamento e triagem de relatórios, com financiamento adicional anunciado pela Linux Foundation em março de 2026, o que pode aliviar gargalos em repositórios críticos fonte, fonte.

![Código e análise de vulnerabilidades]

Benchmarks, limites e expectativas realistas

Benchmarks acadêmicos recentes, como ExploitBench e ExploitGym, têm mostrado o Mythos Preview no topo de tabelas em tarefas associadas a desenvolvimento de exploits e orquestração de passos de ataque. Esses resultados, somados a testes controlados do AI Security Institute, indicam um novo patamar de capacidade ofensiva e defensiva viabilizada por IA fonte, fonte, fonte, fonte.

Expectativa realista, modelos ajudam a encontrar mais e melhor, mas o ganho líquido de segurança depende da capacidade de priorizar, de comunicar com responsáveis por manutenção e de implantar patches sem regressões. Em maintainers voluntários, a Anthropic registra pedidos para reduzir o ritmo de disclosure, em razão de restrições de capacidade. A média reportada para corrigir bugs de alta ou crítica no open source é de cerca de duas semanas, o que exige coordenação cuidadosa e comunicação transparente fonte.

Aplicações práticas imediatas para times de produto e segurança

  • Definir SLOs de segurança por severidade, tempo alvo para triagem inicial, confirmação, correção e rollout, com alarmes automáticos quando prazos são excedidos.
  • Integrar varreduras assistidas por modelos no CI, com gates condicionais a criticidade e impacto, e rotas de exceção bem documentadas.
  • Orquestrar fuzzing, SAST e checagens guiadas por agentes, com priorização por threat modeling vivo. O harness descrito pela Anthropic sugere que subagentes dedicados a mapas de código e triagem elevam rendimento fonte.
  • Acelerar canais de atualização, reduzir atrito para usuários finais, e aumentar insistência com bases desatualizadas em versões com CVEs de alta severidade.
  • Fortalecer controles perimetrais independentes de patch, MFA em todo lugar, hardening default, e logging abrangente, alinhados a práticas de NIST e NCSC fonte.

Riscos, governança e a linha de chegada

Há um paradoxo temporário. Vulnerabilidades passam a ser descobertas mais rápido do que são corrigidas, o que cria janelas de risco se processos não forem atualizados. A Anthropic afirma que ainda não há salvaguardas suficientemente robustas para liberar modelos classe Mythos de forma ampla, por risco de abuso. Enquanto isso, o Glasswing prioriza proteger software sistêmico e escalar ferramentas defensivas fonte.

Para governança, o recado é investir em capacidade de triagem, coordenação de disclosure e automação de patches. E medir tudo, do backlog de vulnerabilidades por severidade ao tempo de exposição em produção. O objetivo é reduzir o delta entre descoberta e correção, mantendo qualidade e confiabilidade.

Conclusão

O Projeto Glasswing da Anthropic muda o equilíbrio entre ataque e defesa. Em maio de 2026, com evidências públicas de Cloudflare, Mozilla, AI Security Institute e XBOW, o quadro é claro, modelos avançados como o Mythos Preview aceleram a descoberta de vulnerabilidades e elevam a precisão. A resposta efetiva depende de times encurtarem ciclos de patch, ampliarem automação e fortalecerem controles independentes de atualização fonte, fonte, fonte, fonte, fonte.

Oportunidade e responsabilidade caminham juntas. O benefício duradouro virá quando a indústria transformar ganhos de descoberta em ciclos de correção mais curtos, índices de exposição menores e software mais resiliente. O caminho está traçado, e a decisão agora está na execução diária em engenharia e segurança.

Tags

AnthropicIA aplicadaDevSecOps