ExaAILabs lança busca semântica de pessoas para 1B+
Exa People Search promete precisão e escala com 1B+ perfis indexados, híbrido de embeddings e busca neural, e foco em vendas, recrutamento e pesquisa
Danilo Gato
Autor
Introdução
A busca semântica de pessoas chegou ao mercado com escala de 1B+ perfis e proposta de uso em produção. A Exa People Search, lançada pela ExaAILabs, combina embeddings ajustados e um sistema híbrido de recuperação para responder a consultas por cargo, habilidade, empresa e localização, com foco em vendas, recrutamento e pesquisa. O anúncio oficial detalha que a nova categoria people no API substitui a categoria linkedin, oferecendo cobertura mais ampla da web e qualidade superior para localizar perfis profissionais.
A palavra-chave aqui é busca semântica de pessoas. Além do volume, há ritmo de atualização agressivo, com pipeline preparado para mais de 50 milhões de updates por semana, e um benchmark público que documenta a metodologia de avaliação. Esses pontos posicionam a Exa como uma infraestrutura de busca para aplicações de IA que precisam de grounding confiável e dados frescos.
Este artigo traz os fatos essenciais do lançamento, explica os mecanismos técnicos de forma acessível, compara com movimentos recentes do setor, e mostra como operacionalizar a Exa People Search no dia a dia, de SDRs a talent acquisition, com exemplos práticos e recomendações de implementação.
O que a Exa lançou, em termos práticos
A Exa People Search é uma vertical de busca focada em perfis profissionais, exposta via API e dashboard, que entende consultas de linguagem natural como “VP de Produto na Microsoft em EMEA” e retorna perfis relevantes com metadados acionáveis. A Exa declara ter indexado mais de 1 bilhão de perfis públicos e treinado um sistema híbrido, combinando embeddings finamente ajustados e o mecanismo Exa Search para melhorar precisão em consultas por função, habilidades e empresa.
Na prática, isso significa ir além de um único domínio, com cobertura de perfis espalhados pela web. O movimento vem acompanhado de uma mudança de produto, com a categoria linkedin sendo substituída por people, a fim de ampliar o escopo e melhorar a qualidade para esse tipo de busca.
O blog técnico da empresa acrescenta que, para sustentar volume e frescor, o pipeline de ingestão foi desenhado para mais de 50 milhões de atualizações semanais, e que a equipe disponibilizou um benchmark aberto com dataset parcial e um harness de avaliação para reprodução. Esses elementos permitem que times técnicos validem ganhos de precisão e relevância no seu próprio contexto.
Como funciona a busca semântica de pessoas
No núcleo, a proposta é híbrida. Embeddings ajustados especificamente para people search capturam o significado de consultas como “engenheiros de segurança senior em Austin com experiência em Kubernetes”, enquanto o motor de recuperação da Exa organiza, ranqueia e valida os resultados. Em cenários de descoberta, onde não existe uma única resposta correta, a avaliação usa um juiz LLM para verificar se o conteúdo da página realmente corresponde aos critérios da consulta. Em cenários de lookup, como quando se busca uma pessoa específica, métricas clássicas de recuperação como recall@k e NDCG são empregadas.
O API da Exa expõe filtros de categoria que agora incluem people, ao lado de outras verticais como company, research paper, news e github. O endpoint de busca documenta parâmetros como numResults, includeDomains e excludeDomains, além de userLocation, que podem ajudar a orientar a relevância regional. Para ativar a nova vertical, basta definir category=“people” na chamada.
Em termos de experiência, a Exa destaca casos de uso como “VP of Product at Microsoft” e “enterprise sales reps from Microsoft in EMEA”, mapeando as situações mais comuns observadas nas análises de 10 mil consultas históricas que inspiraram o desenho do benchmark: busca por função, descoberta por habilidade e geografia, e lookup de indivíduo específico.
![Visualização de rede social com clusters]
Por que isso importa agora
O mercado está migrando de buscas puramente lexicais para buscas semânticas, guiadas por intenção e contexto. LinkedIn, por exemplo, anunciou recursos de people search com linguagem natural que consideram relevância e utilidade dentro da sua rede de 1,3 bilhão de membros. A ideia é sugerir especialistas mesmo quando o perfil não contém exatamente a palavra-chave buscada, e a disponibilização tem ocorrido de forma gradual, começando por assinantes Premium nos Estados Unidos.
A diferença estratégica da Exa é mirar a web aberta e oferecer um motor de busca construído para IA, não para navegação humana. Em outras palavras, trata-se de infraestrutura para grounding, RAG e agentes, com privacidade, ZDR e contratos empresariais, além de uma cadência de atualização pensada para produção. O objetivo declarado da empresa é ser o motor de busca para aplicações de IA, movimento sustentado por financiamento Série B anunciado em 2025, que ampliou cluster de GPUs e escopo de indexação.
Essa combinação, cobertura ampla e API orientada a IA, cria oportunidades para automação de prospecção, mapeamento de talentos e inteligência de mercado, com respostas frescas e contextualizadas. Para times de produto, viabiliza features como enriquecimento de perfis, deduplicação e roteamento de leads baseado em critérios semânticos.
Casos de uso, do pitch à prática
- Vendas B2B e SDRs: consultas como “account executives enterprise com experiência em segurança na Bay Area” ou “líderes de procurement em bancos médios no Texas” retornam perfis que atendem a critérios compostos. Combinado com enrichment programático, dá para acionar cadências personalizadas por setor e maturidade do comprador.
- Recrutamento e talent sourcing: busca por “engenheiros de dados senior em Toronto com Spark e Delta Lake”, seguida de enriquecimento de histórico e links a portfólios, acelera triagem e evita dependência de um único diretório.
- Pesquisa competitiva e due diligence: localizar “fundadores de startups de biotecnologia pré-série A em Boston com publicações recentes” permite varreduras temáticas, cruzando sinais de conteúdo, empresa e pessoa.
Para quem precisa orquestrar isso em pipelines, já existem integrações de automação como um Actor do Apify que consome o People Search da Exa e exporta resultados com URLs e imagens de perfil. Isso facilita rodar jobs de alto volume com controle de custos baseado no uso do API.
Começando a usar, passo a passo
- Crie sua chave no dashboard da Exa e habilite o endpoint de search.
- Troque a antiga categoria linkedin por people nas suas queries.
- Valide relevância com um conjunto de consultas frequentes do seu negócio. Use o benchmark aberto da Exa como referência metodológica, especialmente para casos de descoberta onde múltiplas respostas podem ser corretas.
- Ajuste filtros como includeDomains quando for necessário restringir a busca a fontes específicas, como sites corporativos ou repositórios técnicos.
- Integre ao CRM ou ATS para enriquecer leads e candidaturas com dados de perfil e URLs de referência, garantindo conformidade com políticas internas e de fornecedores.
Exemplo mínimo em cURL para consulta por pessoas, com categoria people e limite de resultados configurável:
curl -X POST https://api.exa.ai/search \
-H "x-api-key: $EXA_API_KEY" \
-H "Content-Type: application/json" \
-d '{
"query": "VP of Product at Microsoft in EMEA",
"category": "people",
"numResults": 10
}'
A documentação da referência detalha parâmetros, limites e categorias suportadas. Vale também explorar o playground para depurar a qualidade das respostas antes de partir para automação pesada.
![Conceito de IA, cérebro e circuitos]
Métricas, qualidade e governança
O anúncio oficial explicita dois cenários de avaliação. Para lookups, valem métricas clássicas de recuperação. Para descoberta, onde a resposta é um conjunto de candidatos, a validação usa um juiz LLM que lê o conteúdo da página e verifica se os critérios foram atendidos. Essa separação é importante para evitar medir maçãs com laranjas e para orientar escolhas de threshold, k e reranking por tipo de tarefa.
Além disso, o pipeline de ingestão preparado para 50 milhões de atualizações por semana é um indicador de frescor e cobertura, útil para times que dependem de sinais recentes, como mudanças de cargo, novos sites pessoais ou publicações. No edge empresarial, a Exa divulga postura de segurança com SOC 2 Type II e ofertas de Zero Data Retention, fatores que pesam para adoção em setores regulados.
Do ponto de vista de governança, dois pontos merecem atenção. Primeiro, políticas de origem dos dados e respeito a termos de uso dos sites indexados. Segundo, a gestão de consentimento e preferências de contato quando o uso envolve outbound. A boa prática é usar os resultados como sinal para pesquisa e qualificação, e manter processos de compliance para contato e armazenamento.
Comparando com o restante do mercado
- Redes fechadas: LinkedIn evoluiu a busca para consultas em linguagem natural, com rollout gradual para 1,3 bilhão de membros, e ênfase em utilidade baseada na rede do usuário. É poderoso para quem opera dentro do ecossistema LinkedIn e valoriza relações de 1º e 2º grau.
- Web aberta orientada a IA: Exa posiciona-se como um motor de busca para agentes e RAG que precisam de dados da web ampla. O ganho é abrangência de fontes e automação via API, com categorias e filtros que se encaixam em fluxos de pesquisa e enriquecimento.
Em termos de trade-offs, o LinkedIn tem profundidade na sua própria rede e sinais proprietários, enquanto a Exa disputa no território da cobertura e utilidade programável. Dependendo do cenário, times podem combinar ambos, usando Exa para descoberta ampla e LinkedIn para ativação e relacionamento.
Boas práticas de implementação
- Defina intenções claras por tipo de consulta. Para descoberta, aceite múltiplas respostas corretas e use reranking por critérios do negócio, como senioridade ou setor. Para lookup, ajuste k e filtros para maximizar recall.
- Evite depender de um único domínio. A categoria people foi desenhada justamente para ampliar cobertura além de LinkedIn. Combine com includeDomains quando houver necessidade de restringir o escopo, por exemplo, a domínios acadêmicos ou corporativos.
- Monitore drift de dados. Use amostras semanais das principais consultas do seu time para checar estabilidade de precisão e latência. A cadência de updates anunciada sugere variação constante no índice, o que é positivo para frescor, porém exige observabilidade.
- Automatize com responsabilidade. Se optar por scraping ou enrichment externo, valide licenças e termos de uso. Uma opção é usar integrações prontas que já tratam paginação e exportação, como o Actor do Apify para Exa People Search.
Limitações e pontos de atenção
- Ground truth descentralizado. Na web aberta, nem todo perfil está atualizado, e diferentes páginas podem descrever a mesma pessoa com divergências. O uso de múltiplas fontes, deduplicação e heurísticas de confiança melhora precisão.
- Avaliação com LLM. Embora útil para descoberta, juízes LLM podem introduzir vieses. Métricas automáticas devem ser auditadas com amostras manuais, especialmente em aplicações sensíveis como triagem de talentos.
- Custos e quotas. Configure limites de resultados, caching e reuso de consultas frequentes para controlar orçamento. O endpoint documenta limites por tipo de busca e recomenda contato com vendas para necessidades acima do padrão.
O que observar nos próximos meses
A adoção desta classe de produto tende a acelerar com a consolidação de agentes autônomos e RAG transacional. Espera-se ver mais benchmarks públicos, métricas cruzadas por setor e melhorias na extração de atributos estruturados, como senioridade e stack tecnológico. No ecossistema Exa, vale acompanhar a evolução de categorias e a expansão de Websets para workflows prontos de pesquisa, prospecção e recruiting, já posicionados em páginas de produto.
Conclusão
A Exa People Search sinaliza um passo importante no uso de busca semântica de pessoas em escala, com 1B+ perfis, atualização semanal massiva e um benchmark público que dá transparência à qualidade. Para equipes de vendas, recrutamento e pesquisa, o ganho é transformar consultas naturais em listas acionáveis, com uma API pensada para integração real em produtos e processos.
O cenário competitivo se move rápido. Enquanto redes fechadas evoluem a experiência do usuário final, motores como a Exa desenham infraestrutura para IA que consome a web ampla. O melhor caminho é pragmático, testar com suas consultas, medir com suas métricas e escolher a combinação de ferramentas que entrega resultados com governança e custos sob controle.
