Microfone em destaque simbolizando ditado por IA offline no iOS
Apps e IA

Google lança app de ditado por IA offline, AI Edge Eloquent, no iOS

AI Edge Eloquent chega ao iOS com reconhecimento de voz on-device, remoção de vícios de linguagem, modos de formatação e opção de polimento em nuvem com Gemini, gratuito e sem assinatura

Danilo Gato

Danilo Gato

Autor

7 de abril de 2026
10 min de leitura

Introdução

Em 6 de abril de 2026, a Google colocou no ar, sem alarde, o AI Edge Eloquent, um app de ditado por IA para iOS que funciona offline por padrão. A proposta é simples e ambiciosa ao mesmo tempo, transformar fala espontânea em texto pronto para uso, com limpeza automática de vícios de linguagem e recursos de edição instantânea, tudo rodando localmente. Esse é um movimento estratégico em um mercado aquecido por ferramentas como Wispr Flow, SuperWhisper e Willow.

Com modelos de reconhecimento de fala baseados em Gemma rodando no dispositivo, o Eloquent permite transcrever em tempo real e, ao pausar, aplica um pós-processamento que remove “hã”, “hum” e autocorreções no meio da frase. Também oferece modos de saída como Key points, Formal, Short e Long. Para quem quiser, existe um modo opcional de polimento em nuvem com Gemini, que atua apenas no refinamento textual.

O que muda com um ditado por IA realmente offline

O grande diferencial é o processamento local. O app baixa os modelos de ASR baseados em Gemma e passa a funcionar sem conexão, algo crítico para quem trabalha com dados sensíveis ou simplesmente não quer enviar voz para servidores remotos. Na prática, o fluxo é, falar, ver a transcrição ao vivo e, ao parar, receber um texto já limpo. Quando o usuário ativa o polimento em nuvem, a limpeza adicional de texto usa Gemini, mas a captura continua começando no dispositivo.

Além da privacidade, a abordagem offline reduz variações de latência e dependência de rede. Em ambientes corporativos, com Wi-Fi instável ou políticas rígidas de dados, isso evita gargalos e libera equipes para ditar relatórios, e-mails e atas com previsibilidade. Tecnologias edge assim ganham tração justamente por atacar o custo e a incerteza do round-trip com a nuvem. É a validação de que modelos on-device amadureceram, o que vários analistas vêm apontando desde o avanço das famílias Gemma e de SDKs de inferência móvel.

Como o AI Edge Eloquent funciona, do microfone ao texto pronto

  • Modelos locais, Gemma ASR, o app baixa um pacote de reconhecimento que roda no iPhone. A transcrição acontece em tempo real, com visualização de waveform.
  • Limpeza inteligente, ao pausar, o Eloquent remove vícios de linguagem como “um” e “ah” e corrige tropeços de fala, entregando um texto direto para colar.
  • Modos de saída, Key points, Formal, Short e Long para ajustar o resultado ao contexto, de um resumo executivo a um texto mais elaborado.
  • Dicionário pessoal, adição manual de nomes e jargões, com opção de importar termos frequentes do Gmail para melhorar a precisão em vocabulários específicos.
  • Histórico e métricas, busca em sessões anteriores, contagem total de palavras e velocidade em palavras por minuto, úteis para medir produtividade.

Essa combinação reduz o retrabalho que normalmente acompanha ditado bruto. Em vez de uma transcrição cheia de marcas de hesitação e frases quebradas, o usuário recebe um material já legível, economizando o tempo que seria gasto com correções.

![Microfone em destaque, representando ditado por voz]

Comparativo com rivais, preço, privacidade e alcance

O Eloquent mira um espaço hoje ocupado por Wispr Flow, SuperWhisper e Willow. Essas ferramentas ganharam tração por entregar qualidade de transcrição e, em alguns casos, recursos avançados de limpeza. O ataque da Google vem de dois lados, preço zero e processamento local robusto. Publicações que testaram e compilaram detalhes do app destacam que ele roda quase tudo offline, oferece polimento opcional em nuvem e não cobra assinatura, enquanto rivais costumam exigir pagamento recorrente.

  • Wispr Flow, presença em macOS, Windows e iOS, com integração por teclado no iPhone desde 2025, destaca-se pelo acesso em qualquer campo de texto. O Eloquent, por ora, limita-se ao iOS e ao próprio app, embora a descrição do App Store já tenha mencionado integração por teclado e uma referência a Android no horizonte.
  • SuperWhisper, popular entre quem prioriza local-first no Mac, cobra licença anual. O Eloquent entra sem custo, ponto sensível em 2026, quando muitos usuários já acumulam diversas assinaturas.
  • Willow, alternativa focada em clareza de texto, também fica no radar que a Google decidiu encarar com um pacote gratuito e polimento assistido por Gemini.

Resultado, empresas e indivíduos economizam assinatura e ganham um fluxo que respeita privacidade por padrão, com a possibilidade de acionar a nuvem apenas para lapidar texto. Para áreas reguladas, o modo offline integral elimina dúvidas sobre onde a voz é processada.

Experiência de uso, o que esperar na prática

Na primeira execução, o Eloquent solicita o download dos modelos de ASR. Depois, o microfone é aberto e a transcrição ao vivo aparece na tela, junto de uma waveform. O segredo está no pós-processamento ao pausar, quando o texto recebe limpeza automática e vai para a área de transferência, pronto para colar em e-mails, apps de notas ou mensageiros. Modos como Key points e Formal permitem ajustar ao tom e ao objetivo.

Para domínios técnicos, cadastro de termos e nomes próprios reduz erros, e a importação opcional de palavras do Gmail agiliza o aprendizado de vocabulário. O histórico facilita localizar uma transcrição antiga e as métricas ajudam a medir produtividade. Em tempo, a página do app no iOS já citou futuramente integração por teclado e até referência a Android, sinal de que a Google avalia expandir a superfície de uso além do app dedicado.

![Registro de áudio no smartphone, simbolizando captação de voz]

Onde o Eloquent se encaixa no seu fluxo de trabalho

  • Reuniões e alinhamentos, gravar, pausar e obter Key points em segundos para compartilhar com o time. O ganho está na redução de retrabalho de limpeza e formatação.
  • E-mails e comunicados, usar o modo Formal para transformar pensamento falado em redação mais polida, mantendo o conteúdo fiel ao que foi dito.
  • Produtividade pessoal, acompanhar palavras por minuto e volume total ajuda a medir hábito de ditado, algo subestimado na adoção de voz no dia a dia.
  • Ambientes sensíveis a dados, ativar o modo local-only e manter toda a fala no dispositivo atende requisitos de conformidade e políticas internas.

Na comparação com o ditado nativo do iOS, usuários frequentemente reclamam de erros de pontuação, vícios não removidos e necessidade de edição manual. O valor do Eloquent aparece exatamente aí, a limpeza automática de fluências naturais de fala. Ao mesmo tempo, ele preserva a opção de polimento adicional em nuvem, quando o usuário quer um texto ainda mais lapidado.

Limitações atuais e o que observar nos próximos meses

  • iOS primeiro, a decisão de lançar no iOS antes do Android foge do padrão da Google, o que reforça o caráter experimental e a busca por validação de mercado com público profissional que ditado atende bem. A menção a Android na descrição do App Store indica rota possível de expansão.
  • Integração por teclado, enquanto rivais como Wispr Flow já se integram em qualquer campo de texto no iPhone, o Eloquent ainda atua como app dedicado, com promessas de integração futura. Para uso intensivo, o atalho por teclado faz diferença.
  • Ecossistema e concorrência, em 2026, ditado com IA virou arena de diferenciação. O movimento da Google sinaliza que on-device virou padrão de referência para esse tipo de tarefa, reduzindo dependência de nuvem e custos recorrentes.

Benchmarks que importam para decidir adoção

Sem números oficiais publicados nesta estreia discreta, a avaliação prática deve focar em, tempo até começar a transcrever após abrir o app, qualidade da limpeza pós-pausa, principalmente remoção de muletas e correção de autointerrupções, fidelidade a nomes próprios e jargões, antes e depois de alimentar o dicionário, aderência aos modos Key points e Formal, se o resultado realmente poupa edição. Esses pontos definem se o Eloquent substitui ditado nativo e rivais pagos no seu cenário. As reportagens citadas descrevem bem os recursos, incluindo métricas e histórico, mas ainda não trazem medições padronizadas, algo natural nas primeiras 24 a 48 horas de lançamento.

Estratégia de produto, por que a Google está fazendo isso agora

Do lado da empresa, lançar um utilitário de voz totalmente operacional no iOS cria um laboratório real para validar o quanto modelos Gemma conseguem entregar em hardware Apple. Também prepara terreno para levar melhorias para Android e até integrar, no futuro, com teclado e recursos de sistema. A imprensa especializada já interpretou o Eloquent como um marco simbólico do momento em que a inferência on-device sai do nicho e vira alternativa prática à nuvem.

Na ótica de mercado, preço zero mais offline-first pressionam rivais com assinatura. Mesmo que algumas alternativas sigam à frente em integração ou recursos avançados de desktop, o custo total de propriedade muda rápido quando uma opção gratuita cobre 80 por cento dos casos. Isso vale em especial para freelancers, jornalistas, médicos e advogados que precisam de ditados rápidos, limpos e com controle de privacidade.

Recomendações práticas para testar o Eloquent

  • Começar pelo offline, baixar os modelos, desativar o modo em nuvem e avaliar a qualidade livre de qualquer latência ou oscilação de rede. Em seguida, ativar o polimento com Gemini e comparar resultados em textos longos e curtos.
  • Alimentar o dicionário, inserir nomes de clientes, termos técnicos e siglas. Se fizer sentido, ativar a importação opcional de termos do Gmail para turbinar a precisão sem esforço manual.
  • Medir ganho real, usar as métricas de palavras por minuto e contagem total ao longo de uma semana para entender se o fluxo de trabalho por voz está de fato rendendo mais do que digitação.
  • Planejar integração, acompanhar atualizações para recursos como teclado e, quando disponível, expandir o uso além do app. Usuários que vivem em editores de texto e chats ganham agilidade com um botão de ditado sempre à mão.

Cenário competitivo, o que as outras soluções ainda oferecem

  • Wispr Flow, suporte amplo de plataformas e um botão flutuante no Android para acesso instantâneo, pontos que a Google sinalizou querer igualar quando falou em integração por teclado e botão flutuante semelhante.
  • SuperWhisper, foco em local-first e qualidade, porém com custo anual e prioridades voltadas para o Mac. O Eloquent entra como opção gratuita para iPhone, reduzindo a barreira de entrada para quem quer testar voz como interface de produtividade.
  • Willow, ênfase em clareza de texto pronto para colar, segmento que o Eloquent quer ocupar com a limpeza automática de muletas e o polimento opcional via Gemini.

A mensagem implícita é clara, on-device primeiro, nuvem quando fizer sentido. Essa arquitetura deve pautar os próximos capítulos de ditado e assistentes de voz, em linha com a tendência de 2026 de aproximar IA do hardware do usuário.

Conclusão

O AI Edge Eloquent coloca a Google no jogo de ditado no iPhone com uma aposta certeira, processamento local, limpeza automática de fala e preço imbatível, zero. Ao manter a nuvem como opção e não como exigência, o app atende desde quem prioriza privacidade até quem quer o melhor polimento possível com Gemini. Se vierem as integrações prometidas, teclado e presença no Android, o pacote fica ainda mais competitivo.

Para profissionais e equipes, vale testar por uma semana focando em tarefas reais. Onde houver muito retrabalho no ditado atual, o Eloquent tende a mostrar valor rápido. No mínimo, redefine a régua do que um ditado por IA deve entregar em 2026, local-first, limpo por padrão e sem assinatura.

Tags

GoogleiOSASREdge AIprodutividade