Google lança app de ditado por IA offline, AI Edge Eloquent, no iOS
AI Edge Eloquent chega ao iOS com reconhecimento de voz on-device, remoção de vícios de linguagem, modos de formatação e opção de polimento em nuvem com Gemini, gratuito e sem assinatura
Danilo Gato
Autor
Introdução
Em 6 de abril de 2026, a Google colocou no ar, sem alarde, o AI Edge Eloquent, um app de ditado por IA para iOS que funciona offline por padrão. A proposta é simples e ambiciosa ao mesmo tempo, transformar fala espontânea em texto pronto para uso, com limpeza automática de vícios de linguagem e recursos de edição instantânea, tudo rodando localmente. Esse é um movimento estratégico em um mercado aquecido por ferramentas como Wispr Flow, SuperWhisper e Willow.
Com modelos de reconhecimento de fala baseados em Gemma rodando no dispositivo, o Eloquent permite transcrever em tempo real e, ao pausar, aplica um pós-processamento que remove “hã”, “hum” e autocorreções no meio da frase. Também oferece modos de saída como Key points, Formal, Short e Long. Para quem quiser, existe um modo opcional de polimento em nuvem com Gemini, que atua apenas no refinamento textual.
O que muda com um ditado por IA realmente offline
O grande diferencial é o processamento local. O app baixa os modelos de ASR baseados em Gemma e passa a funcionar sem conexão, algo crítico para quem trabalha com dados sensíveis ou simplesmente não quer enviar voz para servidores remotos. Na prática, o fluxo é, falar, ver a transcrição ao vivo e, ao parar, receber um texto já limpo. Quando o usuário ativa o polimento em nuvem, a limpeza adicional de texto usa Gemini, mas a captura continua começando no dispositivo.
Além da privacidade, a abordagem offline reduz variações de latência e dependência de rede. Em ambientes corporativos, com Wi-Fi instável ou políticas rígidas de dados, isso evita gargalos e libera equipes para ditar relatórios, e-mails e atas com previsibilidade. Tecnologias edge assim ganham tração justamente por atacar o custo e a incerteza do round-trip com a nuvem. É a validação de que modelos on-device amadureceram, o que vários analistas vêm apontando desde o avanço das famílias Gemma e de SDKs de inferência móvel.
Como o AI Edge Eloquent funciona, do microfone ao texto pronto
- Modelos locais, Gemma ASR, o app baixa um pacote de reconhecimento que roda no iPhone. A transcrição acontece em tempo real, com visualização de waveform.
- Limpeza inteligente, ao pausar, o Eloquent remove vícios de linguagem como “um” e “ah” e corrige tropeços de fala, entregando um texto direto para colar.
- Modos de saída, Key points, Formal, Short e Long para ajustar o resultado ao contexto, de um resumo executivo a um texto mais elaborado.
- Dicionário pessoal, adição manual de nomes e jargões, com opção de importar termos frequentes do Gmail para melhorar a precisão em vocabulários específicos.
- Histórico e métricas, busca em sessões anteriores, contagem total de palavras e velocidade em palavras por minuto, úteis para medir produtividade.
Essa combinação reduz o retrabalho que normalmente acompanha ditado bruto. Em vez de uma transcrição cheia de marcas de hesitação e frases quebradas, o usuário recebe um material já legível, economizando o tempo que seria gasto com correções.
![Microfone em destaque, representando ditado por voz]
Comparativo com rivais, preço, privacidade e alcance
O Eloquent mira um espaço hoje ocupado por Wispr Flow, SuperWhisper e Willow. Essas ferramentas ganharam tração por entregar qualidade de transcrição e, em alguns casos, recursos avançados de limpeza. O ataque da Google vem de dois lados, preço zero e processamento local robusto. Publicações que testaram e compilaram detalhes do app destacam que ele roda quase tudo offline, oferece polimento opcional em nuvem e não cobra assinatura, enquanto rivais costumam exigir pagamento recorrente.
- Wispr Flow, presença em macOS, Windows e iOS, com integração por teclado no iPhone desde 2025, destaca-se pelo acesso em qualquer campo de texto. O Eloquent, por ora, limita-se ao iOS e ao próprio app, embora a descrição do App Store já tenha mencionado integração por teclado e uma referência a Android no horizonte.
- SuperWhisper, popular entre quem prioriza local-first no Mac, cobra licença anual. O Eloquent entra sem custo, ponto sensível em 2026, quando muitos usuários já acumulam diversas assinaturas.
- Willow, alternativa focada em clareza de texto, também fica no radar que a Google decidiu encarar com um pacote gratuito e polimento assistido por Gemini.
Resultado, empresas e indivíduos economizam assinatura e ganham um fluxo que respeita privacidade por padrão, com a possibilidade de acionar a nuvem apenas para lapidar texto. Para áreas reguladas, o modo offline integral elimina dúvidas sobre onde a voz é processada.
Experiência de uso, o que esperar na prática
Na primeira execução, o Eloquent solicita o download dos modelos de ASR. Depois, o microfone é aberto e a transcrição ao vivo aparece na tela, junto de uma waveform. O segredo está no pós-processamento ao pausar, quando o texto recebe limpeza automática e vai para a área de transferência, pronto para colar em e-mails, apps de notas ou mensageiros. Modos como Key points e Formal permitem ajustar ao tom e ao objetivo.
Para domínios técnicos, cadastro de termos e nomes próprios reduz erros, e a importação opcional de palavras do Gmail agiliza o aprendizado de vocabulário. O histórico facilita localizar uma transcrição antiga e as métricas ajudam a medir produtividade. Em tempo, a página do app no iOS já citou futuramente integração por teclado e até referência a Android, sinal de que a Google avalia expandir a superfície de uso além do app dedicado.
![Registro de áudio no smartphone, simbolizando captação de voz]
Onde o Eloquent se encaixa no seu fluxo de trabalho
- Reuniões e alinhamentos, gravar, pausar e obter Key points em segundos para compartilhar com o time. O ganho está na redução de retrabalho de limpeza e formatação.
- E-mails e comunicados, usar o modo Formal para transformar pensamento falado em redação mais polida, mantendo o conteúdo fiel ao que foi dito.
- Produtividade pessoal, acompanhar palavras por minuto e volume total ajuda a medir hábito de ditado, algo subestimado na adoção de voz no dia a dia.
- Ambientes sensíveis a dados, ativar o modo local-only e manter toda a fala no dispositivo atende requisitos de conformidade e políticas internas.
Na comparação com o ditado nativo do iOS, usuários frequentemente reclamam de erros de pontuação, vícios não removidos e necessidade de edição manual. O valor do Eloquent aparece exatamente aí, a limpeza automática de fluências naturais de fala. Ao mesmo tempo, ele preserva a opção de polimento adicional em nuvem, quando o usuário quer um texto ainda mais lapidado.
Limitações atuais e o que observar nos próximos meses
- iOS primeiro, a decisão de lançar no iOS antes do Android foge do padrão da Google, o que reforça o caráter experimental e a busca por validação de mercado com público profissional que ditado atende bem. A menção a Android na descrição do App Store indica rota possível de expansão.
- Integração por teclado, enquanto rivais como Wispr Flow já se integram em qualquer campo de texto no iPhone, o Eloquent ainda atua como app dedicado, com promessas de integração futura. Para uso intensivo, o atalho por teclado faz diferença.
- Ecossistema e concorrência, em 2026, ditado com IA virou arena de diferenciação. O movimento da Google sinaliza que on-device virou padrão de referência para esse tipo de tarefa, reduzindo dependência de nuvem e custos recorrentes.
Benchmarks que importam para decidir adoção
Sem números oficiais publicados nesta estreia discreta, a avaliação prática deve focar em, tempo até começar a transcrever após abrir o app, qualidade da limpeza pós-pausa, principalmente remoção de muletas e correção de autointerrupções, fidelidade a nomes próprios e jargões, antes e depois de alimentar o dicionário, aderência aos modos Key points e Formal, se o resultado realmente poupa edição. Esses pontos definem se o Eloquent substitui ditado nativo e rivais pagos no seu cenário. As reportagens citadas descrevem bem os recursos, incluindo métricas e histórico, mas ainda não trazem medições padronizadas, algo natural nas primeiras 24 a 48 horas de lançamento.
Estratégia de produto, por que a Google está fazendo isso agora
Do lado da empresa, lançar um utilitário de voz totalmente operacional no iOS cria um laboratório real para validar o quanto modelos Gemma conseguem entregar em hardware Apple. Também prepara terreno para levar melhorias para Android e até integrar, no futuro, com teclado e recursos de sistema. A imprensa especializada já interpretou o Eloquent como um marco simbólico do momento em que a inferência on-device sai do nicho e vira alternativa prática à nuvem.
Na ótica de mercado, preço zero mais offline-first pressionam rivais com assinatura. Mesmo que algumas alternativas sigam à frente em integração ou recursos avançados de desktop, o custo total de propriedade muda rápido quando uma opção gratuita cobre 80 por cento dos casos. Isso vale em especial para freelancers, jornalistas, médicos e advogados que precisam de ditados rápidos, limpos e com controle de privacidade.
Recomendações práticas para testar o Eloquent
- Começar pelo offline, baixar os modelos, desativar o modo em nuvem e avaliar a qualidade livre de qualquer latência ou oscilação de rede. Em seguida, ativar o polimento com Gemini e comparar resultados em textos longos e curtos.
- Alimentar o dicionário, inserir nomes de clientes, termos técnicos e siglas. Se fizer sentido, ativar a importação opcional de termos do Gmail para turbinar a precisão sem esforço manual.
- Medir ganho real, usar as métricas de palavras por minuto e contagem total ao longo de uma semana para entender se o fluxo de trabalho por voz está de fato rendendo mais do que digitação.
- Planejar integração, acompanhar atualizações para recursos como teclado e, quando disponível, expandir o uso além do app. Usuários que vivem em editores de texto e chats ganham agilidade com um botão de ditado sempre à mão.
Cenário competitivo, o que as outras soluções ainda oferecem
- Wispr Flow, suporte amplo de plataformas e um botão flutuante no Android para acesso instantâneo, pontos que a Google sinalizou querer igualar quando falou em integração por teclado e botão flutuante semelhante.
- SuperWhisper, foco em local-first e qualidade, porém com custo anual e prioridades voltadas para o Mac. O Eloquent entra como opção gratuita para iPhone, reduzindo a barreira de entrada para quem quer testar voz como interface de produtividade.
- Willow, ênfase em clareza de texto pronto para colar, segmento que o Eloquent quer ocupar com a limpeza automática de muletas e o polimento opcional via Gemini.
A mensagem implícita é clara, on-device primeiro, nuvem quando fizer sentido. Essa arquitetura deve pautar os próximos capítulos de ditado e assistentes de voz, em linha com a tendência de 2026 de aproximar IA do hardware do usuário.
Conclusão
O AI Edge Eloquent coloca a Google no jogo de ditado no iPhone com uma aposta certeira, processamento local, limpeza automática de fala e preço imbatível, zero. Ao manter a nuvem como opção e não como exigência, o app atende desde quem prioriza privacidade até quem quer o melhor polimento possível com Gemini. Se vierem as integrações prometidas, teclado e presença no Android, o pacote fica ainda mais competitivo.
Para profissionais e equipes, vale testar por uma semana focando em tarefas reais. Onde houver muito retrabalho no ditado atual, o Eloquent tende a mostrar valor rápido. No mínimo, redefine a régua do que um ditado por IA deve entregar em 2026, local-first, limpo por padrão e sem assinatura.
