Google Gemini lança Lyria 3, faixas de 30s, texto e imagens
O Google integrou o Lyria 3 ao app Gemini para gerar músicas de 30 segundos a partir de texto, fotos e vídeos, com capa personalizada, marca d'água SynthID e foco em uso criativo e responsável.
Danilo Gato
Autor
Introdução
Lyria 3 é o novo motor musical do Google dentro do app Gemini, capaz de gerar faixas de 30 segundos a partir de texto, imagens e até vídeos. O recurso estreou em beta em 18 de fevereiro de 2026 e foi anunciado oficialmente no blog do Google, com foco em expressão criativa rápida e compartilhável, não em produção musical profissional.
A novidade amplia o alcance de geração de mídia no ecossistema do Google. Além de transformar prompts em música com letras e vocais, o Gemini gera a capa automaticamente e incorpora a marca d’água SynthID no áudio para facilitar a verificação de procedência.
O texto a seguir explora o que muda com o Lyria 3 no Gemini, como funciona por baixo do capô, exemplos de uso, diretrizes de segurança e limitações, além do impacto para criadores, marcas e educação.
O que exatamente foi lançado no app Gemini
O Gemini recebeu um modo de criação musical em beta, alimentado pelo Lyria 3. As faixas têm 30 segundos, podem ser instrumentais ou com vocais e letras geradas a partir do prompt, e aceitam como ponto de partida uma descrição escrita, uma foto ou um vídeo curto. O Google destaca que a intenção é expressão pessoal divertida e rápida.
Segundo a página oficial do Lyria 3, o modelo foi treinado para entender musicalidade, do ritmo ao arranjo, com controles mais finos de estilo vocal e preferências acústicas, além de exportar áudio com qualidade de projeto. No app, a experiência é orientada por chat, com iterações sucessivas no mesmo fluxo.
Publicações especializadas confirmam que o acesso está sendo liberado gradualmente, com idioma e idade elegíveis, e que a funcionalidade aparece como uma ferramenta dedicada no menu do Gemini. Relatos apontam suporte inicial a oito idiomas, incluindo português, e restrição para maiores de 18 anos.
Como funciona, do prompt ao áudio final
O fluxo começa com um prompt simples, por exemplo, “faça um afrobeat divertido para celebrar um aniversário, com refrão marcante”. O Lyria 3 gera letra, melodia, acompanhamento e linha vocal com naturalidade de fraseado. Quem preferir pode subir uma imagem ou um clipe curto, e o sistema compõe algo que combine com o clima visual.
A página técnica do modelo destaca três ganhos sobre versões anteriores: não é preciso fornecer letra, há mais controle criativo sobre estilo, voz e tempo, e o resultado tende a ser mais realista e musicalmente complexo. Essa combinação reduz a distância entre ideia e execução, algo essencial para social clips, protótipos de trilhas e conteúdo educacional.
Do lado prático, cada faixa vem com uma capa gerada automaticamente por sistemas de imagem do Google, o que facilita o compartilhamento imediato por link ou download. Para criadores que publicam no Shorts, o Lyria 3 também se conecta ao Dream Track, ferramenta experimental que gera trilhas sob medida a partir de prompts curtos, com rotulagem apropriada de IA.
![Espectro e forma de onda de áudio, representando análise sonora]
Onde essa peça se encaixa no ecossistema do Google
A chegada do Lyria 3 ao app Gemini representa um passo além das demonstrações anteriores e da oferta corporativa em Vertex AI. Em 2025, a Google Cloud já testava o Lyria com lista de permissões dentro do portfólio de mídia generativa da plataforma. Agora, o usuário final tem um caminho direto para experimentar a tecnologia no smartphone, no desktop e no fluxo do chat.
O site oficial do recurso consolida as perguntas frequentes e confirma que a geração musical está disponível em países onde o app Gemini opera, com requisito mínimo de 18 anos. Há também instruções de uso, exemplos de prompts e uma galeria de templates para acelerar a criação.
Para quem atua em vídeo curto, o Dream Track no YouTube está sendo ampliado, com orientações na Central de Ajuda sobre como criar soundtracks de forma guiada no app do YouTube ou no YouTube Create. Os prompts têm limite de caracteres e passam por controles de segurança.
Segurança, direitos e verificação, o trio que sustenta a adoção
Dois pilares se destacam na estratégia do Google para IA generativa em música. Primeiro, a abordagem de não imitar artistas específicos, ainda que o sistema aceite referências amplas de estilo ou humor, somada a filtros que checam semelhança com conteúdos existentes. Segundo, a marca d’água SynthID embutida no áudio, invisível ao ouvido humano e resistente a operações comuns como compressão e alteração de velocidade.
O SynthID evoluiu para cobrir imagem, vídeo, texto e agora áudio, com um portal Detector em testes que permite verificar se um arquivo contém a marca d’água. No Gemini, também é possível enviar um arquivo e perguntar se foi gerado pela IA do Google, o que operacionaliza a verificação no dia a dia. Para marcas, agências e veículos, isso reduz risco reputacional e facilita compliance.
Além disso, o uso do recurso está coberto pelos Termos de Serviço e pelas políticas de uso proibido de IA generativa do Google, que vedam violações de propriedade intelectual e privacidade. Em ambientes Workspace, administradores podem controlar a ativação do app Gemini e das funcionalidades associadas, com rollout global iniciado em 18 de fevereiro de 2026.

Casos de uso que fazem sentido agora
- Social e influência. Entradas rápidas para criar trilhas memoráveis para Reels, Shorts e Stories, com letras pegajosas e estética coerente pela capa automática. Limites de 30 segundos funcionam como vantagem tática, já que forçam foco e evitam dispersão. Integração com Dream Track ajuda a publicar sem sair do ecossistema.
- Educação e edutainment. Professores podem pedir jingles sobre temas de aula, estudantes podem transformar fotos de experimentos em músicas explicativas, e disciplinas artísticas ganham um laboratório de arranjo e forma. A documentação do Lyria 3 enfatiza a coerência musical de começo a fim, o que suporta atividades didáticas.
- Marcas e commerce. Lojas e D2C podem gerar temas sazonais para páginas de campanha, vitrines digitais e pós compra. O SynthID facilita controle de procedência em ativações omnicanal.
- Protótipos e pitches. Produtores, podcasters e creators podem rascunhar trilhas-tema, efeitos de transição e variações de humor, validando direções criativas antes de encomendar produção profissional. Os controles de estilo, voz e tempo aceleram esse ciclo.
![Estúdio de áudio Dolby Atmos, simbolizando produção musical moderna]
Limitações atuais, pontos de atenção e comparação com rivais
A duração de 30 segundos atende a uso leve e social, porém limita quem precisa de trilhas longas ou stems separados. Publicações compararam o movimento ao que concorrentes em música generativa já oferecem, observando que o Google priorizou integração e segurança sobre amplitude de features profissionais. Para quem precisa de faixas inteiras, mixagem avançada ou exportações multitrilha, ferramentas dedicadas ainda serão necessárias.
Outro ponto é a expectativa do usuário. O Google detalha que a proposta não é substituir compositores nem simular artistas específicos, e que existem salvaguardas contra violações de direitos autorais. Prompts que peçam imitação direta podem ser bloqueados ou reinterpretados como inspiração ampla de gênero. Para muitos fluxos, isso é positivo, porque reduz risco e mantém a criação em “zona verde” para publicação.
A liberação por idioma, país e idade também influencia a adoção. Documentos oficiais apontam disponibilidade onde o app Gemini opera e exigência de 18 anos. Em domínios Workspace, o acesso depende de configuração do administrador e segue um cronograma de rollout de 1 a 3 dias de visibilidade.
Guia prático, prompts e ajustes que funcionam
- Parta do contexto. Descreva cenário, público e emoção desejada. Exemplo, “trilha lo fi otimista para vídeo de unboxing de tênis, bpm moderado, foco em teclas elétricas e baixo suave”. Essa riqueza semântica ajuda o Lyria 3 a traduzir intenção em estrutura musical coerente.
- Use imagens quando a vibe é difícil de verbalizar. Uma foto do produto, do evento ou do moodboard dá ao modelo uma âncora visual que se reflete na letra e nos timbres.
- Direcione voz e andamento. Indique preferências de timbre, tessitura, idioma do vocal e tempo aproximado. O Lyria 3 foi projetado para aceitar esse tipo de direção musical.
- Itere no chat. Ajuste letra, intensidade, instrumentos e camadas. A experiência dentro do Gemini acelera esse loop de feedback.
- Publique com rótulo claro. No Shorts, trilhas geradas por IA recebem indicação textual. Garanta descrições e créditos adequados para manter transparência e evitar dúvidas de direitos.
Impacto estratégico, por que isso importa
A entrada do Lyria 3 no app Gemini reduz o atrito entre ideia e entrega para música curta. Em marketing, reduz custos de prototipagem e multiplica versões para testes A B. Em educação, abre espaço para aulas mais imersivas. Em criação independente, dá poder de pré produção a quem não domina DAWs. E tudo isso com uma camada de verificabilidade nativa, algo que o mercado vinha pedindo com insistência.
Ao integrar música no mesmo fluxo onde já se geram imagens, vídeos e texto, o Google oferece um “hub” criativo coeso. Mesmo que outras plataformas tenham se movido mais cedo em certos aspectos, a abordagem de lançamento com guard rails e integração ao YouTube pode acelerar a adoção entre creators e marcas que priorizam segurança e alcance.
O que observar nos próximos meses
- Expansão de idiomas e países, junto com métricas de uso em Shorts e engajamento cruzado com Dream Track.
- Controles mais granulares, como escolha de forma de canto, variações de produção e possibilidades de remix com stems.
- Ferramentas de verificação ampliadas, com o portal SynthID Detector saindo de testes e integrações com plataformas de áudio para checagem de procedência em escala.
Conclusão
Lyria 3 no app Gemini coloca a geração musical ao alcance de qualquer pessoa, com 30 segundos que cabem no ritmo das redes e das ideias rápidas. Entre controles de estilo, letras automáticas e verificação via SynthID, o pacote equilibra diversão, segurança e praticidade. Para quem publica com frequência, é um aliado imediato para dar tom, cor e narrativa a vídeos curtos.
O caminho à frente deve incluir mais idiomas, integração mais profunda com o YouTube e melhorias nos controles de produção. Até lá, o recado é claro, experimentar sem medo, respeitar políticas e direitos, e usar a tecnologia como trampolim para boas histórias sonoras, ainda que curtas.
