Logotipo HTML5 em laranja e branco, base do fluxo do HyperFrames
Tecnologia

HeyGen abre HyperFrames, HTML para MP4 nativo no Claude Code

HeyGen libera o HyperFrames como open source, um framework HTML para MP4 pensado para agentes de IA, com skills e fluxo agent-first integrados ao Claude Code, além de renderização determinística e aceleração por GPU.

Danilo Gato

Danilo Gato

Autor

17 de abril de 2026
8 min de leitura

Introdução

HeyGen HyperFrames foi aberto como código livre e colocou a criação de vídeo com IA de volta ao terreno mais familiar dos desenvolvedores, o HTML. A proposta é simples, usar HTML como fonte de verdade para composições e entregar MP4 determinístico, com um fluxo agent-native para Claude Code e outros agentes. Isso reduz o atrito entre ideia, automação e exportação final, mantendo controle sobre tempo, trilhas e assets.

A novidade importa porque equipes já usam agentes para escrever código e montar materiais. Com HyperFrames, o mesmo agente passa a orquestrar composições em HTML, pré-visualizar no navegador e renderizar MP4 com pipeline FFmpeg, inclusive dentro de Docker para saídas idênticas em qualquer máquina.

O artigo explora como o HyperFrames funciona, o que muda no dia a dia com Claude Code, os recursos de renderização e player, os blocos prontos do catálogo, além de uma comparação prática com alternativas como Remotion e Motion Canvas.

O que é o HeyGen HyperFrames e por que é agent-native

HyperFrames é um framework de vídeo que usa HTML como formato de autoria. Elementos de mídia e layout ganham data-attributes para temporização e organização por trilhas, enquanto uma timeline GSAP coordena play, pause, seek e sincronização. O resultado pode ser pré-visualizado no browser e renderizado para MP4 de forma determinística.

A arquitetura foi desenhada para agentes. As skills do HyperFrames “ensinam” Claude Code, Cursor, Gemini CLI e afins a produzir composições corretas, com comandos slash para criar blocos, animar e invocar o CLI. Essa camada de conhecimento reduz alucinações e acelera iterações no prompt, inclusive a partir de repositórios, PDFs ou CSVs.

Exemplo de fluxo com agente:

  • Instalar as skills e descrever o vídeo desejado.
  • O agente cria a composição HTML com data-attributes, referencia assets e timeline.
  • Pré-visualizar localmente, ajustar prompts e parâmetros, depois renderizar MP4.

Esse design diminui o overhead de traduzir “componentes” de frameworks para um DSL de vídeo, já que agentes dominam HTML nativamente.

Como o HyperFrames rende MP4 de forma determinística

O pacote Producer combina captura de frames via Engine e codificação via FFmpeg para entregar uma pipeline completa HTML para vídeo. Suporta MP4, codec H.264, e WebM com VP9 e transparência, faz mixagem de áudio por trilhas, injeta o runtime, espera readiness gates para garantir assets carregados e pode rodar em Docker para fixar versão do Chrome e conjunto de fontes, obtendo o mesmo resultado em máquinas diferentes.

  • Formatos e transparência: MP4 com H.264 e WebM VP9 com alpha.
  • Docker render: sai com saída idêntica, útil para CI e serviços de produção.
  • GPU encoding: suporte automático a NVENC, VideoToolbox e VAAPI quando disponível.
  • Qualidade por preset, 24, 30 ou 60 fps, e server embutido para uso programático.

Na prática, render determinístico com Docker resolve dores comuns em times que rodam pipelines distribuídos. Evita variações por fontes, versões de navegador e diferenças sutis de rendering, algo crítico para testes visuais e revisão de peças pagas.

![HTML5 logo]

Pré-visualização, player web e catálogo de blocos prontos

Para incorporar composições em apps e sites, o pacote Player entrega um web component <hyperframes-player> de 3 KB gzipped. Ele espelha a API do <video>, expõe eventos, permite programar play, pause e seek, e funciona em qualquer framework, já com sandbox e comunicação por postMessage para isolar CSS e JS.

O catálogo oficial traz blocos prontos com transições, gráficos e efeitos, instaláveis via CLI. Exemplos úteis para demos e comerciais rápidos incluem:

  • Data Chart, bloco 1920x1080 e 15 s, com colunas e linha estilo jornal, rótulos e tipografia editorial.
  • Mechanical Transitions, showcase de transições com obturador e íris, também 15 s.

Esses blocos ajudam a padronizar peças e servem de exemplos concretos para ensinar agentes a construir composições mais complexas a partir de prompts curtos.

CLI, skills e boas práticas de prompting no Claude Code

O CLI do HyperFrames cobre o ciclo de vida do projeto, com init, preview no navegador, render e benchmark. Com npx hyperframes render, a pipeline executa e grava MP4. Em ambientes onde reprodutibilidade é crítica, --docker fixa a versão do Chrome e fontes, garantindo o mesmo arquivo de saída. Para verificação de ambiente e GPU, npx hyperframes doctor lista capacidades.

No prompting, as skills recomendam práticas que aumentam a taxa de acerto de agentes, como citar caminhos de arquivos, usar o prefixo de slash para carregar contexto e evitar pedir componentes React, já que a autoria é HTML com data-attributes e timeline GSAP. Há também comandos para lintar e validar composições antes de render.

Padrões de uso úteis para Claude Code:

  • Warm start, peça um vídeo a partir do conteúdo de um repo ou PDF.
  • Iteração dirigida, ajuste fonte, tamanho, cor, trilhas e timings por prompts incrementais.

HTML como fonte de verdade, com data-attributes e timeline GSAP

A referência de esquema documenta como compor vídeos com HTML e data-attributes, mapeando timing por data-start, data-duration e data-track-index, lidando com montagem e desmontagem de clipes, e sincronizando áudio e vídeo na timeline. O framework gerencia playback, visibilidade e registro de elementos, além de suportar imagens PNG, JPG, WebP, SVG e GIF no primeiro frame.

Esse arranjo facilita a vida de agentes e desenvolvedores, porque cada ajuste vira uma mudança declarativa no HTML, em vez de depender de um DSL pouco conhecido ou um editor fechado. O aprendizado de máquina já entende a semântica do HTML, o que reduz fricção na geração de código correto.

Renderização, codecs e o papel do FFmpeg

O Producer joga a captura de frames para o FFmpeg, que faz a codificação H.264 no MP4 e VP9 com alpha no WebM. Essa escolha equilibra compatibilidade, compressão e recursos como transparência. Em pipelines profissionais, o uso de FFmpeg combina com aceleração de GPU quando detectada, reduzindo tempo por job.

![FFmpeg logo]

Exemplos práticos de aplicação em times de produto e marketing

  • Lançamentos de features, o agente recebe um changelog e constrói um roteiro de 30 segundos com cenas, tipografia e trilha, gera prévia e render final. Os blocos de transição e gráficos aceleram a montagem.
  • Conteúdo educacional, transformar uma página de documentação em clipes didáticos, com capítulos e legendas, mantendo consistência visual via HTML e CSS. O player pode embutir a composição no site de docs.
  • Performance marketing, criar variações de hooks e CTAs por prompt, renderizar em Docker para garantir que o arquivo final não varie entre máquinas do time ou no CI.

Comparativo rápido com ferramentas conhecidas

  • Remotion, pioneiro em video programático com React, integra com ecossistema JS e tem opções de render local ou na nuvem. Exige pensar em componentes React, o que pode aumentar a tradução quando o autor primário é um agente treinado em HTML.
  • Motion Canvas, foca em Canvas e TypeScript, com pré-visualização em tempo real e exportação por sequência de imagens. Excelente para animação algorítmica, mas não é agent-native em HTML.
  • Outras soluções de HTML para vídeo existem como APIs ou libs, porém frequentemente sem o foco em fluxo com agentes, skills e reprodutibilidade por Docker que o HyperFrames prioriza.

A diferença prática do HyperFrames é colocar o HTML como contrato de autoria e construir em volta disso uma experiência completa para agentes, do prompting até a renderização determinística e ao player embutível.

Boas práticas para adotar o HeyGen HyperFrames com IA

  • Definir um kit visual em CSS, fontes e spacing. Agentes produzem melhor quando estilos e tokens já existem no projeto.
  • Sempre citar caminhos de assets no prompt, como assets/intro.mp4 e assets/logo.png, e usar o prefixo slash das skills para carregar o contexto certo.
  • Validar e lintar composições antes do render para pegar erros de estrutura e runtime.
  • Para produção, priorizar Docker e presets de qualidade consistentes, e habilitar GPU quando disponível para acelerar filas.

Conclusão

HeyGen HyperFrames traz um caminho claro para times que querem usar agentes de IA na criação de vídeo sem abrir mão de controle técnico. HTML como fonte de verdade, skills para Claude Code e pipeline FFmpeg com Docker e GPU formam um conjunto coeso e pronto para a realidade de produto, marketing e educação.

O movimento de abrir o HyperFrames indica uma tendência, agentes escrevendo não só código de app, mas também vídeo. Ao resolver reprodutibilidade, transparência e integração, a HeyGen amplia o alcance de workflows automatizados que começam no prompt e terminam em MP4 pronto para publicar.

Tags

IADesenvolvimentoVídeoOpen Source