Helix 02 da Figure demonstra arrumação da sala via pixels
Figure publica novo demo do Helix 02 arrumando uma sala inteira, integrando locomoção e manipulação em um único sistema treinado a partir de pixels e dados táteis
Danilo Gato
Autor
Introdução
Em 9 de março de 2026, a Figure publicou um novo demo em que o Helix 02 arruma uma sala de estar inteira, da limpeza de superfícies ao uso do controle remoto, tudo a partir de pixels e sinais táteis. A palavra chave aqui é Helix 02, o sistema que unifica percepção e ação no corpo todo, mantendo equilíbrio enquanto manipula objetos e se desloca pela sala.
O interesse vai além do efeito visual. Arrumar uma sala exige loco manipulação contínua, algo que sempre foi espinhoso em robótica. O ambiente muda, as tarefas se encadeiam, objetos flexíveis se comportam de forma imprevisível. O novo vídeo mostra o Helix 02 executando ações encadeadas, como borrifar e esfregar a mesa, lançar almofadas de volta ao sofá e reorganizar itens com as duas mãos, enquanto avança por passagens estreitas.
O artigo aprofunda o que foi demonstrado, como a arquitetura do Helix 02 funciona, os limites reais do experimento, o debate técnico que já apareceu na comunidade e o que pode vir a seguir no roadmap doméstico da Figure.
O que muda com o Helix 02 no ambiente doméstico
Arrumar uma sala de estar parece simples para humanos, mas é um quebra cabeça técnico para robôs. Segundo a Figure, o Helix 02 aprende novas tarefas adicionando dados, sem precisar de algoritmos especiais para cada comportamento. No demo, o sistema coordena ferramenta de limpeza e toalha, manuseia objetos flexíveis, organiza itens com as duas mãos e até reposiciona a toalha sob o braço para liberar as mãos. Essa variedade sugere generalização crescente dentro do mesmo arcabouço de controle.
Esse avanço se conecta ao lançamento anterior do Helix 02, anunciado em 27 de janeiro de 2026, que já havia mostrado uma sequência autônoma de quatro minutos na cozinha, incluindo descarregar e recarregar a lava louças sem intervenções e sem resets. O ponto central era a unificação de locomoção e manipulação sob um único sistema, com 61 ações coordenadas e uso de quadril e pé como auxiliares de manipulação.
Na prática, o recado é direto. A mesma política que funcionou na cozinha agora aparece na sala, com uso de câmera nas palmas e sensores táteis habilitando destrezas como reorientar um controle remoto na mão para apertar o botão certo. Em um cenário doméstico real, essa capacidade de reorientação in hand e de alternar ferramentas aumenta a utilidade do robô para rotinas variadas.
Como a arquitetura S0, S1 e S2 viabiliza o feito
O Helix 02 usa uma hierarquia de três camadas. O System 0 é um controlador de corpo inteiro aprendido, treinado com mais de mil horas de dados de movimento humano e sim para real com forte randomização. Ele substitui um grande volume de lógica manual e mantém o robô estável e natural a 1 kHz.
O System 1, uma política visuomotora com todos os sensores na entrada e todas as juntas na saída, conecta câmeras da cabeça, câmeras nas palmas e sensores táteis de ponta de dedo, que detectam forças de cerca de três gramas. O S1 transforma cenas em alvos de juntas para o corpo todo a 200 Hz. Já o System 2 faz o raciocínio semântico mais lento, traduzido em latentes que o S1 executa com suporte do S0. Essa divisão por escalas de tempo é o núcleo de por que o robô consegue andar, segurar, apertar e recuperar erros sem travar a sequência.
O resultado, segundo a própria Figure, é uma política que cobre do milímetro dos dedos ao deslocamento pela sala, no mesmo backbone. Isso se manifesta na sala ao alternar entre força de esfregar, precisão no botão do controle remoto e passos laterais entre mesa e sofá.
![Sala de estar moderna, cenário típico para o teste]
O que exatamente o vídeo de 9 de março mostra
O post oficial lista comportamentos chave. Entre eles, uso coordenado de ferramentas, como borrifar e limpar com toalha, manipulação bimanual de um recipiente enquanto coleta blocos, tática de prender um recipiente sob o braço para liberar as mãos, arremesso controlado de almofada ao sofá, reorientação in hand de um controle remoto para apertar o botão correto e navegação precisa em espaços estreitos, tudo sem pausar a locomoção.
Essas ações importam porque expõem elementos difíceis para políticas end to end. O spray e a toalha pedem controle de força e contato. A almofada e a toalha são deformáveis, o que aumenta a incerteza de percepção e dinâmica. O controle remoto testa a destreza fina e a percepção próxima da mão, exatamente onde a câmera da palma entra. E atravessar vãos apertados enquanto se manipula algo nas mãos exerce o S0 no seu papel de manter equilíbrio integrado ao gesto.
Comparando com o demo de cozinha de janeiro, a principal evolução é a transferência de habilidades para um ambiente menos estruturado. Na cozinha, o roteiro era longo e detalhado, com 61 ações. Na sala, o foco está na robustez durante transições rápidas de tarefa, como guardar brinquedos, alternar entre ferramentas e lidar com tecidos.
Limitações, ceticismo e perguntas em aberto
A comunidade técnica já debate a dificuldade real do cenário usado, com comentários apontando que a sala do vídeo parece “limpa demais” para validar generalização. Esse ceticismo é saudável, e dá pistas de testes futuros que fariam diferença, como variação de layout, objetos desconhecidos e interferências inesperadas.
Outro ponto é a autonomia real e a presença de resets. A Figure afirma que os vídeos são autônomos, sem teleoperação, alinhado ao claim de janeiro. Ainda assim, avaliações independentes em ambientes de terceiros e com auditoria de falhas seriam o próximo passo para dissipar dúvidas, incluindo métricas como taxa de sucesso por subtarefa e tempo de recuperação de erros.
Há também a questão do domínio visual e do scaling de dados. Reportagens anteriores indicaram que a Figure vem montando ambientes internos variados e pretende escalar de milhares para milhões de horas de dados de vídeo, o que tende a beneficiar sistemas end to end como o Helix. Esse caminho, porém, demanda curadoria de distribuição de dados e mecanismos fortes de avaliação para evitar overfitting a cenários específicos.
![Detalhe mecânico de mão robótica, simbolizando destreza fina]
O lugar do Helix 02 no roadmap da Figure
O recorte doméstico não é isolado. Em janeiro, a Figure posicionou o Helix 02 como avanço de corpo inteiro, com toque e visão na palma, e com sequência autônoma longa na cozinha. Em paralelo, matérias e anúncios anteriores já apontavam testes e ambições de levar humanoides a aplicações reais, inclusive planos de testes residenciais alfa ao longo de 2025 segundo cobertura do setor. Esse fio condutor ajuda a entender por que a empresa está investindo em demos domésticos sucessivos, cozinha e agora sala.
O pano de fundo é uma competição acirrada no espaço de humanoides, com laboratórios e empresas tentando sair do “clipe impressionante” para a utilidade repetível. No caso da Figure, o diferencial reivindicado é o pipeline de pixels para torque com uma hierarquia única, capaz de reutilizar o mesmo modelo para novos ambientes ao adicionar dados. Se essa promessa resistir a avaliações externas, o Helix 02 pode acelerar a transição de pilotos fechados para uso supervisionado em casas e escritórios.
O que isso significa para adoção e preparo do mercado
Do lado de produto, três frentes merecem atenção imediata.
- Segurança física e fail safes. O S0 melhora a estabilidade, mas ambientes reais pedem camadas extras, como detecção de proximidade de pets e crianças e rotas alternativas quando passagens ficam bloqueadas. Auditorias de contato e logs de força por junta precisam ser padrão.
- Generalização e domínio. O ganho incremental por hora adicional de dados precisa ser medido por tipo de tarefa, variedade de objetos e diversidade de casas. O material da Figure cita avanço via dados, porém benchmarks públicos e replicáveis acelerarão a confiança.
- Integração com ecossistemas. Interagir com eletrodomésticos variados, trancas e interfaces exige percepção robusta de classes raras. O uso de câmera na palma e tato ajuda onde a cabeça não vê, mas padrões de interface e APIs físicas ainda são gargalos fora do laboratório.
Para empresas e equipes de facilities, há espaço para pilotos de baixo risco. Tarefas de reposição leve, descarte e housekeeping simples em áreas controladas tendem a ser bons primeiros alvos, alinhados ao que o Helix 02 já demonstrou em cenários de cozinha e sala. Expectativas realistas, métricas de segurança e um plano de revalidação por atualização de modelo formam a base desses pilotos.
Reflexões e insights
Como profissional, gosto de observar quando uma arquitetura reduz a cola de engenharia entre módulos. O Helix 02 reduz a dependência de máquinas de estado para “andar, parar, pegar, andar de novo”, e isso costuma liberar desempenho e robustez quando o mundo não colabora. Quando a mesma política produz micro movimentos de dedos e passos laterais na mesma sala, há uma queda de atrito que normalmente só aparece quando o acoplamento entre percepção e controle é resolvido.
Outra leitura útil vem do ceticismo da comunidade. Vários comentários questionam a “sala limpa demais” e pedem testes em ambientes alheios. Faz sentido. Generalização não se comprova com um único vídeo. Porém, também é verdade que se um agente pode manter a casa arrumada continuamente, a cena tenderá a parecer menos caótica ao longo do tempo. Os dois pontos convivem, e a resposta virá de estudos com variação controlada de bagunça, layout e objetos, com métricas abertas.
Uma última peça é o tato. A adição de sensores táteis e câmeras na palma, citada no anúncio de janeiro, muda a manipulação em tarefas com oclusão e contato fino. Em casas reais, isso impacta desde abrir frascos sem esmagar até lidar com tecidos e cabos. Para adoção, essa nuance pode pesar mais do que velocidade de andar ou capacidade de levantar peso.
Conclusão
O demo de 9 de março coloca o Helix 02 mais perto de um objetivo ambicioso, que é executar rotinas domésticas variadas com o mesmo modelo. Limpeza de superfícies, manipulação bimanual, arremessos controlados e navegação em passagens estreitas, tudo sem pausar a locomoção, são sinais de maturidade de loco manipulação integrada. Falta comprovar a mesma fluência em casas aleatórias e sob interferências típicas do dia a dia.
Na balança, o avanço técnico é claro. O S0 aprendido para estabilidade de corpo inteiro, o S1 com todos os sensores na entrada e todas as juntas na saída e o S2 semântico formam uma arquitetura que reduz costuras entre andar e manipular. Se o ganho em dados escalar como a Figure projeta, avaliações independentes em ambientes reais podem transformar demos em serviço útil. Para quem acompanha a fronteira de robótica doméstica, o Helix 02 é hoje um dos sinais mais concretos de que tarefas longas, com mãos ocupadas e corpo em movimento, estão migrando do laboratório para o cotidiano.
