Os vídeos gerados por IA têm avançado a um ritmo surpreendente nos últimos 10 meses, e o notável novo modelo de difusão espaço-temporal do Google, Lumiere, mudou os parâmetros mais uma vez. O Lumiere pode criar videoclipes surreais muito realistas ou de alta qualidade com até 5 segundos de duração. Ele também pode animar imagens estáticas ou partes de imagens com base em prompts de texto em linguagem natural para que você saiba o que deseja ver.
Ele pode tirar uma foto, clonar o estilo dessa imagem e, em seguida, usar esse estilo para criar uma série de vídeos sobre outros tópicos que parecem tão semelhantes que poderiam ter sido produzidos por uma agência de branding.
Ele pode usar seu próprio vídeo de origem para transformar tudo em Lego, origami ou flores - basta contar.
Como você pode ver na demonstração acima, o Lumiere possui o recurso de vídeo mais avançado que vimos até agora. Basta pintar as partes da imagem que você não gosta, e o Lumiere preencherá automaticamente essa área com um belo efeito que você talvez nem perceba se não olhar com atenção. Ex-namorado aparece no seu vídeo favorito? Não demorará muito.
A equipe de pesquisa relevante afirmou que a "arquitetura de rede espaço-temporal em forma de U" do Lumiere pode construir toda a duração do vídeo de uma só vez - enquanto os modelos anteriores geralmente geram o quadro inicial e o quadro final primeiro e depois adivinham o que acontecerá no meio.
Não importa como você faça isso, os resultados falam por si: este é o novo estado da arte em vídeo generativo de IA.
Por enquanto, este é apenas um projeto de pesquisa - para que o Google não tenha que castrar fortemente o sistema de direitos autorais, desinformação, segurança, discurso de ódio, nudez, privacidade e várias outras políticas - um processo que inevitavelmente levará a uma diminuição na qualidade da produção destes modelos geradores.