Google Lança Plataformas com Inteligência Artificial para Revolucionar a Criação Audiovisual

Classe Musical
22 de março de 2022

O Google anunciou recentemente uma série de inovações em inteligência artificial (IA) voltadas para a criação de música, imagens e vídeos. As novas ferramentas incluem o Veo 3, Imagen 4, Lyria 2 e a plataforma Flow, todas integradas ao ecossistema do Google DeepMind. Além disso, a empresa apresentou o SynthID Detector, reforçando seu compromisso com a identificação de conteúdos gerados por IA.

Veo 3: Geração de Vídeos com Áudio Integrado

O Veo 3 é a mais recente versão do modelo de geração de vídeos do Google. Além de melhorias na qualidade de imagem em comparação ao Veo 2, o Veo 3 introduz a capacidade de produzir vídeos com som sincronizado, incluindo sons ambientes como pássaros, tráfego urbano e diálogos entre personagens. A ferramenta interpreta comandos de texto e imagem, gerando clipes completos com sincronização labial precisa a partir de descrições narrativas.

Inicialmente, o Veo 3 está disponível no aplicativo Gemini e na plataforma Flow para usuários do plano Ultra nos Estados Unidos, além de clientes corporativos no Vertex AI. O Veo 2 também recebeu atualizações, como controle de câmera, ampliação de cenas e manipulação de objetos, agora compatíveis com o ambiente Flow.

Flow: Plataforma de Criação Audiovisual com IA

Desenvolvida em colaboração com profissionais da indústria criativa, a plataforma Flow permite a criação cinematográfica baseada em IA. Integrando os modelos Veo, Imagen e Gemini, o Flow possibilita que os usuários gerenciem personagens, cenários e estilos por meio de comandos em linguagem natural. Na prática, o sistema atua como uma central de controle narrativo, onde é possível descrever uma cena e obter clipes estilizados conforme os parâmetros definidos. Atualmente, o Flow está disponível para assinantes dos planos AI Pro e Ultra nos EUA, com previsão de lançamento em outros países em breve.

Imagen 4: Geração de Imagens com Alta Resolução

O Imagen 4 é a nova versão do modelo de geração de imagens do Google, destacando-se pela resolução de até 2K e alto nível de detalhamento. A ferramenta promete precisão em texturas como pelos de animais, gotas d’água e tecidos, sendo eficiente tanto para estilos fotorrealistas quanto para composições mais abstratas. Além disso, apresenta melhorias em tipografia, facilitando a criação de cards, pôsteres e quadrinhos. O Imagen 4 está integrado ao app Gemini, à plataforma Whisk e pode ser utilizado em Slides, Vids, Docs e outras aplicações do Google Workspace.

“Cada imagem é uma ideia que virou luz. A IA não copia a realidade — ela a reinventa em pixels.”

Lyria 2 e Lyria RealTime: Inovações na Composição Musical com IA

O Lyria 2 é o modelo de IA voltado para composição musical, recentemente expandido para uso no Music AI Sandbox. Este ambiente experimental oferece ferramentas para músicos, produtores e compositores, estimulando novas ideias musicais por meio de recursos generativos, como troca de instrumentos, alteração de tom e ajustes de intensidade.

O Lyria RealTime, por sua vez, foi integrado ao MusicFX DJ e agora pode ser acessado via API e pela plataforma AI Studio. Projetado para interação ao vivo com músicos, simula a experiência de “jamear” com uma banda. Segundo o Google DeepMind, o modelo é capaz de gerar músicas em estéreo 48kHz com controle em tempo real de diversos parâmetros sonoros.

SynthID Detector: Identificação de Conteúdos Gerados por IA

Reforçando seu compromisso com a transparência e combate à desinformação, o Google apresentou o SynthID Detector, um portal que identifica se um arquivo — seja imagem, vídeo, áudio ou texto — foi gerado por inteligência artificial. Esta nova ferramenta complementa o uso do SynthID, tecnologia de marca d’água invisível que já é integrada automaticamente aos modelos lançados, incluindo Veo 3, Imagen 4 e Lyria 2.