Google integra modelo Lyria 3 no Gemini para geração de música

- Publicidade -

A Google introduziu o modelo Lyria 3 na aplicação Gemini, permitindo a geração de faixas musicais originais de trinta segundos através de comandos de texto e imagem.

A Google integrou o modelo de geração áudio Lyria 3 na aplicação Gemini, viabilizando a criação de faixas musicais com a duração de 30 segundos. A ferramenta processa comandos de texto, fotografias e vídeos para compor ficheiros sonoros que integram instrumentos, vozes e letras.

O funcionamento do algoritmo baseia-se na interpretação de descrições textuais, como indicações de géneros musicais ou estados de espírito, e na análise de elementos visuais presentes em ficheiros multimédia carregados na plataforma. O Lyria 3 difere das iterações anteriores ao introduzir a geração autónoma de letras a partir do comando inicial, eliminando a obrigatoriedade de inserção de texto estruturado por parte do utilizador. O modelo permite a definição de parâmetros técnicos da composição, nomeadamente o estilo, as características vocais e o andamento. Cada ficheiro áudio gerado é exportado com uma imagem de capa criada em simultâneo pelo modelo Nano Banana.

A infraestrutura do Lyria 3 foi igualmente integrada na ferramenta Dream Track do YouTube. A funcionalidade, atualmente em fase de expansão para outras regiões geográficas após um período de disponibilidade restrita ao mercado norte-americano, destina-se à produção de faixas sonoras instrumentais ou vocais para os vídeos de curta duração da plataforma, conhecidos como Shorts.

No que toca à identificação de conteúdos sintéticos e proteção de propriedade intelectual, a empresa programou o sistema para restringir a clonagem de obras musicais ou artistas. A introdução do nome de um músico num comando é processada pelo algoritmo exclusivamente como uma referência estilística, bloqueando a imitação exata de características vocais específicas. Para além disso, todos os ficheiros áudio produzidos incorporam o SynthID, uma marca de água digital impercetível desenvolvida para assinalar conteúdos gerados por inteligência artificial.

A aplicação Gemini disponibiliza ainda uma função de verificação que permite o carregamento de ficheiros áudio externos para deteção da presença deste identificador. A utilização da ferramenta obedece aos termos de serviço estabelecidos, que preveem sanções para a violação de direitos de autor.

O acesso ao Lyria 3 está interdito a menores de 18 anos, sendo que a ferramenta suporta comandos de entrada em português, inglês, espanhol, francês, alemão, japonês, coreano e hindi. A capacidade de processamento diário atribuída a cada conta está indexada ao respetivo nível de subscrição, com limites operacionais alargados para os utilizadores dos planos Google AI Plus, Pro e Ultra.

Alexandre Lopes
Alexandre Lopes
Licenciado em Comunicação Social e Educação Multimédia no Instituto Politécnico de Leiria, sou um dos fundadores do Echo Boomer. Aficcionado por novas tecnologias, amante de boa gastronomia - e de viagens inesquecíveis! - e apaixonado pelo mundo da música.
- Publicidade -

Deixa uma resposta

Introduz o teu comentário!
Introduz o teu nome

Relacionados