top of page

MusicGen | Conheça a IA da Meta que transforma texto em música

CANALTECH


Por Fabrício Calixto | Editado por Douglas Ciriaco | 15 de Junho de 2023 às 11h31



A corrida das inteligências artificiais generativas está entrando em um novo capítulo, ou melhor, em uma nova faixa, isso porque a Meta anunciou recentemente o MusicGen: um gerador de músicas com base em IA que é capaz de transformar qualquer descrição em áudios de até 15 segundos. Não tão novidade assim, a aposta da empresa de Mark Zuckerberg bate de frente com o MusicLM do Google, que faz a mesma coisa, porém, em código fechado — já que o MusicGen é open-source.


Como funciona o MusicGen?

Operando de modo semelhante ao DALL-E e ao Midjourney, que transformam descrição em texto em imagem, o MusicGen cria um trecho de música conforme a descrição feita pelo usuário. Isso é possível graças ao algoritmo Transformer, desenvolvido pela OpenAI e presente na maioria das ferramentas de IA generativa.


Além do modelo computacional, os criadores do MusicGen também utilizam o tokenizador de áudio EnCodec da própria Meta. No caso, o sistema usa técnicas de aprendizado de máquina para compactar faixas de modo eficiente e entregar resultados mais ágeis ao usuário.


Com o objetivo de ampliar o repertório da IA, a equipe por trás de sua criação anexou aproximadamente 20 mil horas de músicas autorizadas para uso e cerca de 10 mil gravações de áudio do mais alto padrão — incluindo material disponível em Shutterstock e Pond5 e dados coletados internamente.


...


Para usar o MusicGen, faça assim:

  1. Acesse o MusicGen no site da Huggin Face (huggingface.co);

  2. Clique na coluna "Describe your music" e digite o texto desejado;

  3. Clique no botão "Generate";

  4. Passe o mouse sobre o trecho musical e toque em "Play" para ouvir.




 
 
 

Comentários


bottom of page