Meta 开【kāi】源 AI 语言模型 MusicGen,可将文【wén】本和旋【xuán】律【lǜ】转化为完整乐曲

2024-9-20 14:12:13来源:品玩


【资料图】

品玩 6 月【yuè】 12 日讯【xùn】,Meta 近日在 Github 上【shàng】开源了其 AI 语言模型 MusicGen,该模型【xíng】基于谷歌 2017 年【nián】推出的 Transformer 模型【xíng】。如同模型名称所示,MusicGen 主要【yào】用于音【yīn】乐生成,它可以将文【wén】本和已有的旋【xuán】律转化为完整乐【lè】曲【qǔ】。

研发团队表示【shì】:" 我【wǒ】们使用了【le】 20000 小【xiǎo】时的【de】授权音乐来对【duì】训练该模【mó】型,并采用 Meta 的 EnCodec 编【biān】码器将音频数据分解【jiě】为更小【xiǎo】的单元【yuán】进行并行【háng】处理,进而【ér】让 MusicGen 的运算【suàn】效率和生成【chéng】速度都比同类型 AI 模型更为出色。"

除此之外,MusicGen 还支持文本与旋律的组合输入,例【lì】如你可以提出【chū】生【shēng】成 " 一首轻快的曲目 " 并同时要【yào】求 " 将它【tā】与贝多芬的《欢乐颂》结合起来 "。

研【yán】发团队还对 MusicGen 的实际表现【xiàn】进【jìn】行了测试。结果【guǒ】显示,与谷【gǔ】歌【gē】的 MusicLM 以及【jí】 Riffusion、Mousai、Noise2Music 等其他音乐模型相比【bǐ】,MusicGen 在测【cè】试音乐与文本提示【shì】的【de】匹配度以及作曲的可信度等指标上【shàng】表现更【gèng】好,总体而言略高于谷歌【gē】 MusicLM 的水【shuǐ】平。

最新资讯

股票软件