能作曲的人工智能 深度神经网络MuseNet

原创
2019/04/29 15:24
阅读数 510

现在人工智能也在构成,OpenAI开发了深度神经网络MuseNet,它可以使用四种不同的乐器,结合国家,莫扎特或Lady Gaga的风格,制作四分钟的音乐作品。 OpenAI不教MuseNet音乐或它是安排理论,但让人工智能从成千上万的MIDI文件中学习,并探索音乐的元素,如合唱,节奏和风格。

MuseNet使用通用无监督技术GPT-2,这是一种可以训练预测音频或文本序列的大型变压器模型。 OpenAI收集各种音频源。作为MuseNet的训练数据,除了Classicages和BitMidi服务提供的大量MIDI文件外,他们还在互联网上收集流行,非洲,印度,阿拉伯和其他风格的音乐。还使用了MAESTRO数据集。

在要求Transformer模型提供一组注释后,它能够预测下一个音符。 OpenAI通过各种实验,找到了最具表现力和简洁的编码方法,将音高,音量和乐器信息组合成一个令牌。 在训练期间,OpenAI通过提高或降低音高来替换音符,并且通过增加或降低每个样本的总音量来增强音量效果,强化音乐时间的变化是透明的。过度加速和减慢音频段。
与此同时,OpenAI还创建了一个批评者,他们在模型训练期间不断查询模型,以查看给定样本是来自真实数据集还是过去模型的结果。批评者将给出样本的分数。当MuseNetsbf胜博网生成输出时,它将根据此分数选择样本。 OpenAI添加了几个嵌入,允许模型为歌曲添加各种功能,包括和弦或音乐长度。
OpenAI创建了作曲家和乐器令牌,允许用户轻松控制MuseNet样本类别。在训练期间,这些训练器和仪器标记被添加到每个样本中,因此模型可以基于该信息预测笔记。在构建阶段,模型基于用户指定的作曲家和乐器执行音符预测。因为MuseNet有很多不同的音乐风格,所以也可以将不同的风格与新的混合方式融合在一起。

OpenAI暴露了这一早期成就。在简单模式中,用户可以通过指定作曲家或风格以及着名的音乐作品来创建新的音乐作品。用户可以简单地尝试各种音乐。音乐风格的不同组合。在高级模式下,需要设置更多参数和更长的生成时间,但它可以让用户灵活地制作更多创意作品。 OpenAI提醒,将超大风格与乐器相结合,如肖邦风格和低音和鼓组合,将为MuseNet带来意想不到的效果,为作曲家选择合适的乐器将使结果更自然。

展开阅读全文
打赏
0
0 收藏
分享
加载中
更多评论
打赏
0 评论
0 收藏
0
分享
返回顶部
顶部