AI生成的音乐

AI的日子已经被非技术产业被视为神话。今天AI到处都存在,它是真实的。一些世代前,作曲音乐意味着作曲家需要在他们的电脑的帮助下建立组合物,并使人群倾听的曲调/旋律致敬。一旦深度神经网络在20世纪90年代初就突破,AI也只是一个时间问题,也可以扰乱音乐行业。曾说过这一切,是alie取代音乐家,作曲家甚至歌手吗?让我们不要急于那些结论!

在本文结束时,您将拥有以下内容:

  • AI如何扰乱音乐行业?
  • 目前所有竞争对手都是哪些竞争对手
  • AI如何实际生成音乐?
  • AI是否要取代音乐家?

AI如何扰乱音乐行业?

AI生成音乐不仅仅是一种花哨的窗口软件,可以产生一些随机曲调。这是合法的音乐。事实上,AI音乐空间是一个快速增长的市场,本身就是截至目前的多个玩家。例如,IBM Watson Beat,Google Magenta,安默,Aiva等。每个人都有自己的技术,该技术是发电音乐背后的主要司机。它们在用户界面中的不同之处以及它们产生的输出类型。其中一些产生MIDI(乐器数字接口),这是不可直接可用的,因此需要了解音乐生产。其中一些,例如Google Magenta需要编码语言知识将被转换为音频。

这些基于AI的音乐组合软件主要使用深神经网络架构,该架构从馈送到它们的音乐数据中提取模式。 AI模型给出了通过其神经网络处理的大量数据,以了解不同的和弦,频率,节拍和笔记之间的关系。它学习这些参数之间的关系以及它们如何在输出旋律的值时彼此组合在一起。某些型号还有一些硬编码架构,基于理论说明生成音乐,以及音乐如何理论上。所有模型和软件都不只是限于单一类型的类型。它们是喂食每种类型的类型,都是硬岩,合成流行音乐或嘻哈。

AI音乐空间的竞争对手

安默的音乐

安默斯音乐是目前在行业中使用的AI音乐生成器应用最容易的音乐之一。它询问用户对如何响起音乐的输入。例如,它要求流派,心情,然后处理其模型,这些模型已经了解到过去所有数据的所有数据都有关于该特定音乐类型。

关于安默的最佳部分是它直接发出音频输出而不仅仅是MIDI。这意味着用户可以直接为其应用程序使用它,并且绝对不需要做任何编码或具有许多对音乐生产的知识。生成音乐后,用户可以通过更改音频的频率,节拍和音调来根据他们的喜好调整它。单独的仪器音频也可以通过提取音乐的各个层来静音或改变。

流动机器

流量机是一项研发和社会实施项目,旨在扩大音乐创作者的创造力。流动机器背后的AI有助于作曲家在基于音乐的规则的帮助下,通过分析各种音乐来制作音乐。

流量机的主要目的不是替代人类组成音乐。它背后的目的是根据用户想要的类型预测或提出旋律和音调。然后,用户可以使用这些预测并根据他们的喜好改变它们。

Aiva.

Aiva. (人工智能视觉艺术家)是另一个基于AI的软件,可以创建薄空气中的独特音乐。它具有基于ML的模型,它已经了解音乐组成并将这些学习转换为数学表示。这些数学表示后来用于撰写完全独特的音乐。 

预先构建了岩石,经典岩石,金属,嘻哈等的AIVA中的多种类型的音乐。用户可以通过多种设置和参数来改变和反馈AI系统。以下是Aiva的AI生成的音乐件之一。去看看出来,不要吓坏了!

在边缘–AI-Sended摇滚音乐由AIVA组成

AI如何实际生成音乐?

好的,所以我们已经看到了AI如何帮助音乐家自动生成音乐。但是黑盒后面发生了所有魔法吗?不,它是所有数学和神经网络,磨掉数百万计算来搅扰最终被转换为音频的输出。这些模型主要由经常性神经网络(RNN)组成。这里出现了一个问题。为什么rnn?答案是,在处理顺序或时间数据时,vanilla神经网络很差。当谈到RNN时,他们遭受了一个名为消失梯度的问题。这是由于RNN的结构而发生的。为了克服这种缺点,LSTMS进入了图片。

当涉及神经网络以产生音乐时,有多种不同的模型。但是使用2种最常见的方式是Wavenet和LSTM(长短期内存)网络。让我们来看看Wavennet模型如何工作。

Wavenet模型

Wavenet是由谷歌的深度开发的深度神经网络架构。它用作NLP中的语言模型工作,通过将前面的单词作为输入来生成句子中的下一个单词。它将下一个样本预测为一系列样本作为输入。模型的输入是表示时序列域数据中的音频的幅度波。产生的输出是下一个幅度值序列。如您所见,它需要在前一次数据中,并及时预测下一个序列。因此,这被称为自回归模型。

波面模型主要由因果扩张的1-D卷积网络组成。这里的因果意味着输出时 t 仅与时间元素复杂 t 在前一层之前。这里的扩张只不过是卷积核之间的孔或空格到网络的接收领域。

LSTM模型

LSTM模型的输入类似于WVENET模型。这里,幅度样本被传递给LSTM输入,然后计算隐藏的向量并将其传递到下一个时间步。多个LSTM单元彼此连接,输出被馈送到下一个小区。在任何给定的时间t,基于t的电流值和来自t-1的前一个小区的值计算的隐藏矢量h。这有助于LSTM捕获输入序列中存在的顺序信息。 LSTM单元格由多个门组成,可帮助它记住并将信息传递给下一个单元格。 LSTM单元包含3个主闸:输入门,忘记门和输出门。此完整的内存单元使LSTM使LSTM保留有用信息并从忘记门中丢弃无用的信息。

在你走之前

我们看到AI在音乐行业中的进步以及软件公司如何互相竞争,在为用户带来最尖端的技术时。但是留下迫在眉睫的问题......是替代人类的艾美吗?不!我们上面讨论的所有AI工具和模型都无法替代人类。他们的目标是协助音乐作曲家和生产者在他们的工作中更有效,并引入他们自己可能无法想出的旋律。 AI系统需要对其输出的反馈,这些输出可以由人类完成。这些也帮助那些没有太多理论上的音乐知识的音乐家,因此不能带来他们想象的音乐。这里的AI在生成那种音乐方面发挥着重要作用。事实上,这些公司正在通过保持人类在中心来开发该软件。音乐家不会去任何地方。他们只有一个新的令人兴奋的工具。此外,AI可能完全能够完全撰写音乐,可以用作视频中的背景音乐等。因此,AI仍然有很多时间赢得了一种格式以产生最佳的地球上最好的音乐!!


副主编

克扬 是一个有目光的创意数据科学家,有关细节。日常学习者和博主,他非常渴望分享知识并支持数据科学界。与他联系 linkedin. 联系和唐’忘了看看他的 中等的 blogs.

数据科学|机器学习|科技博客– upGrad

关于Chayan Kathuria.

克扬 是一个有目光的创意数据科学家,有关细节。日常学习者和博主,他非常渴望分享知识并支持数据科学界。与他联系 linkedin. 取得联系,别忘了看看他的 中等的 blogs. 数据科学|机器学习| Tech Blogger - 升级

查看所有帖子由Chayan Kathuria→