奥地利团队AI完成贝多芬遗作解构神经网络、机器学习、AI创作潜能｜STEM教室

2024-08-07 14:00

科技的进步固然有助我们的生活，但其衍生的争议亦一直是大家的讨论话题。其中一个我们经常面对的问题，就是科技会否取代人类所有职业。现今大部分重复性的工序已经能够由机器自动完成，导致不少工厂员工失去工作；可是，讲求创作力的行业是否能够幸免呢？奥地利一个研究团队成功利用人工智能写下音乐传奇贝多芬尚未完成的第十号交响曲，定必会为这话题激发起更多思考和辩论。

了解大脑如何运作

在了解「电脑」如何「思考」及「创作」前，我们应该先认识一下大脑是怎样运作的，因为我们是基于人脑的结构和原理来设计电脑以及人工智能。「文艺复兴三杰」之一的意大利雕塑家米开朗基罗曾经说过，「其实（雕塑）这形体本来就存在于大理石中，我只是把不需要的部分去掉而已」，当中蕴含人类一直拥有并不自觉地运用了的「感知」、「思考」、「创作」等概念。我们要先有五官上的感知，然后才能去创造，而感知这过程须要我们的想像，因此与创作息息相关。

神经网络错综复杂

过去一百年，科学家们都在研究我们大脑的结构，以及每个区域分别有甚么功能，而其中一项重要发现就是认识神经网络。这个庞大的网络，是由无数神经元伸出如树枝般的结构连结而成，这些「树枝」能够把资讯以电流形式在各个神经元之间传递；通过电流大小、频率等资讯，我们就可以分析所接收到的讯息，以及发放信号作出不同动作。然而，这些枝节错综复杂，在一段很长的时间里我们都不容易建造模型来模拟大脑的运作。直至近年人工神经网络的发展，我们才能够开始尝试利用电脑来模拟人类般学习。

人脑神经元网络。作为神经系统中最基本的元素，这数以百亿计的神经元能够把资讯在脑部与身体各部位间来回输送，从而我们能够做到思考以及一系列复杂的动作。

人脑内的神经元数量极多，专家发现人类高达四分之一的能量都是供给脑细胞使用，可以想像，要在虚拟网络构造同样精致细密的系统难度有多高，而且即使是超级电脑也难以负荷高速及繁复的运算。因此，我们在电脑里所用到的神经网络，要在精准度及速度之间取得平衡，才能有助我们处理不同任务。

神经网络与机器学习

知道人脑的基本构造后，让我们转到电脑这范畴。人类尝试让电脑学习，或是发展人工智能已有一段时间。以最笼统的定义来说，任何能让电脑进行运算或决策的编程都算是人工智能的一种，不过，普通指令不足以让电脑学习和理解，甚至进行创作。

虚拟神经网络。我们先构建输入层（input layer）及输出层（output layer），然后让电脑建立中间的分层（hidden layer）。当演算完成后，我们就可以只输入，让电脑的算式推算出一个答案。

输入与输出建构点和綫

模仿人脑的分支结构，电脑的神经网络亦是充满一系列的点，以及点与点之间的连结。我们学习辨认东西，会先看物件图片（输入），再给予答案（输出），然后我们就要找到物件当中的特徵以作配对；同样地，我们把样本的输入（input layer，如照片）及输出（output layer，如物件名称）资讯交给电脑，它就会尝试在当中建构不同的点（用以辨识物件的数值或参数）与綫（算式），形成中间的分层（hidden layer），亦即物件的「特徵」。在有足够的样本情况下，算式和参数就会计算得较准确，这就如我们学习时熟能生巧一样。

电脑学习创作音乐

上文提及电脑能够学习辨认物件，其实同样原理亦能放在声音上。我们只要把某一种曲风的大批乐曲放进电脑系统，它就可以分析该类型的基本架构，如拍子、节奏、音域等等。当「看」得足够多的乐谱，电脑就能找到当中的模式（hidden layer）来把曲风（输出层）与乐谱（输入层）相配对，并建立相应演算法。

「反过来」的演算过程

有了这个演算法，我们可以输入新乐谱，让电脑推断是甚么类型的音乐。那整个过程可以反过来吗？亦即是，我们先在输出层放入想要的曲种，利用相同演算法，电脑能否尝试自行创作一份新乐谱呢？原来这是可行的。电脑科学家与作曲家Pierre Barreau于2016年创办AIVA（全名是Artificial Intelligence Virtual Artist，即人工智能虚拟艺术家），通过阅读多首如贝多芬、莫札特、巴哈等音乐，利用深度学习与强化学习（一种机器学习的方法），摸索出古典音乐的规律，从而创作出相同风格的乐曲。现时，不但是古典音乐，电子、摇滚、爵士乐等，AIVA也能制作到。

AIVA分析一首乐曲时，呈现方式如矩阵般。利用深度神经网络， AIVA能够在乐谱中寻找规律（蓝色与橙色标记），并在一句或一章节后推算下一个音符应是甚么；经过多首歌的「训练」，AIVA的推算会愈来愈接近其曲风的需求，这样就能创作一整首歌曲。

完成贝多芬第十号交响曲——向高难度挑战

回到最初提及的贝多芬第十号交响曲，这比AIVA创作音乐又难上一层。十九世纪时，贝多芬曾受英国皇家爱乐协会之委托写两首交响曲，当时他写了一首第九号交响曲，当中的《欢乐颂》可谓脍炙人口；而另一首第十号交响曲，他却只写了一小部分就因病离世。虽曾有人尝试填补未完成的部分，但因为本来就只有很少的原稿及相关笔记，因此都不太成功。

符合风格与年代的乐曲

直至2019年，奥地利萨尔斯堡卡拉扬研究所（Karajan Institute）的罗德（Matthias Röder）团队接受了这个挑战，尝试运用人工智能完成这部遗作。与 AIVA不同的是，这次不但要写某一种曲风的一首乐曲，而且要特定符合贝多芬的风格，再加上须配合原先仅有的一小部分乐章以及笔记，写出符合年代的交响曲。团队包括作曲家、电脑科学教授、人工智能专家、音乐学家等，他们的做法与上文提及创作音乐的方法类近，先尝试找来贝多芬的其他作品，把那些乐曲的初稿放进输入层（input layer），最终版本放进输出层（output layer），让电脑发展演算模型配对两者。但困难的是，即使有这演算法，团队还要把贝多芬的独有风格量化，以及将影响贝多芬的人物及环境等因素考虑在内。在接近两年的努力，研究团队终于成功以人工智能完成创作，并在2021年10月9日举行公演。

贝多芬写第十号交响曲时的一页手稿。

补充资料

人工智能的其他创作应用

除了音乐，人工智能还有其他创作潜能。

自动化新闻（或机械人新闻写作）已不是最近才有的事，只要输入新闻的基本资料和数据，电脑就能够拼砌前后对应的字句，写成一篇新闻稿。人工智能亦有助检查文章中有没有错误，从而令新闻更准确。此外，通过电脑学习，还可成为画家绘画并参展。基本原理如上文提及的图像辨识功能，在发展推算算式后，只要输入新相片，就能认出当中物件是甚么。倒转过来，在「输出层」先写上物件名称，通过演算法，理论上就可以画出相应物件。

利用已知的演算法（w）以及想要画的物件（y），人工智能有能力画出未知的画作（x），又或是在已有的一幅画中（如图六的云）找到当中的规律，从而「利用想像力」画出电脑「联想到」的物件。

电脑从云中「看出来」的物件。

奥地利团队AI完成贝多芬遗作解构神经网络、机器学习、AI创作潜能｜STEM教室

了解大脑如何运作

神经网络错综复杂

神经网络与机器学习

输入与输出建构点和綫

电脑学习创作音乐

「反过来」的演算过程

完成贝多芬第十号交响曲——向高难度挑战

符合风格与年代的乐曲

补充资料

人工智能的其他创作应用

延伸阅读：AI教父离开Google 警告人工智慧将比人类更聪明

最新回应

相關新聞

「自动化」科技未来大趋势物流业、物联网IoT、自动车、图像识别｜STEM教室

小学数学科引入「AI助教」数秒生成练习题能批改学生手写答案

订阅星岛日报

联络我们

广告表格及价目表

了解大脑如何运作

神经网络 错综复杂

神经网络与机器学习

输入与输出 建构点和綫

电脑学习创作音乐

「反过来」的演算过程

完成贝多芬第十号交响曲——向高难度挑战

符合风格与年代的乐曲

补充资料

人工智能的其他创作应用

延伸阅读：AI教父离开Google 警告人工智慧将比人类更聪明

最新回应

相關新聞

「自动化」科技 未来大趋势 物流业、物联网IoT、自动车、图像识别｜STEM教室

小学数学科引入「AI助教」 数秒生成练习题 能批改学生手写答案

订阅星岛日报

联络我们

广告表格及价目表

神经网络错综复杂

输入与输出建构点和綫

「自动化」科技未来大趋势物流业、物联网IoT、自动车、图像识别｜STEM教室

小学数学科引入「AI助教」数秒生成练习题能批改学生手写答案