编者按:本文由微信公众号“将门创投”(ID:thejiangmen)编译,来源:PLAYBOY,36氪经授权发布。
日前,美国自由笔者Aaron Carnes走访了谷歌大脑、加州大学Santa Cruz分校等从事AI和音乐结合领域的研究工作者,在切身感受了他们的日常后,记录下了这几个有意思的故事,让吃瓜群众也可以瞥到当AI进入音乐圈时,到底是令人恐慌还是充满期待?
这个名叫Jesse Engel的哥们儿最近正痴迷于让自己的电脑变成一个音乐家。他30多岁,个子很高,胡子拉碴还留着齐肩的头发,喜欢穿紧身牛仔裤,白色的T恤上还有万花筒的设计…这些元素加起来,你可能也会觉得他应该是一个漂泊的贝斯手,和“谷歌研究科学家”的身份差着十万八千里…
Engel他们位于谷歌旧金山办公楼五层的办公室,其实也是一个设备齐全且精良的音乐工作室。了解谷歌Magenta项目的人都知道,这是一个利用人工智能和机器学习来创作艺术的项目,同时为开源人工智能平台TensorFlow的用户简化这一过程。Magenta提供给用户可以修改的代码,包设计类似于人类大脑神经元的人工神经网络,并预先进行各种任务。它还为创作型艺术家和技术人员提供了一个分享自己实验的社区。
谷歌高级研究科学家Douglas Eck从15年开始设计Magenta项目,16年正式对外发布。他今年已经48岁,但看起来仍像个孩子。
没错,我们几个人凑到了一起,正打算举行一场即兴演奏会。这本不是计划中的事情,Eck和Engel届时将会为我和我的朋友、乐队成员Adam Davis演示一些demo。但Eck似乎对这事很随意,如果想更好的去了解Magenta项目,还有什么比和它一起创作更好的呢?
我站在电子鼓后,Davis抓到了一个挡板,Eck在键盘后面,一直想带起节奏。在特雷门琴(theremin, 是一种不需要接触而演奏的乐器,你可以像巫师一样挥舞着你的手控制它)是Kory Mathewson,是谷歌暑期项目的实习生,因为他把他的空闲时间都花在了研究机器人来表演即兴喜剧,Eck笑着偷偷告诉我,这也是当时为啥会让Mathewson来这实习的一个考量。
最后要介绍的就是我们这个临时组建的乐队的最后一名成员——A.I. Duet,它正是使用了Magenta技术的应用程序。当你在附加的键盘上弹奏一段旋律,程序会根据音符的选择、节奏、切分音和以前听到的音乐来识别整体模式。然后它会自动计算并帮你“补完”旋律的重奏部分,几乎可以实现“一呼一应”的演奏模式。我们所使用的内部版本可以通过设置“温度”来控制响应的随机性:当Engel选低音吉他模式,开始即兴创作旋律;当Engel听到了他喜欢的回应,就把设定下来。他拿起了一个黑色的Gibson Les Paul电吉他,然后演奏就这么即兴开始了。
猜猜我们都是谁~
我们的设想还是很不错的,但令我印象深刻的是人工智能在二重奏中弹出的低音线。如果我们是一个真正的乐队,我相信我们也会这样创作下去。音乐家们经常挣扎于没有新的创作灵感,这个程序似乎会成为他们创作的源泉。
“这就像在房间里有另一个音乐家。” Davis说。他也参与了二重奏。当他开始演奏乐器时,他开始在原来的音线外着色,这让我们的乐队成员感到十分兴奋。(“我们真的很期待看到人们如何打破这种局面,”Engel说。)随着他不断“升温”,就产生了一种狂躁的、吓人的旋律,与他当初输入的东西几乎完全不一样。比如,他给了一个“一闪一闪亮晶晶”的节奏想看看会发生什么,在极致的温度下,变成了一首在糟糕旅行中的圣诞曲。
“技术对艺术来说非常重要。”Eck说。试想如果把你的吉他拔掉和弦。现在把它插入这个很棒的电吉他,你会很依赖技术来完成这项工作。他补充道,他们所做的类似于建造一个更好的吉他踏板,甚至就是一个电吉他。至少希望是这样。现在,他们还不确定这项技术将如何影响音乐,或者它是否会被使用。这我想起了Auto-Tune,这是一种录音软件,它一开始是为平淡的流行音乐校正音轨的音轨;后来T-pain和Kanye West这样的说唱歌手,就不再用它了,而是发扬了它的特点,创造出一种新奇的声音。
不管AI的音乐生成技术如何,Eck觉得这将是不朽的。“我们将跟随音乐家,如果有人发现我们正在做的事情,又做了一些更了不起的,我们可能会邀请他加入一起创造更多。”
听着Eck,我可以明显感到他的大脑就是为了探索算法而生的,同时对音乐的热情,引领着他用技术来开发这种给各类音乐家使用的工具。当我问他关于他自己的音乐追求时,他略带羞涩地而我分享了他在咖啡店弹吉他的美好经历,而我则讶异于他并没有把自己创作的最佳时期花在成堆的合成器里。
人工智能和音乐的结合其实已并不是什么新鲜事。20世纪50年代,先锋作曲家Lejaren Hiller和Leonard Isaacson用电脑写了一首“Illiac Suite”。 该乐谱包括了按照某些音乐原理统计生成的音符,例如谐波相互依赖,并基于作曲家对传统音乐的知识规则合成。
直到最近,AI辅助音乐还主要停留在学术界。现在谷歌、索尼、IBM和其他公司都成立了相关的大型研究项目。还有像Jukedeck这样的初创公司,它利用人工智能为视频生成广告和背景音乐。Brain.fm提供功能性的人工智能合成音乐,来帮助用户放松、专注、和促进睡眠等,该技术已经开始盈利。
不同的项目也都看到了类似的结果,但大家都有自己的小算盘。谷歌正在为艺术家设计工具,设计开放式的实验项目,目的是激发创造力。Jukedeck把它的资源集中在工具易用性、市场营销以及寻求节省视频配乐的成本。Jukedeck的联合创始人Patrick Stobbs告诉我,公司希望扩大其客户基础,包括任何对制作音乐感兴趣的人:它希望使用这项技术来帮助那些想要成为音乐家的人,在不学习演奏乐器的情况下就可以创作歌曲。
他说:“就像Instagram让不是专业修图的我们更容易创作出很棒的照片,我们把Jukedeck看作是一个创意工具,让更多的人轻松地制作音乐,并拥有更多的动力。”
大约十年前,一些使用类似人工智能技术的音乐软件应用程序就已经出现了,其中大多是令人沮丧的结果。微软的自动编曲软件Songsmith在阿卡贝拉声道上生成卡西欧键盘式的伴奏。这个节目激发了无数搞笑视频的灵感,例如,Freddie Mercury的“We Will Rock You”的表演,听起来特别像含糊的拉丁Muzak音乐。
从那以后,尽管技术和品味还在继续发生着冲撞,但事情已经开始发生着翻天覆地的变动。从去年开始,在不久的将来,全世界都能看到人工智能生成的音乐将会是什么样子。制片人Alex Da Kid与IBM Watson超级计算机合作,创造了一个朗朗上口的情感歌谣“Not Easy”。 Watson使用了5年的文化数据,包括新闻标题、互联网搜索、电影概要和社交媒体内容,来分析他们周围的趋势和人们的情绪。它还处理了超过2.6万首流行歌曲,寻找共同的主题和音乐模式。利用这一信息,超级计算机确定了近代历史的“情感脉络”,以及可以引起听众强烈情感共鸣的音乐元素。然后Alex用这些数据来选择心碎的主题,以及他喜欢的音乐短语和抒情片段。
随着获得了格莱美的提名,他们又合作了创作了一首更广域的歌曲。“Not Easy”在48小时内到达iTunes热门歌曲排行榜上的第四名,它基本是被遗忘了,但还好还有它背后的故事。原本试图吸引数百万听众的情感温度,似乎并没有表达出来。和Auto-Tune的对比再次出现了:在那些追求完美流行音乐的人手中,AI可以通过数字化的方式实现其最终的成功。
2012年夏天,在欧洲研究委员会(European Research Council)的资助下,索尼计算机科学实验室(Sony CSL)开始了一个为期5年的项目。结果介于歌曲“Not Easy”和Magenta项目之间。自上世纪90年代以来,计算机科学家、爵士乐和流行音乐家、索尼CSL的导演Francois Pachet一直在做与音乐和人工智能有关的研究。他和他的团队与艺术家们的合作比谷歌更直接,他们的目标是用一组更着重输出的名为“Flow Machines”的算法来创造出全新的流行音乐。
去年9月,由Flow Machines协助完成的歌曲“Daddy’s Car”大火。这首和法国作曲家Benoît Carré一同完成的歌曲听上去非常像上世纪60年纪中期Beatles的风格。有可能为了创作这首歌曲,Flow Machines听了非常多Beatles的歌曲。
索尼CSL传播部的工作人员Fiammetta Ghedini表示:“Daddy’s Car其实有一点像是模仿作品。这是对歌曲风格的一次尝试。如果Beatles能够再现江湖的话,你应该能够感受到是什么风格。”
Flow Machines对“风格”的理解是依赖于数据的,这意味着你用特定的音乐来训练它,它就会预测创作音乐的人是想要这种风格的音乐。换句话说,它只根据所选的数据集和程序员设置的约束来理解音乐的规则。在创作Daddy’s Car的时候,Flow Machines给了Carré几个Beatles式旋律和和弦的建议。
为了帮助我理解Flow Machines的艺术潜力,Ghedini向我介绍了一首Carréet 用这个软件创作的相对不太火的歌曲,叫做“Mr. Shadow”。这首歌的训练数据集由包括Cole Porter,George Gershwin,Richard Rodgers和Vernon Duke 在内的经典美国词曲作家的429首歌曲组成。我一连听了好几遍,我能给出的唯一感受就是:令人不安的前卫流行乐。和弦序列是幽魅的,旋律又梦幻和又来势汹汹。Youtube上有一个评论:“几十年后,当终结者用加特林枪杀死人类的时候,这真是一首再好不过的背景音乐了。“我不知道我是否喜欢这首歌,但我觉得这让我看到了一种不同的音乐,而且我想要听更多这一类型的歌曲。”
2016年,在巴黎举行了一场由多名音乐人和Flow Machines共同编曲音乐会。这些作品从艺术的角度来说都是十分迷人和独特的,甚至比Alex Da Kid的歌曲更有趣。Carré希望在今年晚些时候发行他和Flow Machines共同发行的音乐专辑。其他艺术家可能也会效仿。
谷歌一直与艺术家们开展着克制的合作。Eck更倾向于将他的工具应用于实验音乐,而不是大量生产热门单曲,或者制作功能性背景音乐,尽管这些都是潜在的大市场。(Jukedeck在创建一个无限制的免费视频歌曲库方面取得了巨大的进步,这将有利于制作预算,但对作曲家不利。)他希望能影响音乐的艺术方向。他认为,最好的方法就是给那些可能不符合主流品味的前沿艺术家提供工具。
Eck告诉我:“我们应该积极地尝试制作并不是每个人都喜欢的音乐。总有一些新奇的效果,你会得到一些新的和疯狂的东西。就像从麦当娜到碧昂丝那样的巨星们从边缘地带获得灵感一样,未来的流行歌手们也会把辅助地下艺术家的创新编织进他们的MOR图表上。
自上世纪80年代中期以来,英国的一位教授Eduardo Reck Miranda就一直参与这一领域的研究。在他的内心深处有一个特殊的地方,那就是人工智能能够照亮的那些奇怪的缝隙。
Miranda出生在巴西,之前曾是一名作曲家,但却对用科技来辅助音乐创作这个领域情有独钟...他告诉我为了创作《倾听的交响曲》,他开发了人工智能软件,将贝多芬的第7交响曲重新组合,用大脑扫描来解构人们听音乐的方式。
“机器真的能做到吗?在最开始的时候我们也问过这个问题。但是,当我们意识到机器可以做到这一点的时候,我们发现原来的音乐是多单调乏味。然后我们就开始想如何才能让这些机器做些有用的事呢?”
关于AI是否能用于音乐创作的争议大都是在Miranda、Eck和Pachet的实验之前。而这里又不得不谈到一个人——David Cope,一个现代的神秘主义者,他可能比任何人都更了解人工智能和创新大脑之间的关系。
Cope担任加州大学Santa Cruz分校的教职长达30余年时间。这位现年76岁、说话轻声细语的前教授还在继续创作音乐并进行其他艺术创作,主要在用人工智能。
当我走进Cope舒适的位于Santa Cruz的家的楼梯时,他发出警告:“为你生命中真正的古怪时刻做好准备。”没有进一步的解释,他打开办公室的门,露出一个房间,与房子的其余部分形成鲜明对比,完全是一片混乱。吊在天花板上的是几十个风铃。书籍和随机的物体到处乱扔,仿佛它们刚从龙卷风中幸存下来。在房间的中央是一辆健身车。
David Cope
他告诉我,这种混乱是有意为之的:这使他能够看到任何两个物体,并试图找到它们之间的关系。就像他的软件是为音乐而生的一样,这种混乱是一种创造性的提示,它利用了随机性的惊人力量。他说了很多关于这些原理的基本原理。
他十几岁就开始写算法了。他写了大约100本书。在这些书里,早在1977年就有计算机生成的音乐的内容。1980年,他开始了一项名为“音乐智力实验”的长期项目。上世纪90年代,他又开始开发了一个名叫“Emily Howell”的新项目。这是一个以人的名字来命名的项目,部分是为了刺激一下那些声称机器将把人类作曲家赶出工作的反对者。 “机器做我们告诉它们做的事情,它们没有自我意识。我把人工智能定义为利用计算机来了解人类大脑及其工作原理的研究。仅此而已。”
Cope让我猜猜作曲家在创作的时候都会做些什么。我其实并不了解。
Cope表示:“我们创作的时候,其实是在借鉴。这意味着算法中最重要的部分根本不是算法。而是一堆音乐。”我把这解释为艺术家们在创作自己作品的过程中会拼凑旋律、情绪和风格。Cope意识到计算机需要以同样的方式运作。
1988年,他使用数百个他自己的音乐的例子创建了一个数据集。在大约24小时内,他与的程度Emmy就创作了《摇篮坠落》这首曲子,这是他所写的最好的音乐作品之一。他说,听《摇篮坠落》和Emmy创作的曲子证明了他的结论,作曲家们都是在借鉴。
我认识到Google和Sony正在使用的深度学习,其实是对Cope数据依赖方法的直接扩展。Miranda对此深表赞同,但他补充说:“这种方法是不完整的,这也是为什么他的创作过程一直都是实验性的。”
“一个人工智能软件不能完全体现我们如何制作音乐,”Miranda说。“我们能做的最好的事情就是把问题缩小到具体的方面。”
这又导致了创造性生成模型中固有的让人伤脑筋的事:人工智能音乐没有明确的成功标准。由于机器学习技术的发展,语言翻译软件近年来突飞猛进。我们都同意这是多么成功,因为结果是客观的。但是,我们如何去赞同人工智能软件的成功所产生的音乐价值呢?通过在基层的流行度吗?好评?Eck和他在Google的团队通过艺术家的持续兴趣来定义它。当音乐家们在最初的新鲜感消失后继续使用这些工具的时候,就是人工智能在这个巨大而混乱的音乐王国中永久占据一席之地的时候。
在我们采访结束离开Google后,Davis和我讨论了这次的采访经历。“我喜欢看到事物开始瓦解。在某些时候,它会脱轨。它不知道如何处理它被给予的信息。而这恰恰创造了真正有趣的音乐。”
许多艺术家和音乐爱好者都很害怕人工智能技术会让诚实的人失去工作,同时把创造力拖到最小的公分母上。但Davis却很想要看到混乱的局面发生,那些出现裂缝正是像Eck、Engel、Miranda和Pachet等创新者所期待的。但,电脑也会犯错,就像我们一样。而我们将赋予人工智能的那些奇怪的、不完美的、不可预测的人类本能,正是重新定义音乐的动力。