與其它行業(yè)一樣,在音樂行業(yè),AI技術(shù)能夠?qū)崿F(xiàn)服務(wù)自動化、發(fā)現(xiàn)大量數(shù)據(jù)集中的模式與見解、并提高執(zhí)行效率。
AI推動音樂產(chǎn)業(yè)的迅猛發(fā)展
企業(yè)正逐步被技術(shù)重塑,音樂行業(yè)同樣不例外。麥肯錫報(bào)告顯示,到2030年,將有70%的公司至少采用一種AI技術(shù)。AI可以用作補(bǔ)充并增強(qiáng)人類的工作能力、業(yè)務(wù)效率。利用AI帶來的見解與支持,我們將能夠更高效地做出更好的選擇,并借此推動增長與創(chuàng)新。在AI技術(shù)的影響之下,創(chuàng)作流程可能也將發(fā)生變化。
Scott Cohen是音樂行業(yè)的一位意見領(lǐng)袖,他看到了技術(shù)對于音樂行業(yè)未來前景的潛在影響。他對數(shù)字音樂時(shí)代下發(fā)行廠商的運(yùn)營構(gòu)思,最終發(fā)展成為The Orchard公司——2015年被索尼以2億美元收購。在Eurosonic Nooderslag大會的主題演講當(dāng)中,他表示“每過十年,都會出現(xiàn)一些給音樂行業(yè)帶來深遠(yuǎn)影響的事物。了解到這一點(diǎn),我們還有理由對科技界的動向漠不關(guān)心嗎?”
他解釋稱,目前每天有2萬首新曲目被上傳至Spotify,AI技術(shù)則能夠快速對這些曲目進(jìn)行分類,并根據(jù)聽眾以往的喜好為其提供推薦內(nèi)容。在Cohen看來,AI與大數(shù)據(jù)的出現(xiàn)令“音樂風(fēng)格”變得不再適用;因?yàn)锳I所生成的播放列表不再基于風(fēng)格流派,而更關(guān)注音樂本身的質(zhì)量。此外,他還提到,我們當(dāng)前擁有無限選擇空間的模式將被打破,并推薦了一個(gè)新的可信推薦模型。區(qū)塊鏈等技術(shù)能夠讓人們不再需要通過中間商與音樂作品建立聯(lián)系。音樂演出行業(yè)也應(yīng)該考慮如何將增強(qiáng)與虛擬現(xiàn)實(shí)融入音樂會體驗(yàn)當(dāng)中。
AI創(chuàng)作音樂
早在1951年,英國計(jì)算機(jī)科學(xué)家阿蘭·圖靈就已經(jīng)開始利用幾乎塞滿整層樓的機(jī)器記錄計(jì)算機(jī)生成的音樂。近年來,新西蘭研究人員在65年之后重新恢復(fù)了這些錄音。如今,AI或者利用AI技術(shù)創(chuàng)作音樂的嘗試仍在繼續(xù)。AI在創(chuàng)作音樂作品之前,首先會分析來自不同作品的數(shù)據(jù)。通過強(qiáng)化學(xué)習(xí),算法能夠?qū)W習(xí)到哪些特征與模式更能創(chuàng)造出令人愉快或者朗朗上口的音樂旋律。AI模型還能夠以獨(dú)特的方式將各種元素組合起來,從而組合成創(chuàng)新的音樂數(shù)字。
科技企業(yè)正在投資未來,希望利用AI技術(shù)創(chuàng)作或協(xié)助音樂家創(chuàng)作音樂。谷歌的Magenta項(xiàng)目是一套開源平臺,AI與索尼借此共同編寫出的Flow Machines系統(tǒng)已經(jīng)發(fā)行了第一首AI原創(chuàng)作品“Daddy’s Car”。
音樂行業(yè)的音樂家以及專業(yè)人士也需要盡快掌握技術(shù)技能,以充分利用AI工具的力量幫助他們更好地完成工作。
Jukedeck 以及 Amper Music等其它AI服務(wù)也在幫助業(yè)余音樂家在AI技術(shù)的支持下編寫自己的音樂作品。
利用AI進(jìn)行音頻控制
音頻母帶制作過程當(dāng)中,AI也能夠針對任意設(shè)備進(jìn)行聆聽體驗(yàn)優(yōu)化。基于AI技術(shù)的母帶制作服務(wù)(例如LANDR)為音樂家們提供了一種成本遠(yuǎn)低于人類母帶制作服務(wù)的替代性方案。截至目前,已經(jīng)有超過200萬音樂家利用它制作出超過1000萬首歌曲。雖然音頻母帶制作仍然涉及一些創(chuàng)意性元素,也有不少人更傾向于選擇人類合作者,但AI技術(shù)確實(shí)幫助更多不具備音頻調(diào)整技能的藝術(shù)家們解決了這個(gè)大難題。
AI、音樂營銷與發(fā)現(xiàn)下一位大明星
聽眾們將如何發(fā)掘出新的藝術(shù)家,消費(fèi)者又該如何判斷試聽誰的作品?在這方面,AI技術(shù)同樣能夠幫上大忙。根據(jù)BuzzAngle Music發(fā)布的2018年年終報(bào)告,單在這一年當(dāng)中美國的音頻流點(diǎn)擊量就高達(dá)5346億次。幫助新藝術(shù)家們進(jìn)行自我營銷無疑會帶來高昂的成本,而如果無法有效完成營銷,大量才華橫溢的藝術(shù)家都有可能遭到埋沒。AI技術(shù)能夠幫助確定哪些粉絲會喜歡上哪些藝術(shù)家的作品。同樣,以Spotify的Discovery Weekly為代表的AI支持型功能可以為每位聽眾提供精選作品鋪,幫助粉絲們對音樂資源進(jìn)行快速分類,以找到能夠真正吸引他們的新作品。
人工智能還通過A&R(藝術(shù)家與曲目)發(fā)現(xiàn)給音樂行業(yè)帶來巨大助力。以往,梳理音樂作品并尋找有潛力的未簽約藝術(shù)家一直是項(xiàng)極為困難的工作;在如今這個(gè)流媒體音樂泛濫的時(shí)代下,問題的嚴(yán)重性又更上一層樓。華納音樂集團(tuán)去年就收購了一家科技初創(chuàng)企業(yè),該公司利用算法審查社交、流媒體與巡演數(shù)據(jù),用以尋找有前途的人才。蘋果公司也收購了一家專門從事音樂分析的初創(chuàng)企業(yè),負(fù)責(zé)支持其A&R流程。
總而言之,AI技術(shù)正在幕后悄悄改變著我們聆聽音樂的方式。
好文章,需要你的鼓勵
新加坡國立大學(xué)研究團(tuán)隊(duì)開發(fā)了SPIRAL框架,通過讓AI與自己對弈零和游戲來提升推理能力。實(shí)驗(yàn)顯示,僅訓(xùn)練AI玩簡單撲克游戲就能讓其數(shù)學(xué)推理能力提升8.6%,通用推理提升8.4%,且無需任何數(shù)學(xué)題目作為訓(xùn)練材料。研究發(fā)現(xiàn)游戲中的三種推理模式能成功轉(zhuǎn)移到數(shù)學(xué)解題中,為AI訓(xùn)練提供了新思路。
同濟(jì)大學(xué)團(tuán)隊(duì)開發(fā)的GIGA-ToF技術(shù)通過融合多幀圖像的"圖結(jié)構(gòu)"信息,創(chuàng)新性地解決了3D相機(jī)噪聲問題。該技術(shù)利用圖像間的不變幾何關(guān)系,結(jié)合深度學(xué)習(xí)和數(shù)學(xué)優(yōu)化方法,在合成數(shù)據(jù)集上實(shí)現(xiàn)37.9%的精度提升,并在真實(shí)設(shè)備上展現(xiàn)出色泛化能力,為機(jī)器人、AR和自動駕駛等領(lǐng)域提供更可靠的3D視覺解決方案。
伊利諾伊大學(xué)研究團(tuán)隊(duì)通過對比實(shí)驗(yàn)發(fā)現(xiàn),經(jīng)過強(qiáng)化學(xué)習(xí)訓(xùn)練的視覺語言模型雖然表現(xiàn)出"頓悟時(shí)刻"現(xiàn)象,但這些自我糾錯(cuò)行為并不能實(shí)際提升推理準(zhǔn)確率。研究揭示了AI模型存在"生成-驗(yàn)證差距",即生成答案的能力強(qiáng)于驗(yàn)證答案質(zhì)量的能力,且模型在自我驗(yàn)證時(shí)無法有效利用視覺信息,為AI多模態(tài)推理發(fā)展提供了重要啟示。
MIT等頂尖機(jī)構(gòu)聯(lián)合提出SparseLoRA技術(shù),通過動態(tài)稀疏性實(shí)現(xiàn)大語言模型訓(xùn)練加速1.6倍,計(jì)算成本降低2.2倍。該方法使用SVD稀疏性估計(jì)器智能選擇重要計(jì)算部分,在保持模型性能的同時(shí)顯著提升訓(xùn)練效率,已在多個(gè)任務(wù)上驗(yàn)證有效性。