在最近閉幕的2019年奧斯卡頒獎典禮上,包括最佳劇本與最佳視覺效果在內(nèi)的眾多獎項紛紛覓得其主。雖然AI在電影業(yè)中還不太可能很快編寫出廣受贊譽的劇本,但也已經(jīng)開始在幕后默默貢獻自己的力量。
在電影業(yè)當中,CGI與AI的結合已經(jīng)能夠創(chuàng)建出逼真的場景,但從業(yè)者仍然很難將這些場景制作成動畫。相信很多朋友聽說過“恐怖谷”理論,就是說隨著視覺效果在絕對準確性或者完美性層面的不斷提升,觀眾反而會感到不舒服。另外,在對細節(jié)的揣測與表達方面,AI也完全無法與演技精湛的演員相媲美。
AI還能夠幫助創(chuàng)意從業(yè)者通過社交媒體篩選主題,從而發(fā)現(xiàn)那些受到普遍關注的內(nèi)容。另外,AI也可以幫助我們選擇具有潛力的劇本。然而,任何AI系統(tǒng)的能力都會受到所獲取數(shù)據(jù)及其編程預測算法的限制。
很明顯,創(chuàng)意才是闖入奧斯卡殿堂的門票,而可預測性則幾乎站在對立面上——那么AI在電影業(yè)當中是否還有其它發(fā)展空間?
劇本編寫中的AI
目前,電影業(yè)中的AI還無法編寫出劇本,或者至少是好的劇本。某AI程序曾為情人節(jié)編寫了一份恐怖的情歌歌詞,其中寫道“我問窗簾,它說它是真的”,以及“這一次,讓我們把藥當飯吃”。
這款程序顯然是無法辨別思維與語言間的區(qū)別。以上歌詞雖然讀起來似乎有意義,但不知何故卻不知所云。實際上,創(chuàng)造力與智能一樣,具有難以捉摸的特性,這也使其成為全體AI的努力方向。
不過雖然存在這些限制,電影公司還是嘗試利用數(shù)據(jù)科學去衡量哪些劇本更有可能成為大片、爆款。
Verne Global公司深度學習主管Vas Kapsalis解釋稱,“AI能夠接收已經(jīng)編寫完成的輸入內(nèi)容或劇本,而后對這些劇本進行評估,從而確定哪些要素決定一部電影的好壞。而其中的關鍵,在于AI會嘗試推斷特定劇本的可能結果,包括影片最終能否成功。”
“要將一份好劇本從一大堆差劇本中提取出來,所需要的算法其實非常簡單。”
電影制作人還可以在電影行業(yè)之內(nèi)利用AI進行劇本規(guī)劃。
他解釋稱,“AI在計劃劇本中利用類似的技術進行預測性營銷,包括追蹤觀眾喜歡談論什么,哪些內(nèi)容更受歡迎等。通過這些因素,就能夠找出更可能引起觀眾共鳴的劇本。然而,我們還無法利用AI取代編劇或者真正優(yōu)秀的演員。”
電影業(yè)中的AI
長久以來,從業(yè)者們利用CGI在電影當中產(chǎn)生強烈的視覺效果,而將人工智能加入進來,會使得效果得到進一步提升。近乎逼真的圖像意味著觀眾幾乎無法在大銀幕上區(qū)分哪些是實景,哪些是由計算機創(chuàng)建出的內(nèi)容。
視覺效果技術的變化一直迅猛到令人應接不暇。
Kapsalis解釋稱,“相較于以往創(chuàng)建物理模型并由木偶操縱者制作定格動畫的方法,如今我們創(chuàng)建的是一套電子模型加上演員動畫。傳統(tǒng)技術的核心在于追蹤實體與調(diào)整模型,從而讓其看起來與演員的行動保持一致。”
但AI在電影中的應用存在局限性,特別是動畫領域,這是因為其中往往涉及大量面部表情。
“人類豐富的表情很難被捕捉到。道理很簡單,你可以試試模仿其他人,馬上就能體會到其中的難處。”
Kapsalis表示,AI與CGI都在《星球大戰(zhàn):最后的絕地武士》一片中得到應用,負責讓2016年12月意外去世的Carrie Fisher重現(xiàn)銀幕。
“我們可以很輕松地讓事物看起來如照片般真實,但是動畫的制作卻復雜得多,自然也困難得多。”
AI與自主代理系統(tǒng)的一次實際應用出現(xiàn)在2013年的《僵尸世界大戰(zhàn)》電影當中,這部由Brad Pitt主演的末世片中有著成群結隊的大批僵尸。
“在這種情況下,相較于雇用一大批群眾演員,嘗試利用AI技術來實現(xiàn)顯然更具可行性。這不光效率更高,而且也并不需要太多計算資源。由于僵尸群體規(guī)模龐大,而且亂糟糟擠成一堆,觀眾很難看到其中的瑕疵。”
恐怖谷理論
雖然電影業(yè)中的AI有望產(chǎn)生令人驚嘆的視覺效果,但“恐怖谷”理論仍然客觀存在。
Kapsalis解釋道,“隨著事物變得越來越逼真,我們首先會感到自然舒適。但在此之后,人們會懷疑其中是不是出了什么問題。”
他表示,但這種怪異感或者說別扭感有時候也能夠在電影中產(chǎn)生良好的效果,比如用于表現(xiàn)洶涌襲來的尸潮。
他指出,“這就是AI可以發(fā)揮的舞臺了。它不僅僅是一種智能,同時也可以成為一種可行的圖形增強方式。其中用到了AI提供的高端視頻處理功能。”
在電影業(yè)當中,AI技術能夠顯著節(jié)約生產(chǎn)工作耗費的時間與金錢。如果電影制片人需要大量演員,那么招募與創(chuàng)作周期可能既昂貴又漫長。
“在這一領域當中,AI與CGI已經(jīng)屬于非??煽康募夹g。然而,如果想要用于完全替代演員,那么它們可能反而更加耗時,因為技術本身還不夠完善。我們必須得加入更多手動調(diào)整來獲得與真人表演類似的效果。”
相信大家已經(jīng)感常見到,如今的AI取得了令人矚目的成果,而未來這一切還將進一步升級。
Kapsalis指出,“AI未來會涉及更為微妙的部分。”
“未來將會出現(xiàn)越來越真實的表現(xiàn)效果,包括提供更好的運動動畫,從而創(chuàng)造更自然的面部表情。而且我堅信,隨著時間的推移,這項技術將實現(xiàn)民主化從而在可用性方面得到顯著優(yōu)化。”
然而,目前從業(yè)者們面臨著一個難題:在AI依賴與傳統(tǒng)制作方式之間尋找平衡點。
“但根據(jù)我們的觀看,情況每年都在趨于改善。”
有一種預測指出,AI技術將持續(xù)挑戰(zhàn)我們的觀念——無論是利用AI在幕后制作電影,還是將其成果直接呈現(xiàn)在大銀屏上,其總歸會受到電影行業(yè)的真正關注。
好文章,需要你的鼓勵
騰訊ARC實驗室推出AudioStory系統(tǒng),首次實現(xiàn)AI根據(jù)復雜指令創(chuàng)作完整長篇音頻故事。該系統(tǒng)結合大語言模型的敘事推理能力與音頻生成技術,通過交錯式推理生成、解耦橋接機制和漸進式訓練,能夠?qū)碗s指令分解為連續(xù)音頻場景并保持整體連貫性。在AudioStory-10K基準測試中表現(xiàn)優(yōu)異,為AI音頻創(chuàng)作開辟新方向。
Meta與特拉維夫大學聯(lián)合研發(fā)的VideoJAM技術,通過讓AI同時學習外觀和運動信息,顯著解決了當前視頻生成模型中動作不連貫、違反物理定律的核心問題。該技術僅需添加兩個線性層就能大幅提升運動質(zhì)量,在多項測試中超越包括Sora在內(nèi)的商業(yè)模型,為AI視頻生成的實用化應用奠定了重要基礎。
上海AI實驗室發(fā)布OmniAlign-V研究,首次系統(tǒng)性解決多模態(tài)大語言模型人性化對話問題。該研究創(chuàng)建了包含20萬高質(zhì)量樣本的訓練數(shù)據(jù)集和MM-AlignBench評測基準,通過創(chuàng)新的數(shù)據(jù)生成和質(zhì)量管控方法,讓AI在保持技術能力的同時顯著提升人性化交互水平,為AI價值觀對齊提供了可行技術路徑。
谷歌DeepMind團隊開發(fā)的GraphCast是一個革命性的AI天氣預測模型,能夠在不到一分鐘內(nèi)完成10天全球天氣預報,準確性超越傳統(tǒng)方法90%的指標。該模型采用圖神經(jīng)網(wǎng)絡技術,通過學習40年歷史數(shù)據(jù)掌握天氣變化規(guī)律,在極端天氣預測方面表現(xiàn)卓越,能耗僅為傳統(tǒng)方法的千分之一,為氣象學領域帶來了效率和精度的雙重突破。