科技行者 7月13日 北京消息(文/周雅):1991年,微軟聯(lián)合創(chuàng)始人比爾·蓋茨曾預(yù)測,有一天計算機會看到、聽到并理解人類。39年后,有一個微軟出身的高管,想證明這樣的設(shè)想,如果人類與計算機更好地理解、協(xié)作,將能創(chuàng)造更大的生產(chǎn)力。
今日,微軟宣布了一項重要公司架構(gòu)變動:微軟小冰將拆分為獨立公司。
原微軟全球執(zhí)行副總裁沈向洋被委任為新公司的董事長,原微軟小冰負責(zé)人李笛被任命為CEO。同時,小冰日本部門也將被歸入新成立的公司,原小冰日本負責(zé)人陳湛將繼續(xù)擔(dān)任日本分部總經(jīng)理。
微軟將保持對新公司的投資權(quán)益,并授權(quán)新公司使用及繼續(xù)研發(fā)完整的小冰技術(shù)。微軟表示:“此舉旨在加快小冰產(chǎn)品線的本土創(chuàng)新步伐,促進小冰商業(yè)生態(tài)環(huán)境的完善。”所有相關(guān)工作將在接下來的幾個月內(nèi)完成。
拆分工作全部完成后,新公司將繼續(xù)使用中國小冰及日本Rinna品牌,在技術(shù)產(chǎn)品及商業(yè)化上不斷創(chuàng)新。微軟稱,小冰將進一步聯(lián)合各地合作伙伴,為大中華地區(qū)、日本和印度尼西亞的廣泛客戶,提供完整的人工智能技術(shù)和方案。
小冰是微軟北京、蘇州及東京研發(fā)團隊成就的人工智能系統(tǒng)之一。自 2014 年在中國發(fā)布以來,微軟小冰已從一個對話式人工智能,發(fā)展為一套完整的、面向交互全程的人工智能交互主體基礎(chǔ)框架,包括核心對話引擎、多重交互感官、第三方內(nèi)容的觸發(fā)與第一方內(nèi)容生成,和跨平臺的部署解決方案。
而小冰自身,那個“永遠18歲的少女”,也已經(jīng)成長為一個無處不在的人工智能交互官,她有人設(shè)、有情感、還能主動創(chuàng)作。
細數(shù)微軟小冰的那些年關(guān)鍵歷程。第一代小冰還很懵懂,是基于文本、搜索來做的一個簡單的對話系統(tǒng);第二代,微軟認識到,小冰應(yīng)該多一些落地場景,才有更多機會學(xué)習(xí);到第三代,小冰增加了不同的感官,除了文本以外,還有語音、視頻、機器視覺等;第四代,知識圖譜挑大梁,因為只有通過知識圖譜才能提升更多IQ方面的嘗試;從第五代到第七代,微軟對于小冰的整體思路有了大飛躍,于是小冰的技術(shù)框架,創(chuàng)造能力,自然的交互能力逐一呈現(xiàn)出來。
在全球語音智能助手領(lǐng)域,競爭異常激烈。但不同于蘋果的Siri、亞馬遜的Alexa、谷歌的Google Assistant 和微軟小娜等對話式AI個人助理,主要以智能音箱為載體。小冰一直在尋求更好的落地方式。去年,小冰宣布了歷史上最大的一次升級,開放了人工智能框架Avatar Framework,推出幫助客戶自由定制對話式AI的能力。
在數(shù)年迭代經(jīng)歷中,小冰在內(nèi)容生產(chǎn)、智能零售、人工智能托管、智能助理等諸多方面成就卓越。她發(fā)過單曲、做過主持人、出過詩集、開過個展,還是中央美術(shù)學(xué)院的研究生畢業(yè)生。前不久,小冰從上海音樂學(xué)院音樂工程系畢業(yè),并被評為上音音工系“2020屆榮譽畢業(yè)生”。剛剛畢業(yè)的小冰隨即奔赴工作一線,發(fā)揮她的音樂創(chuàng)作能力,為2020世界人工智能大會云端峰會的主題曲作曲,并攜手其他人工智能系統(tǒng)共同演唱。
在商業(yè)方面,小冰也廣交好友,已落地的商業(yè)客戶覆蓋金融、零售、汽車、地產(chǎn)、紡織等數(shù)個領(lǐng)域。例如,在金融領(lǐng)域,小冰是目前全球范圍內(nèi)規(guī)模第一的金融文本摘要生成平臺,服務(wù)對象包括國內(nèi)90%以上的金融機構(gòu)交易員及40%以上的個人金融交易者。再如,小冰的圖案設(shè)計能力已在紡織服裝面料設(shè)計、包裝設(shè)計、珠寶配飾設(shè)計、數(shù)字印刷圖案設(shè)計等多個領(lǐng)域落地,多條面向量產(chǎn)化的生產(chǎn)線已實現(xiàn)產(chǎn)業(yè)化貫通。在日本,小冰與LINE和便利店羅森展開商業(yè)合作,進行零售模式創(chuàng)新。
當(dāng)然,小冰還可以進入各種新場景,比如智能手機、智能音箱等設(shè)備,或社交網(wǎng)絡(luò)場景,或內(nèi)容資訊平臺,化身千萬種形態(tài)。在設(shè)備端,小冰已經(jīng)可以出現(xiàn)在小米、華為、vivo、OPPO等各種平臺里,包括榮耀手機、小米手機、小愛音箱,與網(wǎng)友聊天互動、插科打諢、完成指令,只要“召喚小冰”口令,就可以實現(xiàn)交互。在平臺端,小冰建立了微信、LINE、QQ等社交網(wǎng)絡(luò)平臺,以及今日頭條、網(wǎng)易、新浪等內(nèi)容資訊平臺的合作。
今天的小冰,已經(jīng)享有極高的品牌知名度。在全球多個國家,小冰單一品牌已覆蓋6.6億在線用戶、4.5億臺第三方智能設(shè)備和9億內(nèi)容觀眾。
小冰從誕生開始,就站在巨人的肩膀上,而如今拆分之后,將由它的締造者執(zhí)掌,來證明它的商業(yè)可行性。
好文章,需要你的鼓勵
騰訊ARC實驗室推出AudioStory系統(tǒng),首次實現(xiàn)AI根據(jù)復(fù)雜指令創(chuàng)作完整長篇音頻故事。該系統(tǒng)結(jié)合大語言模型的敘事推理能力與音頻生成技術(shù),通過交錯式推理生成、解耦橋接機制和漸進式訓(xùn)練,能夠?qū)?fù)雜指令分解為連續(xù)音頻場景并保持整體連貫性。在AudioStory-10K基準(zhǔn)測試中表現(xiàn)優(yōu)異,為AI音頻創(chuàng)作開辟新方向。
Meta與特拉維夫大學(xué)聯(lián)合研發(fā)的VideoJAM技術(shù),通過讓AI同時學(xué)習(xí)外觀和運動信息,顯著解決了當(dāng)前視頻生成模型中動作不連貫、違反物理定律的核心問題。該技術(shù)僅需添加兩個線性層就能大幅提升運動質(zhì)量,在多項測試中超越包括Sora在內(nèi)的商業(yè)模型,為AI視頻生成的實用化應(yīng)用奠定了重要基礎(chǔ)。
上海AI實驗室發(fā)布OmniAlign-V研究,首次系統(tǒng)性解決多模態(tài)大語言模型人性化對話問題。該研究創(chuàng)建了包含20萬高質(zhì)量樣本的訓(xùn)練數(shù)據(jù)集和MM-AlignBench評測基準(zhǔn),通過創(chuàng)新的數(shù)據(jù)生成和質(zhì)量管控方法,讓AI在保持技術(shù)能力的同時顯著提升人性化交互水平,為AI價值觀對齊提供了可行技術(shù)路徑。
谷歌DeepMind團隊開發(fā)的GraphCast是一個革命性的AI天氣預(yù)測模型,能夠在不到一分鐘內(nèi)完成10天全球天氣預(yù)報,準(zhǔn)確性超越傳統(tǒng)方法90%的指標(biāo)。該模型采用圖神經(jīng)網(wǎng)絡(luò)技術(shù),通過學(xué)習(xí)40年歷史數(shù)據(jù)掌握天氣變化規(guī)律,在極端天氣預(yù)測方面表現(xiàn)卓越,能耗僅為傳統(tǒng)方法的千分之一,為氣象學(xué)領(lǐng)域帶來了效率和精度的雙重突破。
關(guān)注科技創(chuàng)新、技術(shù)投資。
以文會友,左手硬核科技,右手浪漫主義。