微軟首席執(zhí)行官薩蒂亞·納德拉(Satya Nadella)表示,他愿意去做一些“大事”,而不是進行一次大規(guī)模的收購,納德拉認為,在當下的“后后PC時代”,微軟所推出的12英寸全新Surface Pro平板電腦將能夠取代筆記本電腦,并表示微軟并沒有要分拆Xbox游戲部門的計劃,也沒有變賣Bing搜索引擎的打算。
自今年二月份從微軟前任首席執(zhí)行官史蒂夫·鮑爾默(Steve Ballmer)手中接管CEO一職以來,這是納德拉的首次公開訪談,納德拉還表示,雖然我們的創(chuàng)始人比爾·蓋茨提供的建議一直是“有用的”,但我們卻從未混淆過誰正在負責掌管這家世界上最大的軟件制造商。
當?shù)貢r間本周二,納德拉在首屆Code大會的開幕主題演講上說道:“我是首席執(zhí)行官,我負責經(jīng)營這家公司。”
在包括智能手機、平板電腦和搜索這些主要市場中,微軟因未能與其競爭對手(如蘋果和谷歌等)并駕齊驅(qū)而受到了批判,在這種局勢下,納德拉接手微軟擔任了CEO一職。而在過去的三個月里,納德拉一直在宣揚微軟為信奉“移動第一,云第一的世界”做出的努力,以及該公司為其Windows操作系統(tǒng)以外的平臺提供微軟軟件和服務所付出的辛勞。他向科技公司的CEO們、業(yè)內(nèi)人士和有影響力的觀眾表示,今年四月,微軟為蘋果的iPad平板電腦推出了微軟最暢銷的辦公軟件應用,這個決定是種致勝的“方法”。
納德拉表示:“這樣做的目的是要確保我們的服務能夠適用于所有設備,市場上不僅會出現(xiàn)更多Windows設備,還會出現(xiàn)更多其他設備,而我們必須確保我們的服務能夠在所有設備上運行。”
此外,微軟還在本次大會上展示了一種近實時語言翻譯技術(shù),專為微軟Skype視頻會議服務設計運行,該視頻服務已擁有3億多已連接用戶。到今年年底,Skype的實時翻譯將會支持多國語言,在為其他平臺發(fā)布該應用前,它將會作為一種應用最先向Windows 8用戶開放。
微軟表示,該公司一直致力于翻譯軟件的語音識別和翻譯技術(shù),時間已超過10年。在向與會者展示了Skype如何進行英語-德語互譯后,微軟Skype部門企業(yè)副總裁Gurdeep Pall在一篇博客文章中寫道:“這一技術(shù)還處于早期發(fā)展中,但《星際迷航》中的通用翻譯設想并非遙不可及。”
作為在微軟工作22年的老將,納德拉也被迫談到了在他任職期間公司的失誤。“這是一個有趣的問題,我應該為此煩惱呢,還是應該對我們正在做什么更加關心呢?”
微軟在本月推出的Surface Pro 3憑借其大屏幕為平板電腦開創(chuàng)了一個新類別。納德拉說道,Surface Pro 3標志著微軟的一段“改善之旅”,它已經(jīng)在平板電腦市場落后于蘋果的iPad以及搭載谷歌Android移動操作系統(tǒng)的各種設備了,他稱Surface是“有希望的”,并笑著指出:“任何并未轟動一時的東西都是有希望的。”
至于該公司已于上月以72億美元完成的諾基亞智能手機業(yè)務的收購,納德拉拒絕表示他最初對這項交易持有的態(tài)度是支持還是反對。而他所言為,微軟承認擁有一個“完整的”硬件、軟件和服務系統(tǒng)的價值,它不能讓公司的合作伙伴或原始設備制造商們承擔為其軟件和服務開發(fā)硬件的所有風險。
當被問及微軟是否有興趣進行一次大規(guī)模收購時,納德拉表示:“我們需要做的是一些大事。”
所謂的大事或許會包括研制一個新的平臺。對Facebook首席執(zhí)行官馬克·扎克伯格(Mark Zuckerberg)最近以20億美元對Oculus公司的虛擬實境體驗機的收購,納德拉表示:“我們所有人都在尋找下一個大的設備平臺。”但他說道:“對我來說,不用耗資20億美元,有許多更便宜的方式去找到這個平臺。”
好文章,需要你的鼓勵
騰訊ARC實驗室推出AudioStory系統(tǒng),首次實現(xiàn)AI根據(jù)復雜指令創(chuàng)作完整長篇音頻故事。該系統(tǒng)結(jié)合大語言模型的敘事推理能力與音頻生成技術(shù),通過交錯式推理生成、解耦橋接機制和漸進式訓練,能夠?qū)碗s指令分解為連續(xù)音頻場景并保持整體連貫性。在AudioStory-10K基準測試中表現(xiàn)優(yōu)異,為AI音頻創(chuàng)作開辟新方向。
Meta與特拉維夫大學聯(lián)合研發(fā)的VideoJAM技術(shù),通過讓AI同時學習外觀和運動信息,顯著解決了當前視頻生成模型中動作不連貫、違反物理定律的核心問題。該技術(shù)僅需添加兩個線性層就能大幅提升運動質(zhì)量,在多項測試中超越包括Sora在內(nèi)的商業(yè)模型,為AI視頻生成的實用化應用奠定了重要基礎。
上海AI實驗室發(fā)布OmniAlign-V研究,首次系統(tǒng)性解決多模態(tài)大語言模型人性化對話問題。該研究創(chuàng)建了包含20萬高質(zhì)量樣本的訓練數(shù)據(jù)集和MM-AlignBench評測基準,通過創(chuàng)新的數(shù)據(jù)生成和質(zhì)量管控方法,讓AI在保持技術(shù)能力的同時顯著提升人性化交互水平,為AI價值觀對齊提供了可行技術(shù)路徑。
谷歌DeepMind團隊開發(fā)的GraphCast是一個革命性的AI天氣預測模型,能夠在不到一分鐘內(nèi)完成10天全球天氣預報,準確性超越傳統(tǒng)方法90%的指標。該模型采用圖神經(jīng)網(wǎng)絡技術(shù),通過學習40年歷史數(shù)據(jù)掌握天氣變化規(guī)律,在極端天氣預測方面表現(xiàn)卓越,能耗僅為傳統(tǒng)方法的千分之一,為氣象學領域帶來了效率和精度的雙重突破。