CNET科技資訊網(wǎng) 4月18日 北京消息(文/孫封蕾):“用三個(gè)星期的時(shí)間,打造一款移動(dòng)直播的APP”;“移動(dòng)直播突然就火了,以至于我們都沒時(shí)間去想怎么來推廣金山云做移動(dòng)直播有多專業(yè)”……
金山云合伙人朱樺
這些話聽上去像是說大話,但是,看著金山云合伙人朱樺嚴(yán)肅的表情,臉上完全沒有“吹牛”的影子。
所以,金山云組織一場名叫“如何快速打造一款月流水過億的移動(dòng)直播App”的沙龍就完全不奇怪了。
那么,快速打造,到底有多快呢?
朱樺說:“在我們平臺(tái)上,最快的記錄是6個(gè)人的研發(fā)團(tuán)隊(duì),用三個(gè)星期的時(shí)間,把iOS和安卓客戶端,完成了從開始設(shè)計(jì)App到最后發(fā)布App。”
這聽起來感覺不可能,但是實(shí)際上,以目前的技術(shù)程度來看App用三個(gè)星期的時(shí)間來完成,肯定是夠的,而在開發(fā)這款A(yù)pp的同時(shí),移動(dòng)直播的部分,只要把視頻所有的東西打包進(jìn)去,與App的開發(fā)可以實(shí)現(xiàn)同步完成,開發(fā)團(tuán)隊(duì)可以對視頻毫無概念,金山云可以幫助他們把服務(wù)端,到視頻前端的問題,一并解決。
因?yàn)檫@個(gè)速度,所以,在移動(dòng)直播領(lǐng)域的市場份額,金山云差不多占到了三分之一以上。
提及進(jìn)入移動(dòng)直播領(lǐng)域的原因,朱樺指出,一年半到兩年前開始,金山云主要是做存儲(chǔ)的業(yè)務(wù),當(dāng)時(shí)主要針對小米手機(jī)用戶。不到一年的時(shí)間里,小米手機(jī)里面視頻的體積和數(shù)量有個(gè)巨大的體現(xiàn),2014年和2015年的年初比,大概視頻的體積大概翻了7倍,這個(gè)數(shù)字幾何倍數(shù)的成長,不僅僅包括視頻的個(gè)數(shù),還包括視頻體積。
基于這樣的數(shù)據(jù),金山云判斷,視頻是互聯(lián)網(wǎng)未來發(fā)展的一個(gè)方向,經(jīng)歷過讀圖時(shí)代,經(jīng)歷過視頻時(shí)代,移動(dòng)視頻被金山云判斷為未來的突發(fā)點(diǎn),所以開始在戰(zhàn)略上向視頻領(lǐng)域傾斜,而且在發(fā)展過程中發(fā)現(xiàn),移動(dòng)端的需求越來越大。
盡管做了充分準(zhǔn)備,但朱樺也不可否認(rèn),移動(dòng)直播的洶涌來襲還是始料未及的。提前一年多的時(shí)間就已經(jīng)做了布局準(zhǔn)備,在市場爆發(fā)之時(shí),基本做到了行業(yè)的最高水準(zhǔn),所能提供的技術(shù)水平可以達(dá)到BAT級別。
朱樺舉例,移動(dòng)直播有30%--40%的情況下都處于弱網(wǎng)環(huán)境,是在3G網(wǎng)絡(luò)下,丟包非常嚴(yán)重。在這種環(huán)境下,能夠讓主播把視頻推上來,這個(gè)技術(shù)不是那么容易做到的,需要通過一些比較特殊的手段,比如說你要模擬網(wǎng)絡(luò)損傷的狀況,這就需要有專業(yè)的設(shè)備和專業(yè)的環(huán)境才能夠達(dá)到,一般情況下很難做得到。
好文章,需要你的鼓勵(lì)
騰訊ARC實(shí)驗(yàn)室推出AudioStory系統(tǒng),首次實(shí)現(xiàn)AI根據(jù)復(fù)雜指令創(chuàng)作完整長篇音頻故事。該系統(tǒng)結(jié)合大語言模型的敘事推理能力與音頻生成技術(shù),通過交錯(cuò)式推理生成、解耦橋接機(jī)制和漸進(jìn)式訓(xùn)練,能夠?qū)?fù)雜指令分解為連續(xù)音頻場景并保持整體連貫性。在AudioStory-10K基準(zhǔn)測試中表現(xiàn)優(yōu)異,為AI音頻創(chuàng)作開辟新方向。
Meta與特拉維夫大學(xué)聯(lián)合研發(fā)的VideoJAM技術(shù),通過讓AI同時(shí)學(xué)習(xí)外觀和運(yùn)動(dòng)信息,顯著解決了當(dāng)前視頻生成模型中動(dòng)作不連貫、違反物理定律的核心問題。該技術(shù)僅需添加兩個(gè)線性層就能大幅提升運(yùn)動(dòng)質(zhì)量,在多項(xiàng)測試中超越包括Sora在內(nèi)的商業(yè)模型,為AI視頻生成的實(shí)用化應(yīng)用奠定了重要基礎(chǔ)。
上海AI實(shí)驗(yàn)室發(fā)布OmniAlign-V研究,首次系統(tǒng)性解決多模態(tài)大語言模型人性化對話問題。該研究創(chuàng)建了包含20萬高質(zhì)量樣本的訓(xùn)練數(shù)據(jù)集和MM-AlignBench評測基準(zhǔn),通過創(chuàng)新的數(shù)據(jù)生成和質(zhì)量管控方法,讓AI在保持技術(shù)能力的同時(shí)顯著提升人性化交互水平,為AI價(jià)值觀對齊提供了可行技術(shù)路徑。
谷歌DeepMind團(tuán)隊(duì)開發(fā)的GraphCast是一個(gè)革命性的AI天氣預(yù)測模型,能夠在不到一分鐘內(nèi)完成10天全球天氣預(yù)報(bào),準(zhǔn)確性超越傳統(tǒng)方法90%的指標(biāo)。該模型采用圖神經(jīng)網(wǎng)絡(luò)技術(shù),通過學(xué)習(xí)40年歷史數(shù)據(jù)掌握天氣變化規(guī)律,在極端天氣預(yù)測方面表現(xiàn)卓越,能耗僅為傳統(tǒng)方法的千分之一,為氣象學(xué)領(lǐng)域帶來了效率和精度的雙重突破。