CNET科技資訊網(wǎng) 4月18日 北京消息(文/孫封蕾):“用三個星期的時間,打造一款移動直播的APP”;“移動直播突然就火了,以至于我們都沒時間去想怎么來推廣金山云做移動直播有多專業(yè)”……
金山云合伙人朱樺
這些話聽上去像是說大話,但是,看著金山云合伙人朱樺嚴肅的表情,臉上完全沒有“吹牛”的影子。
所以,金山云組織一場名叫“如何快速打造一款月流水過億的移動直播App”的沙龍就完全不奇怪了。
那么,快速打造,到底有多快呢?
朱樺說:“在我們平臺上,最快的記錄是6個人的研發(fā)團隊,用三個星期的時間,把iOS和安卓客戶端,完成了從開始設計App到最后發(fā)布App。”
這聽起來感覺不可能,但是實際上,以目前的技術程度來看App用三個星期的時間來完成,肯定是夠的,而在開發(fā)這款App的同時,移動直播的部分,只要把視頻所有的東西打包進去,與App的開發(fā)可以實現(xiàn)同步完成,開發(fā)團隊可以對視頻毫無概念,金山云可以幫助他們把服務端,到視頻前端的問題,一并解決。
因為這個速度,所以,在移動直播領域的市場份額,金山云差不多占到了三分之一以上。
提及進入移動直播領域的原因,朱樺指出,一年半到兩年前開始,金山云主要是做存儲的業(yè)務,當時主要針對小米手機用戶。不到一年的時間里,小米手機里面視頻的體積和數(shù)量有個巨大的體現(xiàn),2014年和2015年的年初比,大概視頻的體積大概翻了7倍,這個數(shù)字幾何倍數(shù)的成長,不僅僅包括視頻的個數(shù),還包括視頻體積。
基于這樣的數(shù)據(jù),金山云判斷,視頻是互聯(lián)網(wǎng)未來發(fā)展的一個方向,經(jīng)歷過讀圖時代,經(jīng)歷過視頻時代,移動視頻被金山云判斷為未來的突發(fā)點,所以開始在戰(zhàn)略上向視頻領域傾斜,而且在發(fā)展過程中發(fā)現(xiàn),移動端的需求越來越大。
盡管做了充分準備,但朱樺也不可否認,移動直播的洶涌來襲還是始料未及的。提前一年多的時間就已經(jīng)做了布局準備,在市場爆發(fā)之時,基本做到了行業(yè)的最高水準,所能提供的技術水平可以達到BAT級別。
朱樺舉例,移動直播有30%--40%的情況下都處于弱網(wǎng)環(huán)境,是在3G網(wǎng)絡下,丟包非常嚴重。在這種環(huán)境下,能夠讓主播把視頻推上來,這個技術不是那么容易做到的,需要通過一些比較特殊的手段,比如說你要模擬網(wǎng)絡損傷的狀況,這就需要有專業(yè)的設備和專業(yè)的環(huán)境才能夠達到,一般情況下很難做得到。
好文章,需要你的鼓勵
新加坡國立大學研究團隊開發(fā)了SPIRAL框架,通過讓AI與自己對弈零和游戲來提升推理能力。實驗顯示,僅訓練AI玩簡單撲克游戲就能讓其數(shù)學推理能力提升8.6%,通用推理提升8.4%,且無需任何數(shù)學題目作為訓練材料。研究發(fā)現(xiàn)游戲中的三種推理模式能成功轉移到數(shù)學解題中,為AI訓練提供了新思路。
同濟大學團隊開發(fā)的GIGA-ToF技術通過融合多幀圖像的"圖結構"信息,創(chuàng)新性地解決了3D相機噪聲問題。該技術利用圖像間的不變幾何關系,結合深度學習和數(shù)學優(yōu)化方法,在合成數(shù)據(jù)集上實現(xiàn)37.9%的精度提升,并在真實設備上展現(xiàn)出色泛化能力,為機器人、AR和自動駕駛等領域提供更可靠的3D視覺解決方案。
伊利諾伊大學研究團隊通過對比實驗發(fā)現(xiàn),經(jīng)過強化學習訓練的視覺語言模型雖然表現(xiàn)出"頓悟時刻"現(xiàn)象,但這些自我糾錯行為并不能實際提升推理準確率。研究揭示了AI模型存在"生成-驗證差距",即生成答案的能力強于驗證答案質量的能力,且模型在自我驗證時無法有效利用視覺信息,為AI多模態(tài)推理發(fā)展提供了重要啟示。
MIT等頂尖機構聯(lián)合提出SparseLoRA技術,通過動態(tài)稀疏性實現(xiàn)大語言模型訓練加速1.6倍,計算成本降低2.2倍。該方法使用SVD稀疏性估計器智能選擇重要計算部分,在保持模型性能的同時顯著提升訓練效率,已在多個任務上驗證有效性。