8月31日由七牛云存儲主辦的系列技術(shù)沙龍“開發(fā)者最佳實踐日·第1期-流媒體技術(shù)專場沙龍”在廣州創(chuàng)新谷咖啡廳成功舉辦。
移動互聯(lián)網(wǎng)成為新一輪浪潮后,手機作為外界感官鏈接的重要性已愈發(fā)明顯,之前手機碎片化時間消費的是偏文字偏圖片類似信息流的,從去年開始,用手機拍視頻和直播的產(chǎn)品也越來越多,這種短視頻的應(yīng)用如美拍、微拍、秒視就是載體轉(zhuǎn)向音視頻的應(yīng)用,開發(fā)者最佳實踐日第一場就請來了流媒體領(lǐng)域?qū)I(yè)的Sewise矽偉智科技,中國最大的原創(chuàng)視頻社區(qū)愛拍及國內(nèi)第一支從事Google Glass開發(fā)的團隊Glass X給開發(fā)者講述流媒體實踐的經(jīng)驗、應(yīng)用場景、遇到的技術(shù)問題及解決方法。
沙龍開場,首先由七牛首席布道師徐立帶來《快速開發(fā)移動應(yīng)用》 ,在移動互聯(lián)網(wǎng)時代,用戶量起來的速度是非???,當(dāng)?shù)揭欢ㄒ?guī)模比如用戶激活數(shù)六七個億之后,可訪問性有保證嗎?你怎么樣快速照顧到所有的終端客戶,當(dāng)體量成長起來以后,如何快速分發(fā),用戶分散在全國甚至全球各地,富媒體消息如何保證高質(zhì)量的可訪問性和到達率?作為流媒體應(yīng)用場景產(chǎn)生的一個視頻是幾個兆,支持分塊上傳和斷點上傳的程序邏輯更復(fù)雜如何解決,在一個產(chǎn)品必須快速迭代的時代需要開發(fā)者更多地“善假于物”,徐立針對這些問題給出了答案。
(七牛云存儲首席布道師 徐立)
在流媒體領(lǐng)域有專業(yè)處理經(jīng)驗的Sewise矽偉智科技CTO 李立欣詳細(xì)講解了流媒體包含的編碼、分發(fā)、和播放的關(guān)鍵技術(shù),包括如何選擇合適的編解碼器,如何實現(xiàn)多屏支持的播放器,流媒體分發(fā)主要技術(shù)分發(fā)的漸進式下載、實時流式傳輸技術(shù)、自適應(yīng)流媒體技術(shù)的優(yōu)缺點及影響,這些流媒體技術(shù)的選擇會直接影響運營成本,處理文件的效率和訪問用戶的體驗。例如,采用切片轉(zhuǎn)碼的方式,可以把利用率提高到90%,換來的轉(zhuǎn)碼時間是原來的一半。
(矽偉智科技 CTO 李立欣)
作為國內(nèi)最大的原創(chuàng)視頻社區(qū)的愛拍,愛拍CTO鄒光先在現(xiàn)場給大家講述了愛拍作為一個大型視頻網(wǎng)站在完成閉環(huán)積累用戶的過程中,如何詳細(xì)配置視頻服務(wù)器及性能,完成內(nèi)容分發(fā)的。愛拍作為一個視頻網(wǎng)站,視頻流量很多,前期運營成本也非常高,因此也在實踐中摸索出了降低成本的方法:一是選擇合適的編碼方式,碼率降低10%成本就能降低10%,其次做動態(tài)的限速,根據(jù)視頻文件的碼流分布成本又可以降低20-30%,其三做差異化服務(wù)。作為做了七年視頻服務(wù)的愛拍,尤其提到了七牛云的斷點續(xù)傳功能給愛拍網(wǎng)站帶來優(yōu)化的節(jié)省用戶流量的用戶體驗。
(愛拍聯(lián)合創(chuàng)始人&CTO 鄒光先)
會議的最后環(huán)節(jié)是最佳實踐環(huán)節(jié),Glass X的CTO 林滿佳用他們親身案例來說明了作為國內(nèi)第一支關(guān)注并基于Google Glass 開發(fā)的團隊是如何部署網(wǎng)絡(luò)、服務(wù)端、客戶端的。并給出了一系列在創(chuàng)業(yè)初期應(yīng)該注意到的問題,比如上線初期在測試和代碼審核的基礎(chǔ)上再去堆代碼,比如自建成本太高一定要選擇云服務(wù)云存儲。
(Glass-X CTO 林滿佳)
提問環(huán)節(jié),開發(fā)者踴躍提問中。
圍觀3D打印機。
“開發(fā)者最佳實踐日”是由七牛云存儲發(fā)起并聯(lián)合各方小伙伴為開發(fā)者舉辦的系列技術(shù)沙龍,關(guān)注開發(fā)者在實際應(yīng)用中可能遇到的技術(shù)問題,致力于為勇于創(chuàng)新的開發(fā)者們提供行業(yè)內(nèi)最前沿最熱門的技術(shù)干貨,以技術(shù)驅(qū)動應(yīng)用創(chuàng)新,讓更多的開發(fā)者享受技術(shù)帶來的生活樂趣。敬請期待9.21日北京車庫咖啡,開發(fā)者最佳實踐日·第2期-在線教育技術(shù)專場!
好文章,需要你的鼓勵
新加坡國立大學(xué)研究團隊開發(fā)了SPIRAL框架,通過讓AI與自己對弈零和游戲來提升推理能力。實驗顯示,僅訓(xùn)練AI玩簡單撲克游戲就能讓其數(shù)學(xué)推理能力提升8.6%,通用推理提升8.4%,且無需任何數(shù)學(xué)題目作為訓(xùn)練材料。研究發(fā)現(xiàn)游戲中的三種推理模式能成功轉(zhuǎn)移到數(shù)學(xué)解題中,為AI訓(xùn)練提供了新思路。
同濟大學(xué)團隊開發(fā)的GIGA-ToF技術(shù)通過融合多幀圖像的"圖結(jié)構(gòu)"信息,創(chuàng)新性地解決了3D相機噪聲問題。該技術(shù)利用圖像間的不變幾何關(guān)系,結(jié)合深度學(xué)習(xí)和數(shù)學(xué)優(yōu)化方法,在合成數(shù)據(jù)集上實現(xiàn)37.9%的精度提升,并在真實設(shè)備上展現(xiàn)出色泛化能力,為機器人、AR和自動駕駛等領(lǐng)域提供更可靠的3D視覺解決方案。
伊利諾伊大學(xué)研究團隊通過對比實驗發(fā)現(xiàn),經(jīng)過強化學(xué)習(xí)訓(xùn)練的視覺語言模型雖然表現(xiàn)出"頓悟時刻"現(xiàn)象,但這些自我糾錯行為并不能實際提升推理準(zhǔn)確率。研究揭示了AI模型存在"生成-驗證差距",即生成答案的能力強于驗證答案質(zhì)量的能力,且模型在自我驗證時無法有效利用視覺信息,為AI多模態(tài)推理發(fā)展提供了重要啟示。
MIT等頂尖機構(gòu)聯(lián)合提出SparseLoRA技術(shù),通過動態(tài)稀疏性實現(xiàn)大語言模型訓(xùn)練加速1.6倍,計算成本降低2.2倍。該方法使用SVD稀疏性估計器智能選擇重要計算部分,在保持模型性能的同時顯著提升訓(xùn)練效率,已在多個任務(wù)上驗證有效性。