3月22日,釘釘在“科技向?qū)?middot;萬物生長”發(fā)布會上推出了業(yè)界第一款單機(jī)實(shí)現(xiàn)10米高清音視頻體驗(yàn)的視頻會議一體機(jī)——F2。釘釘F2采用了行業(yè)領(lǐng)先的高通高性能物聯(lián)網(wǎng)芯片,帶來強(qiáng)大的計(jì)算和AI性能,進(jìn)一步支持協(xié)作辦公體驗(yàn)和企業(yè)生產(chǎn)力的提升。
隨著云會議的興起,音視頻與計(jì)算機(jī)視覺、圖像處理、人工智能等技術(shù)的融合趨勢也愈發(fā)明顯,共同帶來高清實(shí)時(shí)的協(xié)同辦公體驗(yàn)。釘釘F2具備單機(jī)10米清晰拾音、智能導(dǎo)播、4K畫質(zhì)等特點(diǎn)。
在音頻方面,釘釘F2采用麥克風(fēng)陣列技術(shù),首次將麥克風(fēng)聲學(xué)特性和差分波束理論的優(yōu)勢進(jìn)行結(jié)合,實(shí)現(xiàn)了單機(jī)10米清晰拾音的突破;在視覺方面,釘釘F2采用多模態(tài)智能導(dǎo)播與視覺智能算法,結(jié)合頂級高通物聯(lián)網(wǎng)芯片先進(jìn)的CPU架構(gòu)、高通AI引擎和圖像信號處理器(ISP)帶來頂級性能,可支持最高4K、120幀/秒的視頻處理,實(shí)現(xiàn)對全空間任意位置的細(xì)節(jié)捕捉,為企業(yè)和個(gè)人用戶提供實(shí)時(shí)高清畫質(zhì)。此外,釘釘F2還充分利用高通物聯(lián)網(wǎng)芯片的計(jì)算性能,為發(fā)言人跟蹤、多畫面自動(dòng)導(dǎo)播等邊緣側(cè)計(jì)算密集型AI功能提供全新的神經(jīng)處理單元,帶來更具沉浸感的智能會議體驗(yàn)。
在滿足大中型會議室高清音視頻體驗(yàn)的同時(shí),如何應(yīng)對設(shè)備部署、布線繁瑣等難題,成為行業(yè)亟待解決的痛點(diǎn)。以往要滿足高端會議設(shè)備的音視頻性能要求,通常要采用2到3顆主控級聯(lián);此次釘釘F2采用了突破性的一體機(jī)形態(tài),僅通過一顆高通高性能物聯(lián)網(wǎng)芯片即可實(shí)現(xiàn)兼具高質(zhì)量圖像接入及處理能力、強(qiáng)勁的編解碼性能、AI算力以及支持豐富的通用接口等特性,讓All in One的設(shè)計(jì)成為可能,在減少會議設(shè)備部署的同時(shí)極大地簡化了設(shè)計(jì)和成本。
釘釘F2視頻會議一體機(jī)是行業(yè)最新的技術(shù)合作成果,利用前沿的高性能、低功耗計(jì)算技術(shù)創(chuàng)新,更好地服務(wù)于組織數(shù)字化和業(yè)務(wù)數(shù)字化。釘釘F2不僅為用戶提供了音視頻遠(yuǎn)程協(xié)同溝通的能力,還通過專用的會議室硬件終端設(shè)備,打造會議室與個(gè)人端之間一致的優(yōu)質(zhì)會議體驗(yàn),并通過音視頻算法及模組的集成,引領(lǐng)行業(yè)創(chuàng)新并對生態(tài)進(jìn)行技術(shù)賦能,助力更多組織加速邁入數(shù)字化時(shí)代。
好文章,需要你的鼓勵(lì)
新加坡國立大學(xué)研究團(tuán)隊(duì)開發(fā)了SPIRAL框架,通過讓AI與自己對弈零和游戲來提升推理能力。實(shí)驗(yàn)顯示,僅訓(xùn)練AI玩簡單撲克游戲就能讓其數(shù)學(xué)推理能力提升8.6%,通用推理提升8.4%,且無需任何數(shù)學(xué)題目作為訓(xùn)練材料。研究發(fā)現(xiàn)游戲中的三種推理模式能成功轉(zhuǎn)移到數(shù)學(xué)解題中,為AI訓(xùn)練提供了新思路。
同濟(jì)大學(xué)團(tuán)隊(duì)開發(fā)的GIGA-ToF技術(shù)通過融合多幀圖像的"圖結(jié)構(gòu)"信息,創(chuàng)新性地解決了3D相機(jī)噪聲問題。該技術(shù)利用圖像間的不變幾何關(guān)系,結(jié)合深度學(xué)習(xí)和數(shù)學(xué)優(yōu)化方法,在合成數(shù)據(jù)集上實(shí)現(xiàn)37.9%的精度提升,并在真實(shí)設(shè)備上展現(xiàn)出色泛化能力,為機(jī)器人、AR和自動(dòng)駕駛等領(lǐng)域提供更可靠的3D視覺解決方案。
伊利諾伊大學(xué)研究團(tuán)隊(duì)通過對比實(shí)驗(yàn)發(fā)現(xiàn),經(jīng)過強(qiáng)化學(xué)習(xí)訓(xùn)練的視覺語言模型雖然表現(xiàn)出"頓悟時(shí)刻"現(xiàn)象,但這些自我糾錯(cuò)行為并不能實(shí)際提升推理準(zhǔn)確率。研究揭示了AI模型存在"生成-驗(yàn)證差距",即生成答案的能力強(qiáng)于驗(yàn)證答案質(zhì)量的能力,且模型在自我驗(yàn)證時(shí)無法有效利用視覺信息,為AI多模態(tài)推理發(fā)展提供了重要啟示。
MIT等頂尖機(jī)構(gòu)聯(lián)合提出SparseLoRA技術(shù),通過動(dòng)態(tài)稀疏性實(shí)現(xiàn)大語言模型訓(xùn)練加速1.6倍,計(jì)算成本降低2.2倍。該方法使用SVD稀疏性估計(jì)器智能選擇重要計(jì)算部分,在保持模型性能的同時(shí)顯著提升訓(xùn)練效率,已在多個(gè)任務(wù)上驗(yàn)證有效性。