CNET科技行者 9月1日 北京消息:8月30日,高通和奇景光電宣布將展開合作,加速高分辨率、低功耗、主動3D深度傳感攝像頭系統(tǒng)的開發(fā)與商用,以面向手機、物聯(lián)網(wǎng)(IoT)、安防監(jiān)控、汽車和增強現(xiàn)實/虛擬現(xiàn)實(AR/VR)領(lǐng)域中的生物特征人臉識別、3D重建和場景感知等用例,支持計算機視覺功能。
此次合作融合了Qualcomm Spectra™在計算機視覺架構(gòu)與算法上的技術(shù)與專長,以及奇景光電在晶圓光學、傳感、驅(qū)動和模組集成能力上的配套技術(shù),以提供完全集成的SLiM™(結(jié)構(gòu)光模組)3D解決方案。SLiM™是一站式完整3D攝像頭模組,可在室內(nèi)外環(huán)境中,提供高分辨率、高精確度表現(xiàn)的實時深度傳感和3D點云生成。SLiM™的外形設(shè)計非常緊湊、簡單,并具有極低功耗,從而使該解決方案成為集成在嵌入式和移動終端內(nèi)的理想選擇。Qualcomm Technologies和奇景光電將把SLiM™ 3D攝像頭作為面向廣泛市場與行業(yè)的完整攝像頭系統(tǒng)解決方案投入商用,預計將于2018年第一季度實現(xiàn)量產(chǎn)。
Qualcomm Technologies, Inc.高級副總裁兼亞太與印度區(qū)總裁Jim Cathey表示:“此次與奇景光電的合作,突出展現(xiàn)了我們與臺灣企業(yè)所做的技術(shù)投入,將繼續(xù)引領(lǐng)視覺處理領(lǐng)域的創(chuàng)新。結(jié)合先進技術(shù)許可,以及與奇景光電這樣業(yè)界領(lǐng)先的臺灣合作伙伴的協(xié)作,將幫助我們在臺灣打造具有突破性的全新產(chǎn)品,強化全球3D深度傳感生態(tài)系統(tǒng),并提振臺灣經(jīng)濟。”
Qualcomm Technologies, Inc.工程技術(shù)副總裁章建中表示:“作為一名工程師,我們很高興能夠見證我們的技術(shù)創(chuàng)新如何為全球消費者帶來體驗更加豐富的產(chǎn)品。與奇景光電合作在智能手機、虛擬現(xiàn)實和增強現(xiàn)實產(chǎn)品中支持3D計算機視覺技術(shù),是一次非常寶貴的經(jīng)驗。”
奇景光電CEO吳炳昌表示:“我們的3D傳感解決方案是一項改變產(chǎn)業(yè)的突破性技術(shù)。我們將為Android生態(tài)系統(tǒng)的智能手機,提供下一代移動用戶新體驗。我們兩家公司在SLiM™ 3D傳感解決方案上,已經(jīng)共同合作超過四年,以滿足日益增長的計算機視覺功能需求,并在廣泛的市場和應用上,提供令人驚嘆的全新功能和使用場景。奇景光電很高興與Qualcomm Technologies共同合作,為我們的客戶提供及時的支持,為整個生態(tài)系統(tǒng)創(chuàng)造革新性的計算機視覺新應用。”
關(guān)于奇景光電
奇景光電(NASDAQ: HIMX)是專注于顯示影像處理技術(shù)的無晶圓廠半導體解決方案供應商。奇景光電是全球顯示驅(qū)動IC和時序控制器的領(lǐng)先廠商,產(chǎn)品應用于電視、筆記本電腦、臺式電腦、手機、平板電腦、數(shù)碼相機、汽車導航、虛擬現(xiàn)實終端和其他多種消費電子終端。此外,奇景光電設(shè)計并提供觸控傳感顯示器控制器、內(nèi)嵌式觸控與顯示驅(qū)動集成(TDDI)單片解決方案、LED驅(qū)動IC、電源管理IC、監(jiān)視器與投影儀控制產(chǎn)品、定制視頻處理IC解決方案、提供硅片授權(quán)、以及面向增強現(xiàn)實終端和汽車頭戴式顯示器(HUD)的LCOS微顯示器。公司還提供數(shù)碼相機解決方案,包括用于增強現(xiàn)實終端、3D傳感與機器視覺的CMOS圖像傳感器和晶圓級光學部件。產(chǎn)品在各種各樣的應用中廣泛使用,如手機、平板電腦、筆記本電腦、電視、PC攝像頭、汽車、安防、醫(yī)療設(shè)備和物聯(lián)網(wǎng)等。奇景光電成立于2001年,總部位于臺灣臺南市,目前有2,100多名員工,分布于臺南、新竹和臺北等三個臺灣辦事處以及中國大陸、韓國、日本和美國等國家辦事處。截至2017年6月30日,奇景光電在全球擁有3,000項授權(quán)專利和404項待審專利。奇景光電向全球消費電子品牌提供顯示圖像處理半導體解決方案,一直保持著領(lǐng)先供應商的地位。
好文章,需要你的鼓勵
新加坡國立大學研究團隊開發(fā)了SPIRAL框架,通過讓AI與自己對弈零和游戲來提升推理能力。實驗顯示,僅訓練AI玩簡單撲克游戲就能讓其數(shù)學推理能力提升8.6%,通用推理提升8.4%,且無需任何數(shù)學題目作為訓練材料。研究發(fā)現(xiàn)游戲中的三種推理模式能成功轉(zhuǎn)移到數(shù)學解題中,為AI訓練提供了新思路。
同濟大學團隊開發(fā)的GIGA-ToF技術(shù)通過融合多幀圖像的"圖結(jié)構(gòu)"信息,創(chuàng)新性地解決了3D相機噪聲問題。該技術(shù)利用圖像間的不變幾何關(guān)系,結(jié)合深度學習和數(shù)學優(yōu)化方法,在合成數(shù)據(jù)集上實現(xiàn)37.9%的精度提升,并在真實設(shè)備上展現(xiàn)出色泛化能力,為機器人、AR和自動駕駛等領(lǐng)域提供更可靠的3D視覺解決方案。
伊利諾伊大學研究團隊通過對比實驗發(fā)現(xiàn),經(jīng)過強化學習訓練的視覺語言模型雖然表現(xiàn)出"頓悟時刻"現(xiàn)象,但這些自我糾錯行為并不能實際提升推理準確率。研究揭示了AI模型存在"生成-驗證差距",即生成答案的能力強于驗證答案質(zhì)量的能力,且模型在自我驗證時無法有效利用視覺信息,為AI多模態(tài)推理發(fā)展提供了重要啟示。
MIT等頂尖機構(gòu)聯(lián)合提出SparseLoRA技術(shù),通過動態(tài)稀疏性實現(xiàn)大語言模型訓練加速1.6倍,計算成本降低2.2倍。該方法使用SVD稀疏性估計器智能選擇重要計算部分,在保持模型性能的同時顯著提升訓練效率,已在多個任務上驗證有效性。