你會在智能手機上與朋友和家人通話嗎?會在超市排隊結(jié)賬時抽空瀏覽社交媒體嗎?會在乘地鐵上班時看視頻嗎?如果答案都是肯定的,那么高通技術(shù)公司的發(fā)明家張曉霞博士對此功不可沒,她所做的工作讓這些事情(以及其他眾多應(yīng)用)成為可能。
2002年在俄亥俄州立大學(xué)獲得電子工程博士學(xué)位后,張曉霞加入了高通。她主要研究3G、4G和5G系統(tǒng)設(shè)計的關(guān)鍵領(lǐng)域,目前作為高通公司高級技術(shù)總監(jiān),她領(lǐng)導(dǎo)工業(yè)物聯(lián)網(wǎng)開發(fā)、共享/免許可頻譜和5G 開放式RAN的研究項目。她擁有2,500多項授權(quán)專利,是高通成果最多的發(fā)明家之一。
最近我們采訪了張博士,了解了她對高通的創(chuàng)新文化、3G/4G/5G研發(fā)工作,以及她手上的工業(yè)物聯(lián)網(wǎng)項目的思考。
您從小就想成為一位發(fā)明家嗎?如果不是這樣,是誰或哪件事啟發(fā)了您?
在加入高通之前,我并不知道自己想成為發(fā)明家,但這里的文化對我來說一直都是一種巨大的鼓舞。當(dāng)我開始在這里工作時,我們正處于3G研發(fā)的最后階段,并且正在向4G過渡。在那段時間里,我與馬德嘉(Durga Malladi)博士一起工作,他現(xiàn)任高通技術(shù)公司高級副總裁兼蜂窩調(diào)制解調(diào)器和基礎(chǔ)設(shè)施業(yè)務(wù)總經(jīng)理。他是我的領(lǐng)導(dǎo),給了我很多的指導(dǎo)和支持;通過觀察他的做事方式,我學(xué)到了很多。這促使我練就了發(fā)現(xiàn)問題并提出解決思路的能力。
您的工作重心一直圍繞手機和其他終端用于與蜂窩網(wǎng)絡(luò)通信的協(xié)議。您能解釋一下其中的原理嗎?
現(xiàn)代無線通信涉及許多不同的終端和各種使用場景,非常復(fù)雜。我們可以通過一個宏觀的、一般性的類比,來說明終端間如何進行通信。為了與蜂窩基站通信,你的手機首先需要發(fā)送一個所謂的調(diào)度請求??梢园鸦鞠胂蟪梢晃焕蠋?,他正處于一個滿是學(xué)生的教室里,而你是正要舉手發(fā)言的學(xué)生?;韭牭侥愕恼埱蠛螅瑫嬖V你可以在何時何地發(fā)送數(shù)據(jù),以及可以持續(xù)多長時間——正如老師會基于請求按順序叫學(xué)生?;疽矔儐柺謾C信道的狀態(tài)如何——基本上是了解用戶周圍的網(wǎng)絡(luò)環(huán)境,以及信號來回發(fā)送的清晰度——接著確認反饋,用來詢問手機聽到和理解所發(fā)送信息的情況。
每次連接都需要這三種信號,以便優(yōu)化網(wǎng)絡(luò)中進行的所有不同會話——但總是從每臺手機單獨發(fā)送每個信號確實效率很低。因此,為了幫助解決這些復(fù)雜的通信挑戰(zhàn),我提出了一個叫做“同時傳輸聯(lián)合編碼”的想法,即在編碼的同時發(fā)送關(guān)鍵信息,使系統(tǒng)盡可能高效地運行。該系統(tǒng)使手機能夠連接網(wǎng)絡(luò),快速且高效地分享人們用于視頻通話、流媒體和網(wǎng)絡(luò)瀏覽等產(chǎn)生的大量數(shù)據(jù),它是進入4G和目前5G核心的真正基礎(chǔ)性技術(shù)。
目前您正領(lǐng)導(dǎo)高通在工業(yè)物聯(lián)網(wǎng)領(lǐng)域的研發(fā)項目。您能告訴我們此項工作涉及的內(nèi)容和項目目標(biāo)嗎?
現(xiàn)在,大多數(shù)行業(yè)都高度依賴有線連接,尤其在工廠等領(lǐng)域。線纜隨處可見,這使得每次需要調(diào)整、改變工廠生產(chǎn)線,或是制造新產(chǎn)品時難以進行系統(tǒng)升級。我們努力讓5G連接在工業(yè)應(yīng)用中和有線連接一樣強大,具有超高可靠性和低時延,并在工廠車間更具靈活性和更易重新部署的額外優(yōu)勢。這是真正的前沿技術(shù)所要達到的目標(biāo)。
您能談?wù)勱P(guān)于6G,您感到最興奮的是什么嗎?
在關(guān)于6G的初步討論中,人們正在討論的是那些已在5G中起步并且可能在6G中得到增強的用例。例如,想辦法利用網(wǎng)絡(luò)為用戶提供有關(guān)周圍事物的實時數(shù)據(jù)。這能夠切實幫助工廠快速確定機器或流水線的布局。許多無線研究貫穿了這樣一個核心:迭代和改進現(xiàn)有技術(shù)以滿足新需求并提高性能。
您在2002年博士畢業(yè)后就開始在高通工作。您認為在這段時間里作為一名發(fā)明家的內(nèi)涵發(fā)生了哪些變化呢?
我覺得最大的區(qū)別是,我們所研發(fā)的技術(shù)得以應(yīng)用的領(lǐng)域發(fā)生了變化。一開始,3G和4G支持手機協(xié)議和網(wǎng)絡(luò)的運行。邁入5G時代,我們目睹了它如何擴展進入多個垂直領(lǐng)域——引入使用未許可頻譜、工業(yè)物聯(lián)網(wǎng)用例等。它不再僅僅涉及創(chuàng)建手機協(xié)議,現(xiàn)在人們有很多用例和問題要解決。
您對其他發(fā)明者有何建議?
要用敏銳的目光發(fā)現(xiàn)問題并與他人討論,把問題說出來有助于理清頭緒。此外,別人的觀點可能幫你更全面地理解問題。最重要的是,要想成為好的發(fā)明者,你需要有好的合作團隊。一切的核心就是解決問題——并且是團隊合作一起解決問題。
好文章,需要你的鼓勵
騰訊ARC實驗室推出AudioStory系統(tǒng),首次實現(xiàn)AI根據(jù)復(fù)雜指令創(chuàng)作完整長篇音頻故事。該系統(tǒng)結(jié)合大語言模型的敘事推理能力與音頻生成技術(shù),通過交錯式推理生成、解耦橋接機制和漸進式訓(xùn)練,能夠?qū)?fù)雜指令分解為連續(xù)音頻場景并保持整體連貫性。在AudioStory-10K基準(zhǔn)測試中表現(xiàn)優(yōu)異,為AI音頻創(chuàng)作開辟新方向。
Meta與特拉維夫大學(xué)聯(lián)合研發(fā)的VideoJAM技術(shù),通過讓AI同時學(xué)習(xí)外觀和運動信息,顯著解決了當(dāng)前視頻生成模型中動作不連貫、違反物理定律的核心問題。該技術(shù)僅需添加兩個線性層就能大幅提升運動質(zhì)量,在多項測試中超越包括Sora在內(nèi)的商業(yè)模型,為AI視頻生成的實用化應(yīng)用奠定了重要基礎(chǔ)。
上海AI實驗室發(fā)布OmniAlign-V研究,首次系統(tǒng)性解決多模態(tài)大語言模型人性化對話問題。該研究創(chuàng)建了包含20萬高質(zhì)量樣本的訓(xùn)練數(shù)據(jù)集和MM-AlignBench評測基準(zhǔn),通過創(chuàng)新的數(shù)據(jù)生成和質(zhì)量管控方法,讓AI在保持技術(shù)能力的同時顯著提升人性化交互水平,為AI價值觀對齊提供了可行技術(shù)路徑。
谷歌DeepMind團隊開發(fā)的GraphCast是一個革命性的AI天氣預(yù)測模型,能夠在不到一分鐘內(nèi)完成10天全球天氣預(yù)報,準(zhǔn)確性超越傳統(tǒng)方法90%的指標(biāo)。該模型采用圖神經(jīng)網(wǎng)絡(luò)技術(shù),通過學(xué)習(xí)40年歷史數(shù)據(jù)掌握天氣變化規(guī)律,在極端天氣預(yù)測方面表現(xiàn)卓越,能耗僅為傳統(tǒng)方法的千分之一,為氣象學(xué)領(lǐng)域帶來了效率和精度的雙重突破。