[前言] 技術(shù)創(chuàng)新要通過(guò)賦能千行百業(yè)而體現(xiàn),更需要無(wú)數(shù)創(chuàng)業(yè)者以新思路來(lái)呈現(xiàn)。GSMA 5G創(chuàng)新與投資平臺(tái)(5G IN)推出「創(chuàng)業(yè)者說(shuō)」系列訪談,攜手新媒體平臺(tái)科技行者,分享創(chuàng)業(yè)者的創(chuàng)新故事。
想象2025年的某一天,當(dāng)你頭戴一副酷炫輕薄的MR(混合現(xiàn)實(shí))眼鏡走在路上,唰,空中飄起一張麥當(dāng)勞打折券,你用手輕觸這張?zhí)摂M券,地面立刻出現(xiàn)了導(dǎo)航條,于是你沿著導(dǎo)航條一邊走,一邊讓MR眼鏡里的虛擬助手,為你下單并支付,走到麥當(dāng)勞就可以享用。
這是全景電商的一個(gè)小設(shè)想。從電商、游戲娛樂(lè)、安防、早教、醫(yī)療到各種工業(yè)制造,視頻技術(shù)無(wú)處不在,而讓視頻技術(shù)融合5G、AI等技術(shù),再能夠沉浸到更多行業(yè)應(yīng)用場(chǎng)景,則是像網(wǎng)達(dá)軟件這樣的公司正在做的事情。
在網(wǎng)達(dá)軟件公司官網(wǎng),有一句話定位自己:“以視頻智能化為核心的軟件產(chǎn)品及解決方案提供商”。網(wǎng)達(dá)軟件副總經(jīng)理張悅近期接受科技行者專訪,張悅強(qiáng)調(diào),網(wǎng)達(dá)公司成立已經(jīng)有18年,立足于最早的通信運(yùn)營(yíng)商和設(shè)備商的合作基礎(chǔ),網(wǎng)達(dá)最強(qiáng)大的能力就是視頻方面的編解碼能力,由于市場(chǎng)帶寬利用率高,而完成窄帶高清的實(shí)際場(chǎng)景是網(wǎng)達(dá)的能力根本。
張悅舉例,我們把5G看成是具備多層算力分布的一個(gè)高速網(wǎng)絡(luò)。用人類身體來(lái)類比的話,5G網(wǎng)絡(luò)就是密布人體的反應(yīng)迅速的神經(jīng)系統(tǒng),云計(jì)算中心就是算力最充分的大腦,脊椎神經(jīng)元就是分布式邊緣計(jì)算單元,而高效準(zhǔn)確的視頻采集就是人眼——人類80%的信息攝入是通過(guò)視覺(jué)進(jìn)行的。而承載視覺(jué)信息的視頻媒介,正是網(wǎng)達(dá)軟件公司的主流業(yè)務(wù)領(lǐng)域。
圖:網(wǎng)達(dá)軟件副總經(jīng)理張悅
科技行者:網(wǎng)達(dá)軟件的業(yè)績(jī)?cè)?2020 年實(shí)現(xiàn)了大幅預(yù)增,請(qǐng)問(wèn)增長(zhǎng)來(lái)自哪些方面?
張悅:由于2019年5G+高清視頻行業(yè)需求猛增,包括網(wǎng)達(dá)原有客戶在內(nèi)的市場(chǎng)都出現(xiàn)很多新的剛需,網(wǎng)達(dá)軟件也因此受惠并發(fā)展擴(kuò)大了業(yè)績(jī)。實(shí)際來(lái)看,目前高清視頻還僅僅停留在娛樂(lè)業(yè)務(wù)層面,高清教育、高清人工智能攝像、XR、數(shù)字內(nèi)容商業(yè)化等更廣闊的市場(chǎng)爆發(fā)還遠(yuǎn)遠(yuǎn)沒(méi)有來(lái)臨,網(wǎng)達(dá)軟件立足于整體視頻解決方案的提供,上述場(chǎng)景帶來(lái)的市場(chǎng)業(yè)績(jī)和增長(zhǎng)不久后都會(huì)更快地體現(xiàn)出來(lái)。
科技行者:總的來(lái)看,疫情對(duì)視頻行業(yè)帶來(lái)了哪些影響?哪些場(chǎng)景正在迅速發(fā)展?
張悅:2019 年底爆發(fā)的世界范圍的新型冠狀病毒疫情以來(lái),對(duì)視頻行業(yè)的影響是巨大的,總體來(lái)講對(duì)行業(yè)是利大于弊的。由于世界范圍內(nèi)疫情防控的需要,線上活動(dòng)大大加強(qiáng), 一些場(chǎng)景剛性需求猛烈:視頻會(huì)議、線上 XR 虛擬展會(huì)、現(xiàn)場(chǎng)溫測(cè)監(jiān)控等視頻需求非?;鸨煌瑫r(shí),AI 也介入其中,解決非接觸的現(xiàn)場(chǎng)服務(wù)和溝通,比如:酒店大堂機(jī)器人、人流密度控制智能攝像頭、展廳虛擬人服務(wù)等等。
科技行者:5G 被認(rèn)為是未來(lái)十年的通用型技術(shù),5G 為網(wǎng)絡(luò)視頻行業(yè)帶來(lái)了哪些機(jī)遇?
張悅:我們把5G看成是具備多層算力分布的一個(gè)高速網(wǎng)絡(luò)。用人類的身體來(lái)類比的話,5G網(wǎng)絡(luò)就是密布人體的反應(yīng)迅速的神經(jīng)系統(tǒng),云計(jì)算中心就是算力最充分的大腦,脊椎神經(jīng)元就是分布式邊緣計(jì)算單元,而高效準(zhǔn)確的視頻采集就是人的眼睛,而人類80%的信息攝入是通過(guò)視覺(jué)進(jìn)行的。
我從小訓(xùn)練踢足球,這是我個(gè)人堅(jiān)持了 30 年的一項(xiàng)體育運(yùn)動(dòng)。我記得最早接觸該運(yùn)動(dòng)的時(shí)候,教練培訓(xùn)我要看著球的運(yùn)動(dòng)軌跡,然后用腦子控制身體的腳部位置,注意擊球點(diǎn)把足球踢向我想要它飛行而往的地方。經(jīng)過(guò)不斷訓(xùn)練,很快我就把這些觀察、思考、行動(dòng)熟練并飛快的變成了所謂的“肌肉記憶”,其實(shí)這就是很典型的 5G+AI,用 AI 把冷數(shù)據(jù)訓(xùn)練成熱數(shù)據(jù)后,為了提高響應(yīng)效率,必然需要把優(yōu)化后的算法下沉到邊緣計(jì)算中心,我一直認(rèn)為人類是最優(yōu)秀的 AI。
視頻業(yè)務(wù)和AI業(yè)務(wù)真正具備了讓網(wǎng)絡(luò)上下行帶寬都用足。我們5G以前的網(wǎng)絡(luò)使用是不對(duì)稱的,無(wú)論是計(jì)算機(jī)時(shí)代的鍵鼠交互,還是智能手機(jī)時(shí)代的滑屏交互,其交互的上線數(shù)據(jù)量是不足夠的,所以以前的網(wǎng)絡(luò)上行數(shù)據(jù)都只有幾K、幾兆、幾十兆,但隨著攝像頭技術(shù)的不斷進(jìn)步,高清攝像頭、雙攝視覺(jué)差攝像頭、激光攝像頭、紅外雷達(dá)攝像頭的不斷更新,視頻采集端的數(shù)據(jù)量就飛速發(fā)展起來(lái)了。這些數(shù)據(jù)要么在算力端側(cè)計(jì)算完成, 要么通過(guò)上傳到云中心來(lái)計(jì)算完成,然后再下傳到終端側(cè)來(lái)展現(xiàn)。
可見(jiàn),視頻業(yè)務(wù)作為通信業(yè)務(wù)的展現(xiàn)層是最為直觀在應(yīng)用上的。XR業(yè)務(wù)的本質(zhì)還是基于AI交互的多維高清視頻業(yè)務(wù),XR終端是下一代計(jì)算平臺(tái),該平臺(tái)必須跑在云端聯(lián)動(dòng)的5G以上網(wǎng)絡(luò)上。
科技行者:網(wǎng)達(dá)既有面向大屏的解決方案,又有面向手機(jī)視頻的方案,不同的屏幕尺寸,有哪些不同的技術(shù)訴求差別?
張悅:這兩類方案,雖然都屬于視頻產(chǎn)品,但在用戶群體、使用場(chǎng)景、操作方式、內(nèi)容類型、運(yùn)營(yíng)方式、互動(dòng)方式都存在著顯著的差異,都需要具備長(zhǎng)時(shí)間的技術(shù)積累和研發(fā)才能更好地滿足市場(chǎng)需求。
由于內(nèi)容牌照的管控不同,技術(shù)方面在端側(cè)開(kāi)發(fā)與適配、高并發(fā)服務(wù)端側(cè)部署、系統(tǒng)安全方面存在差異。在業(yè)務(wù)展現(xiàn)側(cè),“多屏互動(dòng)”業(yè)務(wù)恰恰是表現(xiàn)出了網(wǎng)達(dá)在大小屏上的超強(qiáng)能力,讓客戶在有屏的地方,就可以順利的體驗(yàn)各種視頻高清;同時(shí),在技術(shù)層,網(wǎng)達(dá)公司實(shí)際成立已經(jīng)有 18 年了,立足于最早的通信運(yùn)營(yíng)商和設(shè)備商的合作基礎(chǔ),網(wǎng)達(dá)最強(qiáng)大的能力就是視頻方面的編解碼能力,帶寬利用率高,完成窄帶高清的實(shí)際場(chǎng)景是網(wǎng)達(dá)的能力根本。
最終,客戶在觀看或者使用大小屏場(chǎng)景中明顯會(huì)覺(jué)得體驗(yàn)是“不卡,流暢,清晰”。很快,網(wǎng)達(dá)也會(huì)把自有的編解碼能力和多終端業(yè)務(wù)融合能力用在 XR 上,用在 AI 攝像監(jiān)控上,讓各種終端內(nèi)的視頻體驗(yàn),能更加快速,更加聰明,更加清晰。
科技行者:網(wǎng)達(dá)還有電商行業(yè)的解決方案,請(qǐng)您介紹電商行業(yè)對(duì)視頻行業(yè)的主要需求點(diǎn)在哪里? 網(wǎng)達(dá)的方案優(yōu)勢(shì)又在哪里?
張悅:傳統(tǒng)電商SKU仍在持續(xù)增加,而傳統(tǒng)移動(dòng)終端受限于二維界面和傳統(tǒng)4G網(wǎng)絡(luò)帶寬限制,造成的信息展示和獲取的不對(duì)稱。電商行業(yè)呼喚更加高清和互動(dòng)性更好的直播和購(gòu)物體驗(yàn)。
以網(wǎng)達(dá)軟件在推的全景電商整體解決方案為例,其體驗(yàn)式消費(fèi)能夠極大刺激消費(fèi)者的購(gòu)買欲望,對(duì)正在探索新的發(fā)展模式的傳統(tǒng)電商來(lái)說(shuō),也是一個(gè)極具吸引力的發(fā)展方向。全景電商則是在純互聯(lián)網(wǎng)電商的基礎(chǔ)向上延伸,仍舊是傳統(tǒng)電商模式的延續(xù), 提升的是標(biāo)準(zhǔn)商品的服務(wù)價(jià)值。全景電商與“互聯(lián)網(wǎng)+”的結(jié)合,能夠完全逆轉(zhuǎn)傳統(tǒng)電商行業(yè)的頹廢之勢(shì), 使電商行業(yè)朝體驗(yàn)式消費(fèi)進(jìn)化。
個(gè)人認(rèn)為這個(gè)就是無(wú)處不在、交互式的商業(yè)游戲化。請(qǐng)大家想象,在2025 年的一天, 你頭戴一副酷炫輕薄的 MR 眼鏡走在路上,原本空無(wú)一物的街道因?yàn)槟愕牡絹?lái),出現(xiàn)了眾多漫威英雄,鋼鐵俠和你對(duì)射激光;空中飄起一張麥當(dāng)勞打折券,你用手輕觸這張?zhí)摂M券,地面上立刻出現(xiàn)了導(dǎo)航條,于是你沿著導(dǎo)航條一邊走,一邊讓 MR 眼鏡里的虛擬助手,為你定了牛肉套餐并支付完畢;走到麥當(dāng)勞,拿到了熱騰騰的套餐,你便在餐廳找了個(gè)安靜的角落坐了下,等待再過(guò)半小時(shí)就要開(kāi)始的遠(yuǎn)程可視 MR 會(huì)議...
網(wǎng)達(dá)軟件就在 5G 商業(yè)游戲化的道路上快速前進(jìn)著。數(shù)字化的內(nèi)容展現(xiàn),是網(wǎng)達(dá)在下一代電商業(yè)務(wù)的點(diǎn),而我們具備的很大優(yōu)勢(shì)就是交互性、低時(shí)延和沉浸性。
科技行者:科技公司的關(guān)鍵是技術(shù),如何保證技術(shù)人才的持續(xù)供應(yīng)和成長(zhǎng)?
張悅:2015年,張一鳴曾經(jīng)有這么一條簡(jiǎn)短的微博:Develop a company as a product。創(chuàng)業(yè)者在啟動(dòng)創(chuàng)業(yè)的時(shí)候,其實(shí)同時(shí)在做兩個(gè)產(chǎn)品。一個(gè)是提供給用戶的產(chǎn)品,另一個(gè)是提供給員工的產(chǎn)品,就是公司本身。
而公司的管理者就是這兩個(gè)產(chǎn)品的產(chǎn)品經(jīng)理,他負(fù)責(zé)鏈接兩端,一端是業(yè)務(wù),一端是員工。有的人可能會(huì)有疑問(wèn),公司給員工發(fā)工資、發(fā)獎(jiǎng)金,員工怎么可能是公司的客戶?其實(shí),在經(jīng)濟(jì)學(xué)原理下,“員工為公司貢獻(xiàn)生產(chǎn)要素,公司向員工支付工資和獎(jiǎng)金”,這件事情和“公司向客戶提供產(chǎn)品和服務(wù), 客戶向公司支付商品和服務(wù)費(fèi)用”在本質(zhì)上幾乎是一樣的,都是雙方利益最大化下進(jìn)行的等價(jià)交換。
“利益最大化”是我們做一切決策的關(guān)鍵指標(biāo),這里我們引入經(jīng)濟(jì)學(xué)上的 一個(gè)概念——ROI(Return on Investment)來(lái)幫助我們理解。ROI,一般翻譯為“投資回報(bào)率”,指代我們從一項(xiàng)投資中可以獲得的總經(jīng)濟(jì)回報(bào)。很多企業(yè)把人當(dāng)成企業(yè)的損耗成本,特別是有些 CEO 很節(jié)約,總想招一些便宜的人。但這種觀念在經(jīng)濟(jì)學(xué)上顯然是錯(cuò)的。
這個(gè)人雖然很便宜,但是能給你帶來(lái)的回報(bào)很少,或者說(shuō)低于你付給他的工資,那么這個(gè)人給你帶來(lái)的 ROI 就是負(fù)數(shù)。這個(gè)人雖然很貴,但是給你帶來(lái)的回報(bào)更大,說(shuō)不定這個(gè)人才是真正便宜的。
對(duì)于員工來(lái)說(shuō)也是一樣,他為什么愿意加入你的公司,因?yàn)榧尤肽愕墓?,個(gè)人投資回報(bào)率最大。而對(duì)于 CEO 來(lái)說(shuō),如何設(shè)計(jì)好“公司”這個(gè)產(chǎn)品,就是讓公司和員工同時(shí)擁有最高的 ROI,讓彼此對(duì)投資回報(bào)率感到滿意。
那么,公司和員工的 ROI 到底由哪些因素決定?我列出了以下這個(gè)公式:ROI=(功能性回報(bào)+心理性回報(bào))/(功能性投入+心理性 投入),它的大小主要由 4 個(gè)元素來(lái)決定,分別是公式的分母端的功能性投入(投入的時(shí)間、金錢(qián)),加上心理性投入(內(nèi)心疲憊、精神焦慮);分子端的功能性回報(bào)(長(zhǎng)短期收入),加上心理性回報(bào)(開(kāi)心、成就感、成長(zhǎng))。
而如果要讓 ROI 最大化,其實(shí)網(wǎng)達(dá)要做的只有兩件事,降低分母,提高分子。很簡(jiǎn)單,我把網(wǎng)達(dá)的人才機(jī)制拆解為 3 點(diǎn):
· 第一,回報(bào)。包括長(zhǎng)短期的經(jīng)濟(jì)回報(bào);
· 第二,成長(zhǎng)。在這個(gè)平臺(tái)能獲得多少成長(zhǎng)。
· 第三,心情。和團(tuán)隊(duì)、領(lǐng)導(dǎo)能否愉快共事,通勤成本是否影響心情等等。
另一方面,如何減少公司的總投入?網(wǎng)達(dá)也給出了招人的 3 個(gè)標(biāo)準(zhǔn):
1、超強(qiáng)學(xué)習(xí)能力;2、視野開(kāi)闊;3、心智成熟。
我們要招的是市場(chǎng)上最頂級(jí)的人,這些人必須要用市場(chǎng)最高的薪酬水平來(lái)獲取,包括給到員工的工資、獎(jiǎng)金和期權(quán),成本相對(duì)來(lái)說(shuō)都是很高的。但與此同時(shí),我們發(fā)現(xiàn)這樣的人招進(jìn)來(lái)之后:
1、公司管理的成本降低了。優(yōu)秀的員工一說(shuō)就靈,而且學(xué)習(xí)能力很快,公司花在每個(gè)員工身上的培訓(xùn)時(shí)間和金錢(qián)降低了;
2、領(lǐng)導(dǎo)花在員工上的心理性投入也降低了,大家目標(biāo)清晰、各司其職,都不掉鏈子,也不用擔(dān)心員工受不了壓力玻璃心,我們心理性的投入就會(huì)大大減少。
回頭來(lái)看,超強(qiáng)學(xué)習(xí)能力、視野開(kāi)闊、心智成熟,網(wǎng)達(dá)是通過(guò)這 3 個(gè)關(guān)鍵特質(zhì),精準(zhǔn)地打中了除金錢(qián)之外的所有要素上的成本降低,來(lái)有效維持公司總投入。
但 2021 年開(kāi)始,網(wǎng)達(dá)會(huì)加大和高等學(xué)府的產(chǎn)學(xué)研一體的項(xiàng)目培育和人才尋找,并充分給與團(tuán)隊(duì)和項(xiàng)目的發(fā)展自主權(quán)。每一個(gè)社會(huì)、國(guó)家、組織、企業(yè)都會(huì)有熵增出現(xiàn),作為每一個(gè)組織的管理者而言,制定好明確戰(zhàn)略、制定好高效管理,以人為本、 以終為始,管理者平衡好每一個(gè)個(gè)人的馬斯洛三層需求,人才是一定濟(jì)濟(jì)一堂的。
反過(guò)來(lái),每一位有才能的員工也要知道,打過(guò)仗吃過(guò)苦的人才更知道何為個(gè)人的成功。愛(ài)因斯坦有句話,“Information is not knowledge,experience is”,經(jīng)歷了才真正擁有知識(shí),中國(guó)古代也提倡“學(xué)以致用”方能立足于天下。網(wǎng)達(dá)軟件,給有才有識(shí)有志的人精彩的天下! “網(wǎng)”以致用,通“達(dá)”天下!
科技行者:請(qǐng)對(duì)中國(guó)網(wǎng)絡(luò)視頻行業(yè)未來(lái)一年的發(fā)展,做一些預(yù)測(cè)。
?張悅:網(wǎng)絡(luò)視頻超高清化是一年內(nèi)趨勢(shì)。超高清視頻產(chǎn)業(yè)主要包括超高清視頻的采集、編輯、傳輸、呈現(xiàn)的主要環(huán)節(jié),具有產(chǎn)業(yè)鏈條長(zhǎng)、輻射范圍廣、帶動(dòng)效應(yīng)強(qiáng)等特點(diǎn)。
在采集攝錄方面,高分辨率、高動(dòng)態(tài)范圍、三維立體、快速變焦等成為重要發(fā)展機(jī)遇。4K/8K 分辨率、50/60/120 幀、HDR 高動(dòng)態(tài)以及高色深成為視頻采集攝像機(jī)技術(shù)的需求,目前我國(guó)廣電級(jí)高端攝像機(jī)主要依賴國(guó)外,如索尼、松下等日本品牌,而我國(guó)卓曜、華創(chuàng)科技、尊正、扳手科技等企業(yè)已初步具備超高清專業(yè)攝像機(jī)自主設(shè)計(jì)和制造能力,并推出 4K 影視節(jié)目攝像機(jī)、4K 電影攝像機(jī)等產(chǎn)業(yè)化產(chǎn)品,演播室系統(tǒng)已初 步具備競(jìng)爭(zhēng)力,但國(guó)內(nèi)缺乏視覺(jué)特效與合成、圖像處理等基礎(chǔ)底層核心算法,并且在 CMOS 芯片、光學(xué)鏡頭、DRAM、Flash 存儲(chǔ)等方面仍落后日韓企業(yè)。
在編輯處理方面,端云協(xié)同、人工智能、視頻處理等基礎(chǔ)算法成為未來(lái)機(jī)遇。非線性編輯、后期渲染、特效等是視頻后期的主要環(huán)節(jié),在特效電影、CG 動(dòng)畫(huà)等對(duì)圖像渲染 的要求越來(lái)越高的情況下,云媒體制作成為重要手段之一,如《流浪地球》即使用云服務(wù)進(jìn)行渲染工作。目前,超高清視頻后期制作成本高、產(chǎn)出小,盡管很多影視采用 4K 拍攝,但只制作輸出高清版本,因此在當(dāng)前 4K 內(nèi)容不足的情況下,利用人工智能算法實(shí)現(xiàn)空間上超分辨率、時(shí)間上插幀成為重要解決方式。
在傳播輸出方面,編解碼方式和 5G、千兆固網(wǎng)寬帶等網(wǎng)絡(luò)傳輸方式成為關(guān)注焦點(diǎn)。編解碼方面,H.265、AVS 2成為超高清視頻編解碼的主要選擇,H.265(HEVC)可以在維持畫(huà)質(zhì)基本不變的前提下,讓數(shù)據(jù)傳輸寬帶減少至H.264的一半,支持最高為7680*4320的分辨率,H.265 還具有可變量的尺寸轉(zhuǎn)換(從4x4到32x32)、四叉樹(shù)結(jié)構(gòu)的預(yù)測(cè)區(qū)域(從 64x64 到 4x4)、多種幀內(nèi)預(yù)測(cè)模式、精準(zhǔn)的運(yùn)動(dòng)補(bǔ)償濾波器等特性, AVS 2由我國(guó)數(shù)字音頻解碼技術(shù)標(biāo)準(zhǔn)工作組制定,性能與 HEVC 相當(dāng),成為我國(guó)自主的編解碼標(biāo)準(zhǔn);網(wǎng)絡(luò)傳輸方面,有線電視、IPTV、衛(wèi)星廣播、地面廣播是網(wǎng)絡(luò)傳輸?shù)闹?要方式,使用H.265或與之相當(dāng)?shù)木幋a方式,在保證超高清視頻體驗(yàn)的前提下,4K碼流大概為 30~50Mbps,8K碼流大概為100~150Mbps。在我國(guó),IPTV和有線電視成為主要網(wǎng)絡(luò)傳輸方式,我國(guó)光纖寬帶和蜂窩網(wǎng)絡(luò)覆蓋全球領(lǐng)先,廣電獲得5G牌照,未來(lái)5G有望成為超高清視頻網(wǎng)絡(luò)傳輸?shù)男逻x擇。
在終端呈現(xiàn)方面,高分辨率、HDR、智能用戶交、沉浸式成為發(fā)展趨勢(shì)。目前 4K 電視已經(jīng)成為主流,中國(guó)市場(chǎng) 60%以上已是4K分辨率,而 8K 電視仍以展示為主。顯示面板方面,高對(duì)比度、高色深、高色域、高刷新率成為關(guān)鍵性指標(biāo)。良好的 HDR 體驗(yàn)要將面板的對(duì)比度提升至 10000:1 及以上,LCD面板達(dá)到 1000尼特峰值亮度,但我國(guó)市面上大部分電視僅僅能夠達(dá)到400尼特左右。
主控芯片方面,更高的編解碼能力和人工智能成為未來(lái)的發(fā)展方向。CPU、GPU、編解碼芯片、數(shù)據(jù)接口將均集成于電視機(jī)、 機(jī)頂盒 SoC 芯片內(nèi),基于未來(lái)語(yǔ)音、圖像的智能交互,神經(jīng)網(wǎng)絡(luò)等人工智能算法將從芯片層面給予支持。專用圖像處理芯片方面,由于對(duì)畫(huà)面的處理能力要求更高,色彩控制、銳度處理等圖像處理功能將更多采用獨(dú)立的圖像處理芯片,如索尼、三星等, 我國(guó)電視的畫(huà)質(zhì)處理更多以軟件方式實(shí)現(xiàn)。至于XR的頭戴式近眼顯示器,我認(rèn)為還需要 2-3 年來(lái)發(fā)展,C端產(chǎn)品對(duì)用戶體驗(yàn)感要求是極高的,而XR用戶良好體驗(yàn)感背后的科技含量是最為挑戰(zhàn)科技界的,低功耗、低延時(shí)、準(zhǔn)定位、交互好、沉浸式這些要素的實(shí)現(xiàn)還需要一段時(shí)間,但無(wú)論如何,下一代個(gè)人計(jì)算平臺(tái)一定是XR 頭戴式高清顯示設(shè)備。
在業(yè)務(wù)側(cè),我很看好除娛樂(lè)外的行業(yè)高清視頻類應(yīng)用,比如:人工智能支持的高清攝像頭,用來(lái)完成安防、防疫、流控、車輛等等社區(qū)或者公開(kāi)場(chǎng)所的各種場(chǎng)景。
科技行者:接下來(lái)的一年,網(wǎng)達(dá)的業(yè)務(wù)重點(diǎn)和工作方向是什么?
張悅:首先,雖然是 A 股主板上市公司,網(wǎng)達(dá)軟件從來(lái)把自身定位成創(chuàng)業(yè)公司,永遠(yuǎn)要處于創(chuàng)業(yè)的思想邏輯中、經(jīng)營(yíng)理念中。所以網(wǎng)達(dá)軟件新的一年定的業(yè)務(wù)主要方向是:
1、 高清視頻產(chǎn)業(yè);2、 5G+AI+邊緣計(jì)算。
高清視頻方面,網(wǎng)達(dá)將在兩個(gè)業(yè)務(wù)方面發(fā)力:編輯處理方面,端云協(xié)同、視頻處理等基礎(chǔ)算法和 H.265、AVS 2 超高清視頻編解碼。今年網(wǎng)達(dá)會(huì)推出自有品牌的網(wǎng)達(dá)SaaS云,服務(wù)于各行各業(yè)在視頻編輯、視頻運(yùn)營(yíng)、內(nèi)容安全服務(wù)等方面。5G+AI+邊緣計(jì)算方面,網(wǎng)達(dá)將推出自己品牌的硬件產(chǎn)品,高清智能攝像頭和邊緣計(jì)算盒子,在軟硬件一體的研發(fā)、算法的研發(fā)和業(yè)務(wù)場(chǎng)景的開(kāi)發(fā)上加速加快進(jìn)行,目標(biāo)就是世界范圍內(nèi)的客戶和市場(chǎng)。
為了達(dá)成上面兩個(gè)戰(zhàn)略業(yè)務(wù)目標(biāo),網(wǎng)達(dá)將在相關(guān)“人”、“事”、“物”上做好相關(guān)工作。
“人”就是:配備人員,寧缺毋濫,尋找最優(yōu)秀的技術(shù)和BD團(tuán)隊(duì),其中網(wǎng)達(dá)今年將成立專業(yè)的市場(chǎng)部門(mén),把公司獨(dú)立品牌建設(shè)好,把品宣做好,把國(guó)際化做起來(lái)。網(wǎng)達(dá)會(huì)采用更積極的方式來(lái)促進(jìn)項(xiàng)目和人才的成長(zhǎng),比如說(shuō)上市公司內(nèi)部孵化項(xiàng)目后再獨(dú)立運(yùn)作的道路,讓每一個(gè)有能力的員工看得遠(yuǎn)、走出去、跳進(jìn)河、爬上岸、 立天下。
“事”就是:抓住戰(zhàn)略項(xiàng)目,以去年年底剛中標(biāo)的幾個(gè)云能力項(xiàng)目和海外的 AI 智能終端項(xiàng)目為契機(jī),全員動(dòng)員,加速公司能力產(chǎn)品化,從賣開(kāi)發(fā)、到賣服務(wù)、再到賣能力,最后和我們的客戶共享價(jià)值。
“物”就是:對(duì)所有物料財(cái)務(wù)準(zhǔn)備工作的執(zhí)行。今年,網(wǎng)達(dá)在 A 股市場(chǎng)上有定向增發(fā)的計(jì)劃,目前也已經(jīng)獲得了很多青睞網(wǎng)達(dá)未來(lái)的投資機(jī)構(gòu)的戰(zhàn)略性投資標(biāo)的。同時(shí),今年元旦網(wǎng)達(dá)在合肥的產(chǎn)學(xué)研大樓也已經(jīng)結(jié)構(gòu)封頂了,未來(lái)網(wǎng)達(dá)也會(huì)獲得更多上海、浙江、安徽相關(guān)政府的產(chǎn)業(yè)扶持。今年,網(wǎng)達(dá)也會(huì)公司內(nèi)部推行積極的薪資革新和激勵(lì),我相信無(wú)論來(lái)自于哪里的網(wǎng)達(dá)人,都會(huì)對(duì)2021年充滿斗志、信心、 目標(biāo)和希望。
好文章,需要你的鼓勵(lì)
騰訊ARC實(shí)驗(yàn)室推出AudioStory系統(tǒng),首次實(shí)現(xiàn)AI根據(jù)復(fù)雜指令創(chuàng)作完整長(zhǎng)篇音頻故事。該系統(tǒng)結(jié)合大語(yǔ)言模型的敘事推理能力與音頻生成技術(shù),通過(guò)交錯(cuò)式推理生成、解耦橋接機(jī)制和漸進(jìn)式訓(xùn)練,能夠?qū)?fù)雜指令分解為連續(xù)音頻場(chǎng)景并保持整體連貫性。在AudioStory-10K基準(zhǔn)測(cè)試中表現(xiàn)優(yōu)異,為AI音頻創(chuàng)作開(kāi)辟新方向。
Meta與特拉維夫大學(xué)聯(lián)合研發(fā)的VideoJAM技術(shù),通過(guò)讓AI同時(shí)學(xué)習(xí)外觀和運(yùn)動(dòng)信息,顯著解決了當(dāng)前視頻生成模型中動(dòng)作不連貫、違反物理定律的核心問(wèn)題。該技術(shù)僅需添加兩個(gè)線性層就能大幅提升運(yùn)動(dòng)質(zhì)量,在多項(xiàng)測(cè)試中超越包括Sora在內(nèi)的商業(yè)模型,為AI視頻生成的實(shí)用化應(yīng)用奠定了重要基礎(chǔ)。
上海AI實(shí)驗(yàn)室發(fā)布OmniAlign-V研究,首次系統(tǒng)性解決多模態(tài)大語(yǔ)言模型人性化對(duì)話問(wèn)題。該研究創(chuàng)建了包含20萬(wàn)高質(zhì)量樣本的訓(xùn)練數(shù)據(jù)集和MM-AlignBench評(píng)測(cè)基準(zhǔn),通過(guò)創(chuàng)新的數(shù)據(jù)生成和質(zhì)量管控方法,讓AI在保持技術(shù)能力的同時(shí)顯著提升人性化交互水平,為AI價(jià)值觀對(duì)齊提供了可行技術(shù)路徑。
谷歌DeepMind團(tuán)隊(duì)開(kāi)發(fā)的GraphCast是一個(gè)革命性的AI天氣預(yù)測(cè)模型,能夠在不到一分鐘內(nèi)完成10天全球天氣預(yù)報(bào),準(zhǔn)確性超越傳統(tǒng)方法90%的指標(biāo)。該模型采用圖神經(jīng)網(wǎng)絡(luò)技術(shù),通過(guò)學(xué)習(xí)40年歷史數(shù)據(jù)掌握天氣變化規(guī)律,在極端天氣預(yù)測(cè)方面表現(xiàn)卓越,能耗僅為傳統(tǒng)方法的千分之一,為氣象學(xué)領(lǐng)域帶來(lái)了效率和精度的雙重突破。
關(guān)注科技創(chuàng)新、技術(shù)投資。
以文會(huì)友,左手硬核科技,右手浪漫主義。