像我這種曾先后供職于Snap、LinkedIn并創(chuàng)建過社交媒體分析公司的人來說,Clubhouse的潛力可以說是毋庸置疑。隨著奧普拉、扎克伯格、馬斯克乃至德雷克等名人紛紛入駐之后,這款“嵌入式音頻聊天”應(yīng)用已經(jīng)正式步入主流。
但是,Clubhouse的未來命運,取決于它如何幫助用戶尋找精彩內(nèi)容、提高參與程度。雖然面對這個問題,每個人都能想到正確答案——“用戶數(shù)據(jù)”,但具體實現(xiàn)絕對沒那么輕松。
“Clubhouse是什么?”
咱們來聽聽用戶們對于Clubhouse的描述:
1. 不適合老年用戶
2. 音頻領(lǐng)域的下一個Snapchat
3. 帶社區(qū)功能的Zoom
4. 年輕一代的“收音機”
5. 首個AirPods社區(qū)網(wǎng)絡(luò)
6. 相當(dāng)于在九十年代的聊天熱線上隨機閑聊
7. 包羅萬有的社交互動層
本質(zhì)上,Clubhouse的功能就是引導(dǎo)用戶加入音頻室,與其他人一起聊天。有些聊天房是主持人跟私人好友的閑聊場所,也有些房間則可能有成千上萬的用戶靜靜聆聽奧普拉的座談。短短幾個月內(nèi),Clubhouse就實現(xiàn)了驚人的用戶增長,目前估值已經(jīng)高達10億美元。
很多人將這一成功歸因于我們在疫情引發(fā)的社交隔離期間迫切需要恢復(fù)社交互動。Twitch或者YouTube中的直播與精心制作的視頻顯然難以滿足這種需求。話雖如此,但這種指數(shù)級的增長似乎并不僅僅源于此。
Clubhouse降低了參與對話的門檻。撰寫博文與創(chuàng)建漂亮視頻往往需要大量精力與技巧性投入。相比之下,參加語音聊天甚至比自拍還簡單。設(shè)置一次性聊天房也比規(guī)劃播客節(jié)目更輕松。總而言之,這款應(yīng)用大大簡化了談話廣播內(nèi)容的創(chuàng)作過程。
Clubhouse,廣播熱線的互聯(lián)網(wǎng)1.0版本
在互聯(lián)網(wǎng)瀏覽器誕生的十年之前,也就是上世紀(jì)八十年代,廣播熱線的風(fēng)頭正勁。其流行原因與Clubhouse非常相似:降低了內(nèi)容放送與傳播的門檻。AM頻段提供更充裕的帶寬以發(fā)布各類內(nèi)容。另外,寬松的管制政策也讓本地廣播電臺迅速發(fā)展為行業(yè)規(guī)模的內(nèi)容創(chuàng)作平臺。四十年后,互聯(lián)網(wǎng)的普及給我們帶來了類似的效果:以零邊際成本發(fā)布內(nèi)容;再以Clubhouse為例,其中沒有特定的廣播或者討論專題限制。 @benthompson 在社交網(wǎng)絡(luò)2.0中強調(diào),Clubhouse擁有典型的互聯(lián)網(wǎng)1.0特性:
“請注意,v1數(shù)字產(chǎn)品的本質(zhì)特征,在于其單純復(fù)制線下已經(jīng)存在的內(nèi)容。對Facebook來說,這代表著將好友與家人間的聯(lián)系數(shù)字化;對Twitter來說,相當(dāng)于是把酒吧里的輕松聊天搬到公開平臺上。之所以這一切只能稱為v1,是因為在v2產(chǎn)品中,必須包含某些只能通過數(shù)字化這一獨特屬性才能實現(xiàn)的功能。”
反過來,可以看出Clubhouse并沒有充分利用這種“數(shù)字化屬性”。從根本上講,一切社交應(yīng)用都需要解決兩個問題:1)尋找社交互動;2)開啟社交互動。只要稍微在Clubhouse上轉(zhuǎn)轉(zhuǎn),大家就會意識到,自己很難在這里找到有趣的對話。當(dāng)然,你可以關(guān)注主聊某些內(nèi)容的用戶,但其中的基本方式與Twitter提供感興趣選項的推薦方案仍然有所區(qū)別。
我們可以把Clubhouse理解成一種社交圖譜結(jié)構(gòu),這正是Twitter最笨拙的信息管理方式。一位好友最近告訴我:“我終于設(shè)置好了Twitter賬戶,現(xiàn)在可以只獲取自己感興趣的內(nèi)容了。”他可是從2008年起就一直在用Twitter的,到現(xiàn)在才真正摸到符合自己喜好的用法!Twitter會經(jīng)常要求用戶更新并調(diào)整自己的關(guān)注對象與“用戶滿意”選項。更可怕的是,我們往往會在Twitter上看到大量自己完全不想看的內(nèi)容;同樣的,用戶在Clubhouse上也經(jīng)常身陷漫長而乏味的尬聊。
問題就在于:數(shù)據(jù)的挑戰(zhàn)。
為了尋找最適合當(dāng)前用戶的話題,Clubhouse需要理解全部對話內(nèi)容,即以實時方式將對話內(nèi)容轉(zhuǎn)錄下來。這一目標(biāo)在技術(shù)上完全可行,目前的語音到文本算法已經(jīng)非常強大,并沒有太高的使用門檻。
Clubhouse目前不會記錄用戶的談話內(nèi)容,我認為這是因為運營方暫時不想影響到對話的真實性。類似的,Snap最初也曾經(jīng)快速爆紅。但請注意,Snap與Clubhouse從未明確表示他們不會保存信息記錄。
TikTok的推薦魔法
作為如今第一算法廠商,TikTok憑借強大的推薦功能為Clubhouse的后續(xù)發(fā)展指明了出路。與Clubhouse或者Facebook不同,TikTok主要依賴的并不是社交圖譜,而是強大的推薦引擎。正如 @eugenewei在談TikTok與“分院帽”中所提到:
“字節(jié)跳動的軟件工程師們對自己的算法擁有偏執(zhí)般的關(guān)注,并在這方面用掉過去一半的檢查周期。字節(jié)跳動也被稱為算法公司,最早是突破性的「新聞」類應(yīng)用今日頭條、之后是短視頻平臺抖音,最后又有TikTok。”
TikTok的機器學(xué)習(xí)魔法源自一種有監(jiān)督學(xué)習(xí)系統(tǒng),能夠快速找到用戶感興趣的視頻。它會衡量用戶看了多久、滾動速度有多快并考量其他多種行為特征,借此盡可能提升推薦算法的準(zhǔn)確率。此外,該算法還會評估視頻片段的實際屬性:內(nèi)容、速度、聲音、顏色、文字等等。為了讓算法切實起效,TikTok需要大量數(shù)據(jù)、海量數(shù)據(jù)。單是為了創(chuàng)建一套能夠識別圖像內(nèi)容的系統(tǒng),我們就需要1400萬張分類訓(xùn)練圖像(例如 imagenet)。
是否收集數(shù)據(jù)一直是產(chǎn)品設(shè)計層面的重要選擇。在設(shè)計TikTok核心時,字節(jié)跳動就考慮到這方面問題。如今,該算法已經(jīng)遠遠優(yōu)于Facebook的推薦算法。此外,這部分數(shù)據(jù)也建立起巨大的業(yè)務(wù)壁壘,就連Facebook也很難輕松攻克。
TikTok是一家算法優(yōu)先公司。其不依賴于社交圖譜,獨立構(gòu)建起強大的推薦引擎。
隨著Clubhouse的發(fā)展,運營方也需要在這方面做出設(shè)計選擇。他們該如何記錄對話中的積極情緒?Clubhouse是一種被動的載體,因此用戶可能不會直接對對話做出反應(yīng)。Spotify或者Deezer等廠商面對的問題就相對簡單,比如他們可以輕易發(fā)現(xiàn)用戶不喜歡“切歌”之類的操作出現(xiàn)延遲;但Clubhouse不行,他們甚至很難明確目前聊天房里的用戶喜不喜歡當(dāng)前對話,這大大提高了算法的改進門檻。
推薦內(nèi)容創(chuàng)作者可能是種衡量用戶滿意度的明確方法,但這種方式在使用初期往往起效很慢。根據(jù)我自己的創(chuàng)業(yè)經(jīng)驗,跟蹤相同內(nèi)容在不同平臺上的傳播情況、或者說轉(zhuǎn)發(fā)量,往往也是衡量參與度的理想信號。這種方式似乎也適用于Clubhouse。如今,你已經(jīng)可以在Twitter或者Facebook等其他平臺上收聽Clubhouse對話中的精彩段落。因此,未來Twitter與Facebook很可能會拿出與Clubhouse正面競爭的產(chǎn)品,這是因為他們不僅擁有社交圖說、也掌握著能夠衡量內(nèi)容質(zhì)量的傳播渠道。
Clubhouse 的未來
盡管面臨一系列挑戰(zhàn),但Clubhouse迅猛的前期發(fā)展勢頭仍然值得肯定。而后續(xù)能不能堅持住這樣的好狀態(tài),取決于Clubhouse能否以較低的成本推動發(fā)布內(nèi)容的多元化。運營方當(dāng)然意識到了這個問題,因此宣布將投巨資為創(chuàng)作工具開發(fā)者與內(nèi)容創(chuàng)作者提供收益。為了擴展業(yè)務(wù)規(guī)模,他們還需要建立各類數(shù)據(jù)與參與度指標(biāo)。如果不能成功破圈,Clubhouse只能成為音頻內(nèi)容下的一套子堆棧——本身雖然仍可算成功,但絕對無法發(fā)揮出全部可能的潛力。
(聲明:本文僅代表作者觀點,不代表科技行者立場。)
來源丨Forbes
作者丨Lutz Finger
編譯丨科技行者
好文章,需要你的鼓勵
新加坡國立大學(xué)研究團隊開發(fā)了SPIRAL框架,通過讓AI與自己對弈零和游戲來提升推理能力。實驗顯示,僅訓(xùn)練AI玩簡單撲克游戲就能讓其數(shù)學(xué)推理能力提升8.6%,通用推理提升8.4%,且無需任何數(shù)學(xué)題目作為訓(xùn)練材料。研究發(fā)現(xiàn)游戲中的三種推理模式能成功轉(zhuǎn)移到數(shù)學(xué)解題中,為AI訓(xùn)練提供了新思路。
同濟大學(xué)團隊開發(fā)的GIGA-ToF技術(shù)通過融合多幀圖像的"圖結(jié)構(gòu)"信息,創(chuàng)新性地解決了3D相機噪聲問題。該技術(shù)利用圖像間的不變幾何關(guān)系,結(jié)合深度學(xué)習(xí)和數(shù)學(xué)優(yōu)化方法,在合成數(shù)據(jù)集上實現(xiàn)37.9%的精度提升,并在真實設(shè)備上展現(xiàn)出色泛化能力,為機器人、AR和自動駕駛等領(lǐng)域提供更可靠的3D視覺解決方案。
伊利諾伊大學(xué)研究團隊通過對比實驗發(fā)現(xiàn),經(jīng)過強化學(xué)習(xí)訓(xùn)練的視覺語言模型雖然表現(xiàn)出"頓悟時刻"現(xiàn)象,但這些自我糾錯行為并不能實際提升推理準(zhǔn)確率。研究揭示了AI模型存在"生成-驗證差距",即生成答案的能力強于驗證答案質(zhì)量的能力,且模型在自我驗證時無法有效利用視覺信息,為AI多模態(tài)推理發(fā)展提供了重要啟示。
MIT等頂尖機構(gòu)聯(lián)合提出SparseLoRA技術(shù),通過動態(tài)稀疏性實現(xiàn)大語言模型訓(xùn)練加速1.6倍,計算成本降低2.2倍。該方法使用SVD稀疏性估計器智能選擇重要計算部分,在保持模型性能的同時顯著提升訓(xùn)練效率,已在多個任務(wù)上驗證有效性。