av天堂久久天堂色综合,最近中文字幕mv免费高清在线,在线a级毛片免费视频,av动漫,中文字幕精品亚洲无线码一区

微信掃一掃,關(guān)注公眾號(hào)

  • 科技行者

  • 算力行者

見證連接與計(jì)算的「力量」

首頁 Lightricks最新視頻生成模型,速度快30倍,普通電腦就能跑!

Lightricks最新視頻生成模型,速度快30倍,普通電腦就能跑!

2025-05-09 14:28
分享至:
----..---.-...-/--...-.-......./-...-....-..--../-............-.- ----..---.-...-/--...-.-......./-...-....-..--../-............-.- ----..---.-...-/--...-.-......./-...-....-..--../-............-.- ----..---.-...-/--...-.-......./-...-....-..--../-............-.-
2025-05-09 14:28 ? 于佳卉

或許你對(duì) Lightricks 這個(gè)名字并不熟悉,但對(duì)于活躍在社交媒體上、熟悉P圖的用戶來說,它旗下的 Facetune 幾乎是家喻戶曉的存在。這家總部位于以色列的公司,憑借 Facetune、Videoleap 等一系列橫跨圖片編輯和短視頻制作的成功產(chǎn)品,在全球消費(fèi)級(jí)創(chuàng)意應(yīng)用市場(chǎng)積累了深厚的技術(shù)實(shí)力和用戶基礎(chǔ)。

就在前兩天,Lightricks 正式發(fā)布了他們最新的AI視頻生成模型—— LTX Video 130億參數(shù)模型 (LTXV-13B)。模型一經(jīng)發(fā)布,便迅速在網(wǎng)絡(luò)上引起了熱潮。

Lightricks最新視頻生成模型,速度快30倍,普通電腦就能跑!

LTXV-13B最引人注目的有兩點(diǎn):第一,它在生成高質(zhì)量 AI 視頻方面的效率顯著提升,速度比現(xiàn)有同類模型快達(dá) 30 倍;第二也是更關(guān)鍵的是,它打破了高端硬件的桎梏,聲稱能夠運(yùn)行在消費(fèi)級(jí) GPU 上,無需依賴昂貴的企業(yè)級(jí)設(shè)備。

這意味著什么?Lightricks 聯(lián)合創(chuàng)始人兼 CEO Zeev Farbman 在接受采訪時(shí)給出了他的解讀:“130 億參數(shù)的 LTX Video 模型是 AI 視頻生成領(lǐng)域的一個(gè)重要進(jìn)展,它讓在消費(fèi)級(jí) GPU 上快速生成高質(zhì)量視頻成為可能。” 他進(jìn)一步指出,這將使用戶能夠以更高的一致性、更好的質(zhì)量和更精細(xì)的控制來創(chuàng)作內(nèi)容。

突破“顯存”瓶頸:AI視頻普惠化的關(guān)鍵一步

我們不妨先回顧一下 AI 視頻生成當(dāng)前面臨的核心技術(shù)挑戰(zhàn)。長期以來,高性能 GPU,尤其是其配備的大容量顯存(VRAM),一直是橫亙?cè)谄胀ㄓ脩裘媲暗囊坏?ldquo;高墻”。像 Runway、Pika、Luma 等在文生視頻領(lǐng)域走在前沿的模型,通常需要依賴于配備 80GB 甚至更高顯存的企業(yè)級(jí) GPU 集群進(jìn)行訓(xùn)練和推理。

對(duì)計(jì)算資源的極度依賴,導(dǎo)致這些模型大多部署在云端。對(duì)于絕大多數(shù)個(gè)體創(chuàng)作者或小型團(tuán)隊(duì)而言,本地部署幾乎不現(xiàn)實(shí),他們不得不依賴昂貴的云服務(wù)。這不僅推高了使用成本,按時(shí)計(jì)費(fèi)的模式也在一定程度上限制了創(chuàng)作者自由探索和快速迭代的靈活性。

LTXV-13B 的核心價(jià)值,恰恰在于其對(duì)這一硬件瓶頸的突破性嘗試。Farbman 解釋說,消費(fèi)級(jí)和企業(yè)級(jí) GPU 最主要的分界線就在于顯存容量。例如,英偉達(dá)面向普通消費(fèi)者的 RTX 3090 和 4090 最高顯存為 24GB,最新的 5090 也只有 32GB,與企業(yè)級(jí)顯卡動(dòng)輒 80GB+ 的顯存相去甚遠(yuǎn)。

Lightricks 的新模型,正是設(shè)計(jì)來在這些相對(duì)有限的顯存條件下高效運(yùn)作。“即使是完整模型,無需任何量化或近似處理,也能在 RTX 3090、4090、5090 等頂級(jí)消費(fèi)級(jí) GPU 及其筆記本版本上運(yùn)行。” Farbman 確認(rèn)。這無疑是 AI 視頻生成走向“民主化”、降低門檻的關(guān)鍵一步。

“多尺度渲染”:從藝術(shù)家流程中汲取靈感

那么,LTXV-13B 是如何做到在有限顯存下實(shí)現(xiàn)高效運(yùn)行的?其背后的技術(shù)“秘密武器”,是 Lightricks 稱之為“多尺度渲染”的創(chuàng)新方法。Farbman 將其描述為“本次發(fā)布中最大的技術(shù)突破”。

他解釋說:“這一技術(shù)使得模型能夠逐步細(xì)化生成過程。模型并非一次性渲染完整畫面,而是模仿藝術(shù)家的創(chuàng)作流程:先在粗略的網(wǎng)格上構(gòu)建場(chǎng)景和物體運(yùn)動(dòng)的初步框架,隨后將畫面分解成一個(gè)個(gè)區(qū)域或‘圖塊’,并對(duì)每個(gè)圖塊逐步添加高精度的細(xì)節(jié)。”

這種“分而治之”、逐層細(xì)化的渲染策略,巧妙地將模型的峰值顯存需求限制在處理單個(gè)“圖塊”所需的內(nèi)存,而非一次性處理整個(gè)最終輸出分辨率所需的內(nèi)存。顯存的占用峰值被有效控制在較低水平。

此外,模型采用了更緊湊的潛在空間(latent space)表示,進(jìn)一步優(yōu)化了內(nèi)存使用效率,在保證生成質(zhì)量的同時(shí),進(jìn)一步減少了顯存需求。Lightricks 提供的性能數(shù)據(jù)顯示,LTXV-13B 生成一段視頻僅需 37.59 秒,相比競(jìng)品動(dòng)輒上千秒的耗時(shí),速度提升近 40 倍,這正是其底層高效架構(gòu)和創(chuàng)新技術(shù)帶來的直接成果。

Lightricks最新視頻生成模型,速度快30倍,普通電腦就能跑!

圖片來源:Lightricks

技術(shù)之外的棋局:開源、合規(guī)與獨(dú)特的商業(yè)模式

在技術(shù)層面實(shí)現(xiàn)突破的同時(shí),Lightricks 在商業(yè)和生態(tài)策略上也走出了一條差異化路徑。在當(dāng)前不少頂尖 AI 模型走向閉源或 API 收費(fèi)的趨勢(shì)下,Lightricks 卻選擇將 LTXV-13B 完全開源,代碼托管在 Hugging Face 和 GitHub。

Farbman 對(duì)此的解釋是,開源能有效降低自身的研發(fā)成本,并借助全球開發(fā)者社區(qū)的力量加速模型迭代。通過社區(qū)的廣泛使用和貢獻(xiàn),Lightricks 能夠更專注于模型的整體規(guī)劃和“策展”,發(fā)現(xiàn)和整合最有價(jià)值的改進(jìn)方向。

另一個(gè)關(guān)鍵點(diǎn)是數(shù)據(jù)合規(guī)。隨著針對(duì)抓取數(shù)據(jù)訓(xùn)練模型引發(fā)的法律爭(zhēng)議增多,模型的“純凈度”對(duì)商業(yè)應(yīng)用至關(guān)重要。Lightricks 選擇與內(nèi)容巨頭 Getty Images 和 Shutterstock 建立合作,獲取授權(quán)數(shù)據(jù)進(jìn)行模型訓(xùn)練。

Farbman 坦言,盡管數(shù)據(jù)收集仍存在法律灰色地帶,但對(duì)于有嚴(yán)格合規(guī)要求的企業(yè)客戶而言,提供基于“干凈”數(shù)據(jù)的模型至關(guān)重要。這些合作旨在確保模型用于商業(yè)應(yīng)用的法律合規(guī)性,尤其是在對(duì)版權(quán)要求嚴(yán)格的企業(yè)級(jí)市場(chǎng),這構(gòu)成了 Lightricks 的差異化競(jìng)爭(zhēng)優(yōu)勢(shì)。

在商業(yè)化模式上,Lightricks 更是采取了分層策略:對(duì)年收入低于 1000 萬美元的企業(yè),提供免費(fèi)許可。

Farbman 坦言,這不是為了直接從小型創(chuàng)作者那里賺錢,而是為了快速擴(kuò)大模型使用范圍,積累用戶和生態(tài),證明模型價(jià)值。真正的商業(yè)化目標(biāo)是那些通過模型取得顯著商業(yè)成功(年收入超過 1000 萬美元)的大公司,屆時(shí)將參照游戲引擎等模式協(xié)商許可協(xié)議。這是一種典型的平臺(tái)或生態(tài)型商業(yè)策略,通過前端免費(fèi)或低門檻,吸引海量用戶和應(yīng)用,再從頂部的商業(yè)化項(xiàng)目中獲取回報(bào)。

AI 視頻生成正影響動(dòng)畫制作領(lǐng)域

盡管 LTXV-13B 在硬件兼容性和效率上取得了顯著進(jìn)展,F(xiàn)arbman 仍坦承,AI 視頻生成距離“好萊塢電影級(jí)”水準(zhǔn)尚有距離。當(dāng)前的生成效果可能在細(xì)節(jié)、一致性等方面仍有提升空間,但它已經(jīng)能在特定領(lǐng)域發(fā)揮價(jià)值。

Lightricks最新視頻生成模型,速度快30倍,普通電腦就能跑!

LTXV-13B 模型在單個(gè)消費(fèi)級(jí) GPU 上渲染的兩只兔子 | 圖片來源:Lightricks

例如,模型當(dāng)前就能在例如動(dòng)畫制作中,大幅提升效率、降低成本。在高端動(dòng)畫生產(chǎn)中,創(chuàng)意和故事構(gòu)思只占預(yù)算一小部分,而耗時(shí)耗力的關(guān)鍵幀繪制則消耗大量資源。AI 輔助關(guān)鍵幀生成,正是 AI 在實(shí)際生產(chǎn)流程中“降本增效”的典型應(yīng)用場(chǎng)景。

展望未來,F(xiàn)arbman 預(yù)測(cè)下一代 AI 視頻模型將是“多模態(tài)”的,能夠整合視頻、音頻、音樂等不同數(shù)據(jù)類型,并在統(tǒng)一的潛在空間中協(xié)同工作。這將使得如唇語同步等復(fù)雜任務(wù)變得更加容易處理,實(shí)現(xiàn)更自然、更全面的內(nèi)容生成。

Lightricks LTXV-13B 模型作為其在這一領(lǐng)域的重要探索,現(xiàn)已開源,并計(jì)劃逐步集成到 Lightricks 旗下的創(chuàng)意應(yīng)用平臺(tái),比如面向故事創(chuàng)作的 LTX Studio。這一系列動(dòng)作,不僅是技術(shù)上的迭代,更是 Lightricks 試圖在 AI 視頻生成這個(gè)新興賽道上,通過技術(shù)突破、開源策略和獨(dú)特的商業(yè)模式,重塑硬件邊界,構(gòu)建自身生態(tài)的關(guān)鍵棋步。

分享至
0贊

好文章,需要你的鼓勵(lì)

于佳卉

Erin
搜羅全網(wǎng)最新科技事件,做有態(tài)度的評(píng)論欄目。
推薦文章
----..---.-...-/--...-.-......./-...-....-..--../-............-.- ----..---.-...-/--...-.-......./-...-....-..--../-............-.- ----..---.-...-/--...-.-......./-...-....-..--../-............-.- ----..---.-...-/--...-.-......./-...-....-..--../-............-.-