av天堂久久天堂色综合,最近中文字幕mv免费高清在线,在线a级毛片免费视频,av动漫,中文字幕精品亚洲无线码一区

<sub id="fhndw"><p id="fhndw"></p></sub>

<sup id="fhndw"></sup>

首頁
對(duì)話創(chuàng)新
對(duì)話科技行者
機(jī)器人新紀(jì)元
AI論文解讀
聯(lián)系我們

微信掃一掃，關(guān)注公眾號(hào)

科技行者
算力行者

見證連接與計(jì)算的「力量」

Lightricks最新視頻生成模型，速度快30倍，普通電腦就能跑！

AI大模型視頻生成Lightricks

Lightricks最新視頻生成模型，速度快30倍，普通電腦就能跑！

作者：于佳卉

2025-05-09 14:28

分享至：

LTXV-13B 速度比現(xiàn)有同類模型快達(dá) 30 倍，且能夠運(yùn)行在消費(fèi)級(jí) GPU 上。

----..---.-...-/--...-.-......./-...-....-..--../-............-.- ----..---.-...-/--...-.-......./-...-....-..--../-............-.- ----..---.-...-/--...-.-......./-...-....-..--../-............-.- ----..---.-...-/--...-.-......./-...-....-..--../-............-.-

2025-05-09 14:28 ? 于佳卉

或許你對(duì) Lightricks 這個(gè)名字并不熟悉，但對(duì)于活躍在社交媒體上、熟悉P圖的用戶來說，它旗下的 Facetune 幾乎是家喻戶曉的存在。這家總部位于以色列的公司，憑借 Facetune、Videoleap 等一系列橫跨圖片編輯和短視頻制作的成功產(chǎn)品，在全球消費(fèi)級(jí)創(chuàng)意應(yīng)用市場(chǎng)積累了深厚的技術(shù)實(shí)力和用戶基礎(chǔ)。

就在前兩天，Lightricks 正式發(fā)布了他們最新的AI視頻生成模型—— LTX Video 130億參數(shù)模型（LTXV-13B）。模型一經(jīng)發(fā)布，便迅速在網(wǎng)絡(luò)上引起了熱潮。

LTXV-13B最引人注目的有兩點(diǎn)：第一，它在生成高質(zhì)量 AI 視頻方面的效率顯著提升，速度比現(xiàn)有同類模型快達(dá) 30 倍；第二也是更關(guān)鍵的是，它打破了高端硬件的桎梏，聲稱能夠運(yùn)行在消費(fèi)級(jí) GPU 上，無需依賴昂貴的企業(yè)級(jí)設(shè)備。

這意味著什么？Lightricks 聯(lián)合創(chuàng)始人兼 CEO Zeev Farbman 在接受采訪時(shí)給出了他的解讀：“130 億參數(shù)的 LTX Video 模型是 AI 視頻生成領(lǐng)域的一個(gè)重要進(jìn)展，它讓在消費(fèi)級(jí) GPU 上快速生成高質(zhì)量視頻成為可能。” 他進(jìn)一步指出，這將使用戶能夠以更高的一致性、更好的質(zhì)量和更精細(xì)的控制來創(chuàng)作內(nèi)容。

突破“顯存”瓶頸：AI視頻普惠化的關(guān)鍵一步

我們不妨先回顧一下 AI 視頻生成當(dāng)前面臨的核心技術(shù)挑戰(zhàn)。長期以來，高性能 GPU，尤其是其配備的大容量顯存（VRAM），一直是橫亙?cè)谄胀ㄓ脩裘媲暗囊坏?ldquo;高墻”。像 Runway、Pika、Luma 等在文生視頻領(lǐng)域走在前沿的模型，通常需要依賴于配備 80GB 甚至更高顯存的企業(yè)級(jí) GPU 集群進(jìn)行訓(xùn)練和推理。

對(duì)計(jì)算資源的極度依賴，導(dǎo)致這些模型大多部署在云端。對(duì)于絕大多數(shù)個(gè)體創(chuàng)作者或小型團(tuán)隊(duì)而言，本地部署幾乎不現(xiàn)實(shí)，他們不得不依賴昂貴的云服務(wù)。這不僅推高了使用成本，按時(shí)計(jì)費(fèi)的模式也在一定程度上限制了創(chuàng)作者自由探索和快速迭代的靈活性。

LTXV-13B 的核心價(jià)值，恰恰在于其對(duì)這一硬件瓶頸的突破性嘗試。Farbman 解釋說，消費(fèi)級(jí)和企業(yè)級(jí) GPU 最主要的分界線就在于顯存容量。例如，英偉達(dá)面向普通消費(fèi)者的 RTX 3090 和 4090 最高顯存為 24GB，最新的 5090 也只有 32GB，與企業(yè)級(jí)顯卡動(dòng)輒 80GB+ 的顯存相去甚遠(yuǎn)。

Lightricks 的新模型，正是設(shè)計(jì)來在這些相對(duì)有限的顯存條件下高效運(yùn)作。“即使是完整模型，無需任何量化或近似處理，也能在 RTX 3090、4090、5090 等頂級(jí)消費(fèi)級(jí) GPU 及其筆記本版本上運(yùn)行。” Farbman 確認(rèn)。這無疑是 AI 視頻生成走向“民主化”、降低門檻的關(guān)鍵一步。

“多尺度渲染”：從藝術(shù)家流程中汲取靈感

那么，LTXV-13B 是如何做到在有限顯存下實(shí)現(xiàn)高效運(yùn)行的？其背后的技術(shù)“秘密武器”，是 Lightricks 稱之為“多尺度渲染”的創(chuàng)新方法。Farbman 將其描述為“本次發(fā)布中最大的技術(shù)突破”。

他解釋說：“這一技術(shù)使得模型能夠逐步細(xì)化生成過程。模型并非一次性渲染完整畫面，而是模仿藝術(shù)家的創(chuàng)作流程：先在粗略的網(wǎng)格上構(gòu)建場(chǎng)景和物體運(yùn)動(dòng)的初步框架，隨后將畫面分解成一個(gè)個(gè)區(qū)域或‘圖塊’，并對(duì)每個(gè)圖塊逐步添加高精度的細(xì)節(jié)。”

這種“分而治之”、逐層細(xì)化的渲染策略，巧妙地將模型的峰值顯存需求限制在處理單個(gè)“圖塊”所需的內(nèi)存，而非一次性處理整個(gè)最終輸出分辨率所需的內(nèi)存。顯存的占用峰值被有效控制在較低水平。

此外，模型采用了更緊湊的潛在空間（latent space）表示，進(jìn)一步優(yōu)化了內(nèi)存使用效率，在保證生成質(zhì)量的同時(shí)，進(jìn)一步減少了顯存需求。Lightricks 提供的性能數(shù)據(jù)顯示，LTXV-13B 生成一段視頻僅需 37.59 秒，相比競(jìng)品動(dòng)輒上千秒的耗時(shí)，速度提升近 40 倍，這正是其底層高效架構(gòu)和創(chuàng)新技術(shù)帶來的直接成果。

圖片來源：Lightricks

技術(shù)之外的棋局：開源、合規(guī)與獨(dú)特的商業(yè)模式

在技術(shù)層面實(shí)現(xiàn)突破的同時(shí)，Lightricks 在商業(yè)和生態(tài)策略上也走出了一條差異化路徑。在當(dāng)前不少頂尖 AI 模型走向閉源或 API 收費(fèi)的趨勢(shì)下，Lightricks 卻選擇將 LTXV-13B 完全開源，代碼托管在 Hugging Face 和 GitHub。

Farbman 對(duì)此的解釋是，開源能有效降低自身的研發(fā)成本，并借助全球開發(fā)者社區(qū)的力量加速模型迭代。通過社區(qū)的廣泛使用和貢獻(xiàn)，Lightricks 能夠更專注于模型的整體規(guī)劃和“策展”，發(fā)現(xiàn)和整合最有價(jià)值的改進(jìn)方向。

另一個(gè)關(guān)鍵點(diǎn)是數(shù)據(jù)合規(guī)。隨著針對(duì)抓取數(shù)據(jù)訓(xùn)練模型引發(fā)的法律爭議增多，模型的“純凈度”對(duì)商業(yè)應(yīng)用至關(guān)重要。Lightricks 選擇與內(nèi)容巨頭 Getty Images 和 Shutterstock 建立合作，獲取授權(quán)數(shù)據(jù)進(jìn)行模型訓(xùn)練。

Farbman 坦言，盡管數(shù)據(jù)收集仍存在法律灰色地帶，但對(duì)于有嚴(yán)格合規(guī)要求的企業(yè)客戶而言，提供基于“干凈”數(shù)據(jù)的模型至關(guān)重要。這些合作旨在確保模型用于商業(yè)應(yīng)用的法律合規(guī)性，尤其是在對(duì)版權(quán)要求嚴(yán)格的企業(yè)級(jí)市場(chǎng)，這構(gòu)成了 Lightricks 的差異化競(jìng)爭優(yōu)勢(shì)。

在商業(yè)化模式上，Lightricks 更是采取了分層策略：對(duì)年收入低于 1000 萬美元的企業(yè)，提供免費(fèi)許可。

Farbman 坦言，這不是為了直接從小型創(chuàng)作者那里賺錢，而是為了快速擴(kuò)大模型使用范圍，積累用戶和生態(tài)，證明模型價(jià)值。真正的商業(yè)化目標(biāo)是那些通過模型取得顯著商業(yè)成功（年收入超過 1000 萬美元）的大公司，屆時(shí)將參照游戲引擎等模式協(xié)商許可協(xié)議。這是一種典型的平臺(tái)或生態(tài)型商業(yè)策略，通過前端免費(fèi)或低門檻，吸引海量用戶和應(yīng)用，再從頂部的商業(yè)化項(xiàng)目中獲取回報(bào)。

AI 視頻生成正影響動(dòng)畫制作領(lǐng)域

盡管 LTXV-13B 在硬件兼容性和效率上取得了顯著進(jìn)展，F(xiàn)arbman 仍坦承，AI 視頻生成距離“好萊塢電影級(jí)”水準(zhǔn)尚有距離。當(dāng)前的生成效果可能在細(xì)節(jié)、一致性等方面仍有提升空間，但它已經(jīng)能在特定領(lǐng)域發(fā)揮價(jià)值。

LTXV-13B 模型在單個(gè)消費(fèi)級(jí) GPU 上渲染的兩只兔子 | 圖片來源：Lightricks

例如，模型當(dāng)前就能在例如動(dòng)畫制作中，大幅提升效率、降低成本。在高端動(dòng)畫生產(chǎn)中，創(chuàng)意和故事構(gòu)思只占預(yù)算一小部分，而耗時(shí)耗力的關(guān)鍵幀繪制則消耗大量資源。AI 輔助關(guān)鍵幀生成，正是 AI 在實(shí)際生產(chǎn)流程中“降本增效”的典型應(yīng)用場(chǎng)景。

展望未來，F(xiàn)arbman 預(yù)測(cè)下一代 AI 視頻模型將是“多模態(tài)”的，能夠整合視頻、音頻、音樂等不同數(shù)據(jù)類型，并在統(tǒng)一的潛在空間中協(xié)同工作。這將使得如唇語同步等復(fù)雜任務(wù)變得更加容易處理，實(shí)現(xiàn)更自然、更全面的內(nèi)容生成。

Lightricks LTXV-13B 模型作為其在這一領(lǐng)域的重要探索，現(xiàn)已開源，并計(jì)劃逐步集成到 Lightricks 旗下的創(chuàng)意應(yīng)用平臺(tái)，比如面向故事創(chuàng)作的 LTX Studio。這一系列動(dòng)作，不僅是技術(shù)上的迭代，更是 Lightricks 試圖在 AI 視頻生成這個(gè)新興賽道上，通過技術(shù)突破、開源策略和獨(dú)特的商業(yè)模式，重塑硬件邊界，構(gòu)建自身生態(tài)的關(guān)鍵棋步。

AI大模型視頻生成Lightricks

分享至

0贊

好文章，需要你的鼓勵(lì)

于佳卉

Erin

搜羅全網(wǎng)最新科技事件，做有態(tài)度的評(píng)論欄目。

推薦文章

音頻生成
大語言模型
多模態(tài)AI

2025-09-10 09:47

如何讓AI像電影配樂師一樣創(chuàng)作完整的長篇音頻故事——騰訊ARC實(shí)驗(yàn)室團(tuán)隊(duì)AudioStory突破性進(jìn)展

騰訊ARC實(shí)驗(yàn)室推出AudioStory系統(tǒng)，首次實(shí)現(xiàn)AI根據(jù)復(fù)雜指令創(chuàng)作完整長篇音頻故事。該系統(tǒng)結(jié)合大語言模型的敘事推理能力與音頻生成技術(shù)，通過交錯(cuò)式推理生成、解耦橋接機(jī)制和漸進(jìn)式訓(xùn)練，能夠?qū)?fù)雜指令分解為連續(xù)音頻場(chǎng)景并保持整體連貫性。在AudioStory-10K基準(zhǔn)測(cè)試中表現(xiàn)優(yōu)異，為AI音頻創(chuàng)作開辟新方向。
視頻生成
深度學(xué)習(xí)
多模態(tài)學(xué)習(xí)

2025-09-09 13:57

Meta與特拉維夫大學(xué)聯(lián)手打造VideoJAM：讓AI生成的視頻動(dòng)起來不再是奢望

Meta與特拉維夫大學(xué)聯(lián)合研發(fā)的VideoJAM技術(shù)，通過讓AI同時(shí)學(xué)習(xí)外觀和運(yùn)動(dòng)信息，顯著解決了當(dāng)前視頻生成模型中動(dòng)作不連貫、違反物理定律的核心問題。該技術(shù)僅需添加兩個(gè)線性層就能大幅提升運(yùn)動(dòng)質(zhì)量，在多項(xiàng)測(cè)試中超越包括Sora在內(nèi)的商業(yè)模型，為AI視頻生成的實(shí)用化應(yīng)用奠定了重要基礎(chǔ)。
多模態(tài)AI
人類價(jià)值觀對(duì)齊
數(shù)據(jù)集構(gòu)建

2025-09-09 13:56

上海AI實(shí)驗(yàn)室重磅發(fā)布：讓AI看圖"說人話"的神奇訓(xùn)練法，解決多模態(tài)AI與人類價(jià)值觀對(duì)齊難題

上海AI實(shí)驗(yàn)室發(fā)布OmniAlign-V研究，首次系統(tǒng)性解決多模態(tài)大語言模型人性化對(duì)話問題。該研究創(chuàng)建了包含20萬高質(zhì)量樣本的訓(xùn)練數(shù)據(jù)集和MM-AlignBench評(píng)測(cè)基準(zhǔn)，通過創(chuàng)新的數(shù)據(jù)生成和質(zhì)量管控方法，讓AI在保持技術(shù)能力的同時(shí)顯著提升人性化交互水平，為AI價(jià)值觀對(duì)齊提供了可行技術(shù)路徑。
人工智能
圖神經(jīng)網(wǎng)絡(luò)
天氣預(yù)報(bào)

2025-09-09 10:56

谷歌研究團(tuán)隊(duì)發(fā)布超級(jí)預(yù)測(cè)模型：讓AI像天氣預(yù)報(bào)員一樣預(yù)測(cè)全球大氣變化

谷歌DeepMind團(tuán)隊(duì)開發(fā)的GraphCast是一個(gè)革命性的AI天氣預(yù)測(cè)模型，能夠在不到一分鐘內(nèi)完成10天全球天氣預(yù)報(bào)，準(zhǔn)確性超越傳統(tǒng)方法90%的指標(biāo)。該模型采用圖神經(jīng)網(wǎng)絡(luò)技術(shù)，通過學(xué)習(xí)40年歷史數(shù)據(jù)掌握天氣變化規(guī)律，在極端天氣預(yù)測(cè)方面表現(xiàn)卓越，能耗僅為傳統(tǒng)方法的千分之一，為氣象學(xué)領(lǐng)域帶來了效率和精度的雙重突破。

如何讓AI像電影配樂師一樣創(chuàng)作完整的長篇音頻故事——騰訊ARC實(shí)驗(yàn)室團(tuán)隊(duì)AudioStory突破性進(jìn)展

如何讓AI像電影配樂師一樣創(chuàng)作完整的長篇音頻故事——騰訊ARC實(shí)驗(yàn)室團(tuán)隊(duì)AudioStory突破性進(jìn)展

2025-09-10 09:47

Meta與特拉維夫大學(xué)聯(lián)手打造VideoJAM：讓AI生成的視頻動(dòng)起來不再是奢望

Meta與特拉維夫大學(xué)聯(lián)手打造VideoJAM：讓AI生成的視頻動(dòng)起來不再是奢望

2025-09-09 13:57

上海AI實(shí)驗(yàn)室重磅發(fā)布：讓AI看圖"說人話"的神奇訓(xùn)練法，解決多模態(tài)AI與人類價(jià)值觀對(duì)齊難題

上海AI實(shí)驗(yàn)室重磅發(fā)布：讓AI看圖"說人話"的神奇訓(xùn)練法，解決多模態(tài)AI與人類價(jià)值觀對(duì)齊難題

2025-09-09 13:56

谷歌研究團(tuán)隊(duì)發(fā)布超級(jí)預(yù)測(cè)模型：讓AI像天氣預(yù)報(bào)員一樣預(yù)測(cè)全球大氣變化

谷歌研究團(tuán)隊(duì)發(fā)布超級(jí)預(yù)測(cè)模型：讓AI像天氣預(yù)報(bào)員一樣預(yù)測(cè)全球大氣變化

2025-09-09 10:56

----..---.-...-/--...-.-......./-...-....-..--../-............-.- ----..---.-...-/--...-.-......./-...-....-..--../-............-.- ----..---.-...-/--...-.-......./-...-....-..--../-............-.- ----..---.-...-/--...-.-......./-...-....-..--../-............-.-

友情鏈接

至頂網(wǎng)
管理現(xiàn)代化
和訊IT
TechWeb
第三媒體
速途網(wǎng)
51CTO傳媒
投資界
科技訊
智者新時(shí)代

京ICP證15039648號(hào) 京ICP備15039648號(hào)-9 京公網(wǎng)安備 11010802021500號(hào)

北京第二十六維信息技術(shù)有限公司（至頂網(wǎng)）版權(quán)所有。 | 聯(lián)絡(luò)我們

舉報(bào)電話：010-62641205　涉未成年人舉報(bào)專線：010-62641208 舉報(bào)郵箱: jubao@zhiding.cn 　網(wǎng)上有害信息舉報(bào)專區(qū)：https://www.12377.cn

<cite id="vo11b"></cite>

<cite id="vo11b"><rp id="vo11b"><form id="vo11b"></form></rp></cite>

<sub id="vo11b"></sub>