av天堂久久天堂色综合,最近中文字幕mv免费高清在线,在线a级毛片免费视频,av动漫,中文字幕精品亚洲无线码一区

微信掃一掃，關注公眾號

科技行者
算力行者

見證連接與計算的「力量」

為什么昇騰是DeepSeek的“最優(yōu)解”？

DeepSeek昇騰算力

為什么昇騰是DeepSeek的“最優(yōu)解”？

作者：金旺

2025-02-14 17:42

分享至：

DeepSeek模型發(fā)布即原生支持昇騰。

----..---.-...-/--...-.-......./-...-....-..--../-............-.- ----..---.-...-/--...-.-......./-...-....-..--../-............-.- ----..---.-...-/--...-.-......./-...-....-..--../-............-.- ----..---.-...-/--...-.-......./-...-....-..--../-............-.-

2025-02-14 17:42 ? 金旺

為什么昇騰是DeepSeek的“最優(yōu)解”？

作者 | 金旺

來源 | 科技行者

2月13日，OpenAI CEO Sam Altman公開表示，“GPT-5將會在未來幾個月發(fā)布，并將對公眾開放免費使用。”

直接跳過OpenAI o3，迎來免費版GPT-5，這與最近一段時間DeepSeek火爆全球不無關系。

作為全球大模型領域主導者，OpenAI不能失去自己的鐵王座，DeepSeek V3/R1在過去兩個月里為全球人工智能產業(yè)帶來的沖擊，讓這一領域的頭部玩家們不得不重新思考人工智能的創(chuàng)新節(jié)奏。

就在本周，百度創(chuàng)始人李彥宏在World Governments Summit 2025峰會上也談到，“每12個月，大模型的推理成本就會降低90%以上，這比以往計算機革命都要快很多。”

那么，DeepSeek究竟為人工智能產業(yè)帶來了怎樣的變化？它又需要怎樣的算力底座？

01 DeepSeek的鯰魚效應

2024年12月26日，國內一家成立僅一年多的AI團隊發(fā)布了一個名為DeepSeek V3的模型，這個模型是在14.8萬億高質量token上進行預訓練，并通過監(jiān)督微調和強化學習進一步提高了模型的性能。

相較于五個月前發(fā)布的上一版本模型，這次他們采用了多頭潛在注意力 (MLA)和MoE架構，并引入了無輔助損失的負載均衡策略和多token預測訓練目標，這樣的好處是能夠實現(xiàn)高效推理和低成本訓練。

僅僅是在一個月后，這個團隊又發(fā)布了一個新模型，DeepSeek R1。

這次，他們僅用相當于OpenAI o1三十分之一的成本卻實現(xiàn)了比肩OpenAI o1的性能，尤其DeepSeek R1還以開源形式公開了它的思維鏈，這讓DeepSeek迅速火爆全球。

在這之后，我們看到，全球人工智能領域在短短一個月內經過了多次思想上的碰撞，推動了全球人工智能產業(yè)鏈的變革。

為什么昇騰是DeepSeek的“最優(yōu)解”？

這場變革主要體現(xiàn)在三個方面：

第一，加速基座大模型創(chuàng)新。

此前，基座大模型的市場已經開始向幾家頭部AI玩家聚集，DeepSeek R1的出現(xiàn)，就像一條鯰魚，加快了基座大模型的競爭和創(chuàng)新速度。

我們不僅能看到OpenAI官方將在未來幾個月里推出免費版本的GPT-5，還看到了近期頭部AI玩家紛紛發(fā)布了性能更強的基座大模型，例如阿里發(fā)布了Qwen 2.5-Max，谷歌也發(fā)布了Gemini 2.0系列模型。

此外，頭部AI玩家紛紛加大了技術投入以維持自己的領先優(yōu)勢。

例如，Meta創(chuàng)始人扎克伯格官宣加大2025年的AI投資，預計2025年在AI領域至少投入600-650億美元（2024年為400億美元）。

與此同時，谷歌的AI投資也將從525億美元增加到750億美元。

第二，加速應用創(chuàng)新。

在過去一個月里，我們看到國內四大云廠商接入了DeepSeek，看到國內三大運營商跑步接入了DeepSeek，與此同時，我們也看到在B端市場，越來越多企業(yè)正在加快接入DeepSeek。

為什么昇騰是DeepSeek的“最優(yōu)解”？

有數據顯示，自DeepSeek R1發(fā)布后，僅僅20天內，國內外就已經有160多家企業(yè)接入了DeepSeek。

第三，加速大模型普及。

據QuestMobile統(tǒng)計數據顯示，DeepSeek日活躍用戶數在2月1日突破了3000萬大關，刷新了全球最快達成3000萬日活用戶榜單。

另一組來自Xsignal的數據顯示，截至2月8日，DeepSeek國內APP端日活用戶數達到了3494萬，海外APP端日活用戶數達到了3685萬，全球Web端日活更是達到4800萬，全球日活用戶總量達到1.19億。

用戶數的爆炸式增長，讓DeepSeek成為繼ChatGPT后大模型在消費市場普及的又一拐點，再次加速了大模型在消費市場的普及，以及更多大模型應用的涌現(xiàn)。

如果深究這場人工智能產業(yè)變革的本質，實際上是DeepSeek通過模型結構、計算通信、后訓練和推理等方面極致的工程優(yōu)化，提升了算力利用率。

在這一過程中，DeepSeek的模型訓練效率提升了2~3倍，推理效率提升了5~7倍，與此同時，在整體訓練成本降低了60%的同時，模型性能提升了20%。

而在DeepSeek加速大模型技術創(chuàng)新和普及應用時，穩(wěn)定可靠的算力底座，依舊是模型創(chuàng)新的根本。

02 昇騰提供的“最優(yōu)解”

2月4日，DeepSeek-R1、DeepSeek-V3、DeepSeek-V2、Janus-Pro正式上線昇騰社區(qū)，支持一鍵獲取DeepSeek系列模型，支持在昇騰硬件平臺上開箱即用。

為什么昇騰是DeepSeek的“最優(yōu)解”？

作為原生支持昇騰的DeepSeek，這時在國內已經有不少企業(yè)基于昇騰完成了DeepSeek的快速上線。

實際上，早在2024年，昇騰團隊就已經在研究并行解碼技術，這與DeepSeek V3/R1特有的多頭潛在注意力機制不謀而合。

2024年12月26日，在Deepseek-V3上線并開源后，昇騰、硅基流動與DeepSeek團隊進行了多次座談，共同研討聯(lián)合創(chuàng)新的機會。

在這之后，昇騰成了業(yè)界首個適配完成DeepSeek核心算法，支持DeepSeek全系模型預訓練及微調，也是國內業(yè)界唯一一個從預訓練到微調全流程適配DeepSeek的AI訓練平臺。

相關數據顯示，目前各行業(yè)已有80+企業(yè)基于昇騰快速適配/上線了DeepSeek系列模型并在對外提供服務，此外，還有20+企業(yè)在適配測試中，預計在未來兩周內全部完成上線，總體而言，國內70%的企業(yè)基于昇騰快速上線。

為什么這么多企業(yè)會選擇基于昇騰平臺來上線DeepSeek？

我們了解到，昇騰是目前進行DeepSeek部署的“最優(yōu)解”。

就訓練能力而言，昇騰超節(jié)點支持DeepSeek全系模型預訓練及微調，支持DualPipe、跨節(jié)點All2All等DeepSeek核心優(yōu)化技術，超大帶寬通信域更適合DeepSeek的流水線并行算法及冗余專家等能力。

DeepSeek R1是強化學習RL模型，昇騰超節(jié)點是更適合DeepSeek V3/R1的解決方案。

就推理能力而言，昇騰通過并行推理優(yōu)化技術+專家負載均衡能力，助力DeepSeek模型推理吞吐性能提升30%+。

DeepSeek小專家創(chuàng)新架構，帶來的是通信耗時及專家負載不均挑戰(zhàn)，更多的小專家并行，引入極大的通信開銷，更多專家的數據負載難以均衡。

昇騰平臺通過偽EP混合并行算法，通信優(yōu)化性能提升30%+，稀疏路由稠密化算法，訪存性能提升20%+，從而降低專家不均衡度，推理吞吐性能提升20%~35%。

此外，作為一個開放的AI基礎軟硬件平臺，昇騰平臺打造了Atlas系列硬件、異構計算架構CANN、全場景AI框架昇思MindSpore、昇騰應用使能以及一站式開發(fā)平臺ModelArts等全棧產品體系，并形成了規(guī)模龐大的產業(yè)生態(tài)。

為什么昇騰是DeepSeek的“最優(yōu)解”？

據悉，截至2024年12月31日，昇騰已發(fā)展超過60硬件合作伙伴，330萬多開發(fā)者，2500多家行業(yè)合作伙伴，并共同孵化了150多個昇騰原生硬件產品，超過5800個解決方案。

面向DeepSeek掀起的這波大模型普及的技術浪潮，目前已有30+軟硬件伙伴基于昇騰推出DeepSeek一體機方案，昇騰一體機成了支持DeepSeek系列模型快速上線，支撐客戶生產系統(tǒng)的“最優(yōu)解”。

此外，據公開信息統(tǒng)計，目前昇騰正在助力20+省、25城市公共算力服務平臺啟動部署DeepSeek系列模型，全國超70%區(qū)域可獲取本地支持。

如果說ChatGPT是大模型從技術研發(fā)到產業(yè)應用的一個拐點，那么，DeepSeek可以被視為第二個拐點。

接下來，我們將會在2025年看到大模型技術競爭更加激烈，也將會看到更多大模型應用在產業(yè)，乃至消費市場中陸續(xù)落地。

DeepSeek昇騰算力

分享至

0贊

好文章，需要你的鼓勵

金旺

Wille

關注智造、硬件、機器人。

推薦文章

音頻生成
大語言模型
多模態(tài)AI

2025-09-10 09:47

如何讓AI像電影配樂師一樣創(chuàng)作完整的長篇音頻故事——騰訊ARC實驗室團隊AudioStory突破性進展

騰訊ARC實驗室推出AudioStory系統(tǒng)，首次實現(xiàn)AI根據復雜指令創(chuàng)作完整長篇音頻故事。該系統(tǒng)結合大語言模型的敘事推理能力與音頻生成技術，通過交錯式推理生成、解耦橋接機制和漸進式訓練，能夠將復雜指令分解為連續(xù)音頻場景并保持整體連貫性。在AudioStory-10K基準測試中表現(xiàn)優(yōu)異，為AI音頻創(chuàng)作開辟新方向。
視頻生成
深度學習
多模態(tài)學習

2025-09-09 13:57

Meta與特拉維夫大學聯(lián)手打造VideoJAM：讓AI生成的視頻動起來不再是奢望

Meta與特拉維夫大學聯(lián)合研發(fā)的VideoJAM技術，通過讓AI同時學習外觀和運動信息，顯著解決了當前視頻生成模型中動作不連貫、違反物理定律的核心問題。該技術僅需添加兩個線性層就能大幅提升運動質量，在多項測試中超越包括Sora在內的商業(yè)模型，為AI視頻生成的實用化應用奠定了重要基礎。
多模態(tài)AI
人類價值觀對齊
數據集構建

2025-09-09 13:56

上海AI實驗室重磅發(fā)布：讓AI看圖"說人話"的神奇訓練法，解決多模態(tài)AI與人類價值觀對齊難題

上海AI實驗室發(fā)布OmniAlign-V研究，首次系統(tǒng)性解決多模態(tài)大語言模型人性化對話問題。該研究創(chuàng)建了包含20萬高質量樣本的訓練數據集和MM-AlignBench評測基準，通過創(chuàng)新的數據生成和質量管控方法，讓AI在保持技術能力的同時顯著提升人性化交互水平，為AI價值觀對齊提供了可行技術路徑。
人工智能
圖神經網絡
天氣預報

2025-09-09 10:56

谷歌研究團隊發(fā)布超級預測模型：讓AI像天氣預報員一樣預測全球大氣變化

谷歌DeepMind團隊開發(fā)的GraphCast是一個革命性的AI天氣預測模型，能夠在不到一分鐘內完成10天全球天氣預報，準確性超越傳統(tǒng)方法90%的指標。該模型采用圖神經網絡技術，通過學習40年歷史數據掌握天氣變化規(guī)律，在極端天氣預測方面表現(xiàn)卓越，能耗僅為傳統(tǒng)方法的千分之一，為氣象學領域帶來了效率和精度的雙重突破。

如何讓AI像電影配樂師一樣創(chuàng)作完整的長篇音頻故事——騰訊ARC實驗室團隊AudioStory突破性進展

如何讓AI像電影配樂師一樣創(chuàng)作完整的長篇音頻故事——騰訊ARC實驗室團隊AudioStory突破性進展

2025-09-10 09:47

Meta與特拉維夫大學聯(lián)手打造VideoJAM：讓AI生成的視頻動起來不再是奢望

Meta與特拉維夫大學聯(lián)手打造VideoJAM：讓AI生成的視頻動起來不再是奢望

2025-09-09 13:57

上海AI實驗室重磅發(fā)布：讓AI看圖"說人話"的神奇訓練法，解決多模態(tài)AI與人類價值觀對齊難題

上海AI實驗室重磅發(fā)布：讓AI看圖"說人話"的神奇訓練法，解決多模態(tài)AI與人類價值觀對齊難題

2025-09-09 13:56

谷歌研究團隊發(fā)布超級預測模型：讓AI像天氣預報員一樣預測全球大氣變化

谷歌研究團隊發(fā)布超級預測模型：讓AI像天氣預報員一樣預測全球大氣變化

2025-09-09 10:56

金旺

主編

關注智造、硬件、機器人。
最近文章：
- 具身智能2025之問：新物種時代，人形機器人如何長大？
- 對話多點數智倪艷軍：倉儲物流先行，全面布局AI零售

----..---.-...-/--...-.-......./-...-....-..--../-............-.- ----..---.-...-/--...-.-......./-...-....-..--../-............-.- ----..---.-...-/--...-.-......./-...-....-..--../-............-.- ----..---.-...-/--...-.-......./-...-....-..--../-............-.-

友情鏈接

至頂網
管理現(xiàn)代化
和訊IT
TechWeb
第三媒體
速途網
51CTO傳媒
投資界
科技訊
智者新時代

京ICP證15039648號京ICP備15039648號-9 京公網安備 11010802021500號

北京第二十六維信息技術有限公司（至頂網）版權所有。 | 聯(lián)絡我們

舉報電話：010-62641205　涉未成年人舉報專線：010-62641208 舉報郵箱: jubao@zhiding.cn 　網上有害信息舉報專區(qū)：https://www.12377.cn