DeepSeek、阿里接連打出王炸，AI行業(yè)徹底變天了

李迎

2025-03-03 10:08

敢開源才是真的OpenAI！

一、阿里云開源最強視頻大模型

本周，AI領域的開源風暴正在愈演愈烈，很快也許就會席卷到我們每一個人。

2月24日周一，DeepSeek宣布啟動“開源周”，計劃連續(xù)在五天內每天開源一個重磅項目。

在此背景下，阿里云悄然發(fā)力，就在昨夜突然宣布開源自家最強視頻大模型——萬相2.1（Wan）。

圖源：阿里云技術人員開源當晚直播

作為開源老兵，阿里云再次通過開源的方式展現(xiàn)自己的無私以及對自家大模型技術實力的自信。

在AI技術飛速發(fā)展的當下，開源已經(jīng)成為推動技術進步和生態(tài)建設的重要力量。

此次阿里開源萬相2.1，采用的是Apache 2.0協(xié)議，該協(xié)議為全球開發(fā)者提供了極大的自由度，無論是商業(yè)應用還是學術研究，都能在合規(guī)的前提下自由使用該模型。

而對開源的萬相2.1本身而言，其不僅支持文生視頻和圖生視頻任務，還提供了14B和1.3B兩個參數(shù)規(guī)格的全部推理代碼和權重。

這意味著無論是追求極致效果的專業(yè)人士，還是希望快速部署的普通用戶，都能找到適合自己的解決方案。

目前，全球開發(fā)者已經(jīng)可以在GitHub（https://github.com/Wan-Video/Wan2.1）、HuggingFace（https://huggingface.co/spaces/Wan-AI/Wan2.1）和魔搭社區(qū)（https://modelscope.cn/studios/Wan-AI/Wan-2.1）上下載體驗這一模型。

所以，號稱阿里云最強的萬相2.1到底強大在哪？

首先，從數(shù)據(jù)來看，14B版本的萬相2.1在指令遵循、復雜運動生成、物理建模和文字視頻生成等方面表現(xiàn)都十分出色。

在權威評測集VBench中，以總分86.22%的成績大幅超越Sora、Luma、Pika等國內外知名模型，系該領域的佼佼者。

圖源：鞭牛士

而1.3B版本則在性能和效率之間找到了完美的平衡，不僅超過了更大尺寸的開源模型，甚至與一些閉源模型的表現(xiàn)不相上下。

更令咱們普通人感到驚喜的是，萬相2.1對設備兼容十分友好，支持消費級GPU。

據(jù)了解，13億參數(shù)模型僅需8.2GB顯存就能生成480P視頻，可兼容幾乎所有消費級GPU。

這意味著普通用戶也能在消費級顯卡上輕松運行該模型，極大地降低了使用門檻。

據(jù)媒體評測，該模型在RTX 4090顯卡上生成5秒480P視頻（未使用量化等優(yōu)化技術）大約需要4分鐘。

此外，萬相2.1同時支持文生視頻、圖生視頻、視頻編輯、文生圖、視頻生音頻和視覺文本生成。

并且，萬相2.1還是首個能夠生成中英文文本的視頻模型，無需外部插件就能在視頻中生成想要的文字。

圖源：阿里云官方演示

多家媒體對萬相2.1及其生成視頻能力給予了高度評價：萬相2.1不僅能夠生成高質量的視頻，還能在視頻中融入復雜的運動和物理效果。

例如，在官方公開的一個Demo，墨水在紅色宣紙上暈染開來，最終形成一個“?！弊?，筆畫邊緣自然模糊，東方韻味十足。

圖源：阿里云官方演示

昨天，阿里旗下的AIGC通義千問也發(fā)布了全新的“Thinking (QwQ)”深度思考模型，支持深度思考和聯(lián)網(wǎng)搜索。

據(jù)悉，該模型基于QWEN2.5-MAX，而官方版QWQ-MAX即將發(fā)布，并將同樣采用Apache 2.0許可協(xié)議開源。

由此可見，即使DeepSeek的爆火給整個行業(yè)帶來了不小的壓力，阿里云仍然擁有著更進一步的信心和膽量。

萬相2.1等模型的開源，將為開發(fā)者帶來更多的可能性，也為AI視頻生成領域的發(fā)展注入新的活力。

二、DeepSeek震撼全網(wǎng)的開源周

當阿里云以開源的姿態(tài)向世界展示其強大的視頻生成大模型萬相2.1時，全球的目光也聚焦在了另一股開源力量——DeepSeek。

如果說阿里云的開源是一場技術盛宴，那么DeepSeek的開源周則如同一顆震撼彈，直接在國際舞臺上掀起了滔天巨浪。

與阿里云的堅定開源不同，DeepSeek開源周的種種項目，讓外網(wǎng)的多方人士感到震撼，仿佛一夜之間，屬于真正“OpenAI”的格局被徹底改寫。

今天已經(jīng)是DeepSeek的開源周的第三天，在此之前，DeepSeek已經(jīng)公開了2個令人矚目的技術成果。

第一天，DeepSeek開源了FlashMLA代碼庫，這是針對Hopper GPU優(yōu)化的高效MLA解碼內核，專為處理可變長度序列而設計。

傳統(tǒng)解碼方法在處理不同長度的序列時，常常會導致GPU的并行計算能力被浪費，而FlashMLA通過動態(tài)調度和內存優(yōu)化，讓Hopper GPU的算力被“榨干”，吞吐量顯著提升。

圖源：X平臺

簡單來說，FlashMLA可以讓大模型在專業(yè)GPU上跑得更快、效率更高，尤其適用于高性能AI任務。

這意味著企業(yè)可以用更少的GPU服務器完成同樣的任務，直接降低了推理成本。

對于開發(fā)者來說，F(xiàn)lashMLA的開源不僅打破了算力壟斷，更降低了技術門檻，讓他們能夠免費獲得“工業(yè)級優(yōu)化方案”，推動更多創(chuàng)新應用的誕生。

第一天，DeepSeek開源了DeepEP通信庫，這是首個用于MoE模型訓練和推理的開源EP通信庫。

它支持高效的全員溝通，無論是節(jié)點內還是節(jié)點間，都支持NVLink和RDMA，確保數(shù)據(jù)傳輸?shù)母咝浴?/span>

同時，DeepEP還具備訓練及推理預填充階段的高吞吐量計算核心，以及推理解碼階段的低延遲計算核心。

這些特性使得DeepEP能夠輕松應對大規(guī)模MoE模型的訓練和推理任務，極大地提升了模型的性能和效率。

此外，DeepEP還原生支持FP8數(shù)據(jù)分發(fā)，靈活控制GPU資源，實現(xiàn)計算與通信的高效重疊。

據(jù)了解，DeepEP在開源后迅速獲得了全球開發(fā)者的關注和認可，其GitHub上的Star量在3小時內就突破了1000。

圖源：GitHub

到了今日（第三天），DeepSeek再次祭出了殺手锏——DeepGEMM。

這是DeepSeek能夠訓練出V3/R1的核心動力所在，能在大規(guī)模模型訓練和推理中，顯著提升計算效率，特別適用于需要高效計算資源的場景。

并且，DeepGEMM的核心邏輯僅約300行代碼，卻實現(xiàn)了高達1350+FP8 TFLOPS的性能，這一性能表現(xiàn)徹底折服了不少老外。

可以說，DeepGEMM開源項目的出現(xiàn)，讓更多開發(fā)者能夠體會到“超級計算機”一般的高效計算，推動了深度學習領域的技術進步。

這一波接一波的沖擊，讓外網(wǎng)直接將DeepSeek譽為“真正的OpenAI”，人們感慨于DeepSeek的技術實力和慷慨大方。

三、“開源”值得更多感謝

那么，有的朋友可能會問，我知道開源很偉大，知道做出這些的企業(yè)很無私，但他們的開源，究竟與我們普通人有什么關系？

事實上，開源的意義遠不止于技術層面的突破。

開源的最大意義在于它可以推動企業(yè)打破了技術的高墻，讓普通人也能享受到AI帶來的種種好處。

正如當下無論是大型企業(yè)還是小型創(chuàng)業(yè)公司，都在積極接入DeepSeek等開源模型，將其融入到工作和生活的方方面面。

從智能客服到創(chuàng)意設計，從醫(yī)療影像分析到教育輔助工具，AI正在以前所未有的速度滲透到每一個角落。

而且開源的意義不僅限于此。

現(xiàn)如今，在全球范圍內，AI行業(yè)正迎來一場前所未有的“軍備競賽”。

這場競賽不僅囊括了像阿里云、DeepSeek這樣的開源先鋒，也包括像OpenAI和Meta這樣的國際巨頭。

前段時間，OpenAI宣布部分模型免費開放。

緊接著，Anthropic也在近日對其大模型進行了升級換代，推出了號稱“迄今為止最聰明”的Claude 3.7 Sonnet，僅部分功能不支持免費使用。

這些變化正是開源在與閉源的較量勝出，推動了整個行業(yè)加速前進。

這種“開源福利”不僅在國內引發(fā)了熱潮，更輻射到了全球。

DeepSeek的開源周和阿里云的開源行動，不僅為國內開發(fā)者提供了寶貴的技術資源，也讓全球AI行業(yè)看到了開源的力量。

如今，開源模型不僅在性能上不遜色于閉源模型，更在靈活性和可擴展性上展現(xiàn)出獨特的優(yōu)勢。

開源的力量正在全球范圍內匯聚，形成一股不可阻擋的潮流。

只能說，僅通過這半個月以來AI行業(yè)的各種變化來看，誰還能再云淡風輕地說出那句“開源模型會越來越落后”。

開源，正在以一種前所未有的速度改變世界。

阿里 DeepSeek

聲明

1、該內容為作者獨立觀點，不代表電商派觀點或立場，文章為作者本人上傳，版權歸原作者所有，未經(jīng)允許不得轉載。
2、電商號平臺僅提供信息存儲服務，如發(fā)現(xiàn)文章、圖片等侵權行為，侵權責任由作者本人承擔。
3、如對本稿件有異議或投訴，請聯(lián)系：info@dsb.cn

相關閱讀

阿里否認投資DeepSeek傳聞

2025-02-08 09:10:04

2月8日消息，有市場消息近日稱阿里擬10億美元投資DeepSeek，阿里巴巴集團副總裁顏喬2月7日在朋友圈對此表示：“同為中國杭州企業(yè)，我們?yōu)?em>DeepSeek鼓掌，但是外界流傳阿里投資DeepSeek的信息是假消息?！?/div>

阿里國際站AI搜索引擎Accio接入DeepSeek

2025-02-28 16:41:34

Accio接入DeepSeek等先進推理模型后，正式上線深度研究、商業(yè)探索等功能。

阿里通義千問與DeepSeek開源兩款新模型

2025-03-26 11:16:10

3月26日消息，阿里通義千問與DeepSeek均于昨日低調開源了兩款新模型。阿里發(fā)布了更適合本地部署的高性能“多模態(tài)模型”Qwen2.5-VL-32B，DeepSeek則將此前熱門的“基座模型”V3更新到0324版本，并官宣在魔搭社區(qū)上架開源。截至目前，魔搭社區(qū)模型總數(shù)已超4萬個，已成為中國最大的AI開源社區(qū)。

阿里達摩院李春強：DeepSeek為RISC-V架構帶來新發(fā)展機遇

2025-03-04 15:55:31

3月4日消息，阿里巴巴達摩院資深技術專家李春強在訪談時表示，DeepSeek模型的火爆為RISC-V架構帶來了新的發(fā)展機遇?！?em>DeepSeek通過MOE技術大幅降低了激活參數(shù)比，使得模型在同等效果下所需算力顯著減少，這一變化為芯片設計提供了新的平衡點?！崩畲簭娬f道。DeepSeek打破了大模型對高算力的路徑依賴，推動大模型從云端加速向終端遷移，為一度低迷的CPU市場帶來了新的機遇。

阿里國際站AI接入DeepSeek等先進模型

2025-02-13 09:19:50

2月13日消息，今年春節(jié)期間，不僅阿里國際站AI外貿產(chǎn)品幫商家接到了2000萬美元的中東大單，同時其已接入DeepSeek等先進大模型，將全面應用于外貿生意的各個核心環(huán)節(jié)。接入后，AI在自動接待海外客戶時，將能更全面地考慮買家詢問的意圖，然后結合阿里國際站上的市場洞察、外貿經(jīng)驗、商家商品的自身情況進行深度推理。此外，阿里國際站還在測試通義千問Qwen 2.5-Max模型，為商家提供服務。

阿里云百煉上線DeepSeek全尺寸模型

2025-02-09 16:16:50

阿里云百煉全面上線DeepSeek-V3、DeepSeek-R1等6款模型，即日起所有用戶可直接使用。

阿里系首個年度大會將召開與DeepSeek有關

2025-02-25 10:41:58

2月25日消息，阿里財報發(fā)布后，阿里系第一個論壇將于2月28日召開，由阿里達摩院主辦，主題為2025玄鐵RISC-V生態(tài)大會。官方議程顯示，達摩院首席科學家將做《從Deepseek創(chuàng)新看RISC-V的機遇》的主題演講，還將發(fā)布玄鐵RISC-V群“芯”。昨日上午，阿里巴巴集團CEO吳泳銘宣布，"未來三年阿里將投入超過3800億元，用于建設云和AI硬件基礎設施，總額超過去十年總和"。

阿里云：支持云上一鍵部署DeepSeek-V3/R1

2025-02-04 09:18:54

2月4日消息，阿里云日前宣布，阿里云PAI Model Gallery支持云上一鍵部署DeepSeek-V3、DeepSeek-R1。在該平臺上，用戶可以零代碼實現(xiàn)從訓練到部署再到推理的全過程，簡化模型開發(fā)流程，為開發(fā)者和企業(yè)用戶帶來了更快、更高效、更便捷的AI開發(fā)和應用體驗。

李迎

你好，我是李迎

欧美videosvideo喷水,欧美成ee人免费视频,亚洲欧洲日本综合aⅴ在线,国产精品美女久久久久久福利,国产成人午夜福利高清在线观看

DeepSeek、阿里接連打出王炸，AI行業(yè)徹底變天了

DeepSeek、阿里接連打出王炸，AI行業(yè)徹底變天了