欧美videosvideo喷水,欧美成ee人免费视频,亚洲欧洲日本综合aⅴ在线,国产精品美女久久久久久福利,国产成人午夜福利高清在线观看

DeepSeek、阿里接連打出王炸,AI行業(yè)徹底變天了

李迎
2025-03-03 10:08

敢開源才是真的OpenAI!

一、阿里云開源最強視頻大模型

本周,AI領域的開源風暴正在愈演愈烈,很快也許就會席卷到我們每一個人。

2月24日周一,DeepSeek宣布啟動“開源周”,計劃連續(xù)在五天內每天開源一個重磅項目。

在此背景下,阿里云悄然發(fā)力,就在昨夜突然宣布開源自家最強視頻大模型——萬相2.1(Wan)

圖片

圖源:阿里云技術人員開源當晚直播

作為開源老兵,阿里云再次通過開源的方式展現(xiàn)自己的無私以及對自家大模型技術實力的自信。

在AI技術飛速發(fā)展的當下,開源已經(jīng)成為推動技術進步和生態(tài)建設的重要力量。

此次阿里開源萬相2.1,采用的是Apache 2.0協(xié)議,該協(xié)議為全球開發(fā)者提供了極大的自由度,無論是商業(yè)應用還是學術研究,都能在合規(guī)的前提下自由使用該模型。

而對開源的萬相2.1本身而言,其不僅支持文生視頻圖生視頻任務,還提供了14B1.3B兩個參數(shù)規(guī)格的全部推理代碼和權重。

這意味著無論是追求極致效果的專業(yè)人士,還是希望快速部署的普通用戶,都能找到適合自己的解決方案。

目前,全球開發(fā)者已經(jīng)可以在GitHub(https://github.com/Wan-Video/Wan2.1)、HuggingFace(https://huggingface.co/spaces/Wan-AI/Wan2.1)和魔搭社區(qū)(https://modelscope.cn/studios/Wan-AI/Wan-2.1)上下載體驗這一模型。

所以,號稱阿里云最強的萬相2.1到底強大在哪?

首先,從數(shù)據(jù)來看,14B版本的萬相2.1在指令遵循、復雜運動生成、物理建模文字視頻生成等方面表現(xiàn)都十分出色。

在權威評測集VBench中,以總分86.22%的成績大幅超越Sora、Luma、Pika等國內外知名模型,系該領域的佼佼者。

圖片

圖源:鞭牛士

而1.3B版本則在性能效率之間找到了完美的平衡,不僅超過了更大尺寸的開源模型,甚至與一些閉源模型的表現(xiàn)不相上下。

更令咱們普通人感到驚喜的是,萬相2.1對設備兼容十分友好,支持消費級GPU。

據(jù)了解,13億參數(shù)模型僅需8.2GB顯存就能生成480P視頻,可兼容幾乎所有消費級GPU。

這意味著普通用戶也能在消費級顯卡上輕松運行該模型,極大地降低了使用門檻。

據(jù)媒體評測,該模型在RTX 4090顯卡上生成5秒480P視頻(未使用量化等優(yōu)化技術)大約需要4分鐘。

此外,萬相2.1同時支持文生視頻、圖生視頻視頻編輯、文生圖、視頻生音頻視覺文本生成

并且,萬相2.1還是首個能夠生成中英文文本的視頻模型,無需外部插件就能在視頻中生成想要的文字。

圖片

圖源:阿里云官方演示

多家媒體對萬相2.1及其生成視頻能力給予了高度評價:萬相2.1不僅能夠生成高質量的視頻,還能在視頻中融入復雜的運動和物理效果。

例如,在官方公開的一個Demo,墨水在紅色宣紙上暈染開來,最終形成一個“?!弊?,筆畫邊緣自然模糊,東方韻味十足。

圖片

圖源:阿里云官方演示

昨天,阿里旗下的AIGC通義千問也發(fā)布了全新的“Thinking (QwQ)”深度思考模型,支持深度思考和聯(lián)網(wǎng)搜索。

據(jù)悉,該模型基于QWEN2.5-MAX,而官方版QWQ-MAX即將發(fā)布,并將同樣采用Apache 2.0許可協(xié)議開源。

由此可見,即使DeepSeek的爆火給整個行業(yè)帶來了不小的壓力,阿里云仍然擁有著更進一步的信心和膽量。

萬相2.1等模型的開源,將為開發(fā)者帶來更多的可能性,也為AI視頻生成領域的發(fā)展注入新的活力。

二、DeepSeek震撼全網(wǎng)的開源周

當阿里云以開源的姿態(tài)向世界展示其強大的視頻生成大模型萬相2.1時,全球的目光也聚焦在了另一股開源力量——DeepSeek。

如果說阿里云的開源是一場技術盛宴,那么DeepSeek的開源周則如同一顆震撼彈,直接在國際舞臺上掀起了滔天巨浪。

與阿里云的堅定開源不同,DeepSeek開源周的種種項目,讓外網(wǎng)的多方人士感到震撼,仿佛一夜之間,屬于真正“OpenAI”的格局被徹底改寫。

今天已經(jīng)是DeepSeek的開源周的第三天,在此之前,DeepSeek已經(jīng)公開了2個令人矚目的技術成果。

第一天,DeepSeek開源了FlashMLA代碼庫,這是針對Hopper GPU優(yōu)化的高效MLA解碼內核,專為處理可變長度序列而設計。

傳統(tǒng)解碼方法在處理不同長度的序列時,常常會導致GPU的并行計算能力被浪費,而FlashMLA通過動態(tài)調度和內存優(yōu)化,讓Hopper GPU的算力被“榨干”,吞吐量顯著提升。

圖片

圖源:X平臺

簡單來說,FlashMLA可以讓大模型在專業(yè)GPU上跑得更快、效率更高,尤其適用于高性能AI任務。

這意味著企業(yè)可以用更少的GPU服務器完成同樣的任務,直接降低了推理成本。

對于開發(fā)者來說,F(xiàn)lashMLA的開源不僅打破了算力壟斷,更降低了技術門檻,讓他們能夠免費獲得“工業(yè)級優(yōu)化方案”,推動更多創(chuàng)新應用的誕生。

第一天,DeepSeek開源了DeepEP通信庫,這是首個用于MoE模型訓練和推理的開源EP通信庫。

它支持高效的全員溝通,無論是節(jié)點內還是節(jié)點間,都支持NVLink和RDMA,確保數(shù)據(jù)傳輸?shù)母咝浴?/span>

同時,DeepEP還具備訓練及推理預填充階段的高吞吐量計算核心,以及推理解碼階段的低延遲計算核心。

這些特性使得DeepEP能夠輕松應對大規(guī)模MoE模型的訓練和推理任務,極大地提升了模型的性能和效率。

此外,DeepEP還原生支持FP8數(shù)據(jù)分發(fā),靈活控制GPU資源,實現(xiàn)計算與通信的高效重疊。

據(jù)了解,DeepEP在開源后迅速獲得了全球開發(fā)者的關注和認可,其GitHub上的Star量在3小時內就突破了1000。

圖片

圖源:GitHub

到了今日(第三天),DeepSeek再次祭出了殺手锏——DeepGEMM

這是DeepSeek能夠訓練出V3/R1的核心動力所在,能在大規(guī)模模型訓練和推理中,顯著提升計算效率,特別適用于需要高效計算資源的場景。

并且,DeepGEMM的核心邏輯僅約300行代碼,卻實現(xiàn)了高達1350+FP8 TFLOPS的性能,這一性能表現(xiàn)徹底折服了不少老外。

可以說,DeepGEMM開源項目的出現(xiàn),讓更多開發(fā)者能夠體會到“超級計算機”一般的高效計算,推動了深度學習領域的技術進步。

這一波接一波的沖擊,讓外網(wǎng)直接將DeepSeek譽為“真正的OpenAI”,人們感慨于DeepSeek的技術實力和慷慨大方。

三、“開源”值得更多感謝

那么,有的朋友可能會問,我知道開源很偉大,知道做出這些的企業(yè)很無私,但他們的開源,究竟與我們普通人有什么關系?

事實上,開源的意義遠不止于技術層面的突破。

開源的最大意義在于它可以推動企業(yè)打破了技術的高墻,讓普通人也能享受到AI帶來的種種好處。

正如當下無論是大型企業(yè)還是小型創(chuàng)業(yè)公司,都在積極接入DeepSeek等開源模型,將其融入到工作和生活的方方面面。

智能客服創(chuàng)意設計,從醫(yī)療影像分析教育輔助工具,AI正在以前所未有的速度滲透到每一個角落。

而且開源的意義不僅限于此。

現(xiàn)如今,在全球范圍內,AI行業(yè)正迎來一場前所未有的“軍備競賽”。

這場競賽不僅囊括了像阿里云、DeepSeek這樣的開源先鋒,也包括像OpenAI和Meta這樣的國際巨頭。

前段時間,OpenAI宣布部分模型免費開放。

緊接著,Anthropic也在近日對其大模型進行了升級換代,推出了號稱“迄今為止最聰明”的Claude 3.7 Sonnet,僅部分功能不支持免費使用。

這些變化正是開源在與閉源的較量勝出,推動了整個行業(yè)加速前進。

這種“開源福利”不僅在國內引發(fā)了熱潮,更輻射到了全球。

DeepSeek的開源周和阿里云的開源行動,不僅為國內開發(fā)者提供了寶貴的技術資源,也讓全球AI行業(yè)看到了開源的力量。

如今,開源模型不僅在性能上不遜色于閉源模型,更在靈活性和可擴展性上展現(xiàn)出獨特的優(yōu)勢。

開源的力量正在全球范圍內匯聚,形成一股不可阻擋的潮流。

只能說,僅通過這半個月以來AI行業(yè)的各種變化來看,誰還能再云淡風輕地說出那句“開源模型會越來越落后”。

開源,正在以一種前所未有的速度改變世界。

1、該內容為作者獨立觀點,不代表電商派觀點或立場,文章為作者本人上傳,版權歸原作者所有,未經(jīng)允許不得轉載。
2、電商號平臺僅提供信息存儲服務,如發(fā)現(xiàn)文章、圖片等侵權行為,侵權責任由作者本人承擔。
3、如對本稿件有異議或投訴,請聯(lián)系:info@dsb.cn
相關閱讀
2月8日消息,有市場消息近日稱阿里擬10億美元投資DeepSeek,阿里巴巴集團副總裁顏喬2月7日在朋友圈對此表示:“同為中國杭州企業(yè),我們?yōu)?em>DeepSeek鼓掌,但是外界流傳阿里投資DeepSeek的信息是假消息?!?/div>
Accio接入DeepSeek等先進推理模型后,正式上線深度研究、商業(yè)探索等功能。
3月26日消息,阿里通義千問與DeepSeek均于昨日低調開源了兩款新模型。阿里發(fā)布了更適合本地部署的高性能“多模態(tài)模型”Qwen2.5-VL-32B,DeepSeek則將此前熱門的“基座模型”V3更新到0324版本,并官宣在魔搭社區(qū)上架開源。截至目前,魔搭社區(qū)模型總數(shù)已超4萬個,已成為中國最大的AI開源社區(qū)。
3月4日消息,阿里巴巴達摩院資深技術專家李春強在訪談時表示,DeepSeek模型的火爆為RISC-V架構帶來了新的發(fā)展機遇?!?em>DeepSeek通過MOE技術大幅降低了激活參數(shù)比,使得模型在同等效果下所需算力顯著減少,這一變化為芯片設計提供了新的平衡點?!崩畲簭娬f道。DeepSeek打破了大模型對高算力的路徑依賴,推動大模型從云端加速向終端遷移,為一度低迷的CPU市場帶來了新的機遇。
2月13日消息,今年春節(jié)期間,不僅阿里國際站AI外貿產(chǎn)品幫商家接到了2000萬美元的中東大單,同時其已接入DeepSeek等先進大模型,將全面應用于外貿生意的各個核心環(huán)節(jié)。接入后,AI在自動接待海外客戶時,將能更全面地考慮買家詢問的意圖,然后結合阿里國際站上的市場洞察、外貿經(jīng)驗、商家商品的自身情況進行深度推理。此外,阿里國際站還在測試通義千問Qwen 2.5-Max模型,為商家提供服務。
阿里云百煉全面上線DeepSeek-V3、DeepSeek-R1等6款模型,即日起所有用戶可直接使用。
2月25日消息,阿里財報發(fā)布后,阿里系第一個論壇將于2月28日召開,由阿里達摩院主辦,主題為2025玄鐵RISC-V生態(tài)大會。官方議程顯示,達摩院首席科學家將做《從Deepseek創(chuàng)新看RISC-V的機遇》的主題演講,還將發(fā)布玄鐵RISC-V群“芯”。昨日上午,阿里巴巴集團CEO吳泳銘宣布,"未來三年阿里將投入超過3800億元,用于建設云和AI硬件基礎設施,總額超過去十年總和"。
2月4日消息,阿里云日前宣布,阿里云PAI Model Gallery支持云上一鍵部署DeepSeek-V3、DeepSeek-R1。在該平臺上,用戶可以零代碼實現(xiàn)從訓練到部署再到推理的全過程,簡化模型開發(fā)流程,為開發(fā)者和企業(yè)用戶帶來了更快、更高效、更便捷的AI開發(fā)和應用體驗。
李迎
你好,我是李迎