小米突然放大招，開源大模型干趴阿里、Open AI

李迎

2025-05-06 11:55

好戲才剛剛開始。

一、小米首個(gè)大模型開源

大模型領(lǐng)域，也被小米攪動(dòng)得天翻地覆。

近日，小米宣布，其首個(gè)推理大模型Xiaomi MiMo開源。

值得注意的是，其中經(jīng)強(qiáng)化學(xué)習(xí)訓(xùn)練形成的MiMo-7B-RL模型，在數(shù)學(xué)推理（AIME 24-25）和代碼競(jìng)賽（LiveCodeBench v5）公開測(cè)評(píng)集上，僅用7B參數(shù)量，得分不僅超過了OpenAI的閉源推理模型o1-mini，還打敗了對(duì)手阿里Qwen開源推理模型QwQ-32B-Preview。

圖源：微博

在相同強(qiáng)化學(xué)習(xí)訓(xùn)練數(shù)據(jù)情況下，MiMo-7B-RL在數(shù)學(xué)和代碼推理任務(wù)上均表現(xiàn)出色，分?jǐn)?shù)超過DeepSeek-R1-Distill-7B和Qwen2.5-32B。

圖源：微博

目前，MiMo-7B 已在 Hugging Face 平臺(tái)開源 4 個(gè)模型版本，分別是：

·MiMo-7B-Base：預(yù)訓(xùn)練模型

·MiMo-7B-SFT：監(jiān)督微調(diào)模型

·MiMo-7B-Base-Zero：基于MiMo-7B-Base直接強(qiáng)化學(xué)習(xí)的模型

·MiMo-7B-RL：基于MiMo-7B-SFT強(qiáng)化學(xué)習(xí)的模型

圖源：微博

同時(shí)，技術(shù)報(bào)告也同步上線 GitHub，向開發(fā)者與研究者全面開放。

圖源：微博

預(yù)訓(xùn)練階段，模型整體數(shù)據(jù)量為25T Tokens，核心是讓模型見過更多推理模式。預(yù)訓(xùn)練分為漸進(jìn)式三階段：

第一階段以常識(shí)性推理為主，主要如涉及數(shù)學(xué)應(yīng)用題、基礎(chǔ)代碼片段；

第二階段引入多步驟邏輯鏈條，如組合數(shù)學(xué)問題、動(dòng)態(tài)規(guī)劃算法，為了不影響模型通用能力，混入部分通用數(shù)據(jù)，比例為7：3。

第三階段要為了提高模型解決復(fù)雜任務(wù)的能力，聚焦于國際競(jìng)賽級(jí)難題，比如AIME 2024-2025中的奧賽題目，和創(chuàng)造性寫作數(shù)據(jù)，并將上下文長度從8192擴(kuò)展到32768。

圖源：微博

“分階爬坡”的策略有效避免了模型在早期陷入局部最優(yōu)解，同時(shí)通過逐步提升思維負(fù)荷強(qiáng)化神經(jīng)網(wǎng)絡(luò)的泛化能力。

后訓(xùn)練階段，MiMo實(shí)現(xiàn)“小參數(shù)越級(jí)挑戰(zhàn)”的關(guān)鍵。團(tuán)隊(duì)構(gòu)建高質(zhì)量強(qiáng)化學(xué)習(xí)（RL）數(shù)據(jù)集，包含13萬道經(jīng)過嚴(yán)格清洗與難度標(biāo)注的數(shù)學(xué)題和編程題。每道題目均配備基于規(guī)則的驗(yàn)證器，確保獎(jiǎng)勵(lì)信號(hào)的客觀性與可復(fù)現(xiàn)性，從而規(guī)避了傳統(tǒng)RLHF（人類反饋強(qiáng)化學(xué)習(xí)）中主觀偏好導(dǎo)致的模型偏差。

圖源：微博

框架層面的突破則體現(xiàn)在Seamless Rollout系統(tǒng)的設(shè)計(jì)上。該系統(tǒng)將策略部署、異步獎(jiǎng)勵(lì)計(jì)算與提前終止功能集成于統(tǒng)一架構(gòu)，通過動(dòng)態(tài)調(diào)度GPU資源，將強(qiáng)化學(xué)習(xí)訓(xùn)練速度提升2.29倍，驗(yàn)證效率加快1.96倍。

那么，我們來聊一聊，小米這種開放姿態(tài)，對(duì)于其本身戰(zhàn)略定位和大模型行業(yè)來說，有什么意義。

一方面，將MiMo與早前開源的Vela物聯(lián)網(wǎng)系統(tǒng)、米家智能家居協(xié)議深度綁定，小米企圖構(gòu)建的“模型-硬件-場(chǎng)景”三位一體的開放生態(tài)便會(huì)越來越清晰。

比如，基于MiMo開發(fā)的語音助手，開發(fā)者可直接接入小米智能家居設(shè)備?；蛘撸柚囕d推理引擎，無縫對(duì)接小米汽車OS系統(tǒng)。

作為一家產(chǎn)品銷量可觀的智能設(shè)備公司，小米開放了核心AI模型，意味著，或許不久的將來，更多的智能終端將被納入其技術(shù)軌道。對(duì)于友商來說，壓力確實(shí)不小。

另一方面，僅僅其以7B的參數(shù)規(guī)模，就超越了阿里32B模型和OpenAI閉源產(chǎn)品的成績，可以說，直接顛覆了行業(yè)對(duì)“參數(shù)規(guī)模決定性能”的固有認(rèn)知。

并且，此次開源，開發(fā)者無需支付高昂API費(fèi)用即可調(diào)用模型，使用門檻大大降低。當(dāng)然，用戶規(guī)模的擴(kuò)大，意味著更多的使用數(shù)據(jù)，反過來也會(huì)進(jìn)一步反哺小米大模型的開發(fā)。

當(dāng)然，股票市場(chǎng)對(duì)于小米這次動(dòng)作的反應(yīng)也十分樂觀和迅速。截至午間休市，小米集團(tuán)今日股價(jià)直接上漲4.74%，總市值1.29萬億港元（約合人民幣1.21萬億元）。

圖源：小紅書

值得注意的是，此次開源的MiMo，是來自全新成立不久的“小米大模型 Core 團(tuán)隊(duì)”的初步嘗試。

此前，曾有報(bào)道稱小米創(chuàng)始人雷軍以千萬年薪挖角 AI 天才少女羅福莉，后者曾在 DeepSeek 任職研究員，并參與 DeepSeek-V2 等大模型研發(fā)工作。

如今交出這樣一份答卷，可以說，讓公眾對(duì)小米大模型的未來，不禁有了更多想象的空間。

二、小米一向是個(gè)“逆襲者”

從手機(jī)、到家電、再到汽車，小米拿到入場(chǎng)券的時(shí)間都不算早，但這個(gè)企業(yè)，總能依靠獨(dú)特的打法實(shí)現(xiàn)后來居上。

比如，2011年，雷軍帶著小米手機(jī)殺入市場(chǎng)時(shí)，蘋果、三星已封神多年，也許沒人相信小米能攪動(dòng)風(fēng)云。

圖源：抖音

但就在三年后的2014年，小米通過極致性價(jià)比和技術(shù)堆料策略，一舉登頂中國市場(chǎng)份額第一。

而就在前兩天，小米手機(jī)再次以出貨量1330萬臺(tái)，市場(chǎng)份額18.6%的成績，登頂中國區(qū)銷量榜。

圖源：微博

為此，沉默多天的雷軍也現(xiàn)身發(fā)文慶祝。

圖源：微博截圖

再比如，2021年，小米宣布造車，此時(shí)“蔚小理”的名聲已經(jīng)在國內(nèi)市場(chǎng)打響。但很顯然小米造車的銷量再次出乎意料。

2024年，小米SU7上市24小時(shí)內(nèi)大定訂單突破8.8萬臺(tái)，全年交付量達(dá)13.6萬輛，遠(yuǎn)超原定目標(biāo)。

圖源：微博

最后，到如今的小米大模型，其實(shí)，與不少友商互聯(lián)網(wǎng)大廠相比，小米進(jìn)軍的時(shí)間并不長。

2023年4月，雷軍親自宣布，小米將成立大模型團(tuán)隊(duì)，并且，雷軍明確提出“不搞軍備競(jìng)賽”，專注輕量化與端側(cè)部署。

同年8月，小米首次發(fā)布了自研大模型MiLM-6B（64億參數(shù)），并在中文評(píng)測(cè)榜單C-EVAL和CMMLU中，一舉奪得同參數(shù)量級(jí)第一的成績。

圖源：微博

該模型采用“大數(shù)據(jù)+大任務(wù)+大參數(shù)”的范式，通過自研的ScaledAdam優(yōu)化器和Eden學(xué)習(xí)率調(diào)度器提升訓(xùn)練效率，同時(shí)依托小米生態(tài)80%的自有數(shù)據(jù)（包括3TB產(chǎn)品業(yè)務(wù)數(shù)據(jù)）進(jìn)行深度優(yōu)化。

第二年5月，MiLM正式通過澎湃OS系統(tǒng)和小愛同學(xué)實(shí)現(xiàn)了消費(fèi)端的落地應(yīng)用。小米手機(jī)端的AI圖片編輯、平板端的自動(dòng)生成會(huì)議紀(jì)要、電視端的影視問答等，都有它的協(xié)同參與。

小米第二代模型MiLM2，是在2024年11月發(fā)布的，此次迭代不僅擴(kuò)充了訓(xùn)練數(shù)據(jù)的規(guī)模，也在訓(xùn)練策略與微調(diào)機(jī)制上進(jìn)行了打磨。

圖源：微博

這次更新的成績也很吸睛，參數(shù)范圍擴(kuò)展至0.3B-30B，推理速度提升了34%，量化損失降低了78%。

可以說，大模型的發(fā)展歷程，實(shí)質(zhì)是小米在AI 2.0時(shí)代對(duì)“規(guī)模擴(kuò)張”與“價(jià)值創(chuàng)造”的重新平衡，通過將開源生態(tài)、云邊協(xié)同與通用能力三大要素深度融合，重新書寫中國科技企業(yè)參與全球AI競(jìng)賽的新敘事。

三、小米的前路并不輕松

當(dāng)然，在這場(chǎng)小米大模型的開源狂歡過后，小米的前路也許并不輕松。

一方面，從技術(shù)角度來看，小米模型目前僅支持文本輸入，與強(qiáng)勁的對(duì)手OpenAI相比，在多模態(tài)能力和應(yīng)用場(chǎng)景拓展上還存在一定差距。

與此同時(shí)，當(dāng)前7B模型雖然適配端側(cè)芯片，但隨著多模態(tài)能力的擴(kuò)展，未來小米可能面對(duì)在模型復(fù)雜度與硬件兼容性間權(quán)衡的難題。

不過，小米技術(shù)團(tuán)隊(duì)似乎已經(jīng)意識(shí)到這一點(diǎn)。據(jù)其開源技術(shù)報(bào)告披露，下一代MiMo模型將引入動(dòng)態(tài)多模態(tài)融合模塊，通過跨模態(tài)注意力機(jī)制整合文本、圖像甚至傳感器數(shù)據(jù)。

另一方面，外部競(jìng)爭(zhēng)對(duì)手正在逐步加快開發(fā)的進(jìn)程，火藥味越來越濃。友商科技頭部企業(yè)，如阿里巴巴、騰訊、華為、字節(jié)跳動(dòng)等，你追我趕。

圖源：微博

例如，就在前兩天，百度在Create2025AI開發(fā)者大會(huì)上，也發(fā)布了兩款開源大模型：文心大模型4.5 Turbo及深度思考模型X1 Turbo。百度大模型的實(shí)力也確實(shí)“不一般”。

圖源：微博

甚至，2025年來，全球基礎(chǔ)模型數(shù)量已經(jīng)突破了500個(gè)，純文本模型的性能差距逐漸收窄。因此，留給小米的壓力不小。

但無論如何，MiMo的開源已為中國AI發(fā)展提供新范式，至少，它證明技術(shù)突破未必需要千億參數(shù)的軍備競(jìng)賽，并且，生態(tài)共贏遠(yuǎn)比閉源壟斷更具生命力。

在大模型領(lǐng)域，小米究竟能掀起怎樣的浪潮，或許時(shí)間會(huì)給出答案，讓我們拭目以待。

小米小米首個(gè)大模型開源

聲明

1、該內(nèi)容為作者獨(dú)立觀點(diǎn)，不代表電商派觀點(diǎn)或立場(chǎng)，文章為作者本人上傳，版權(quán)歸原作者所有，未經(jīng)允許不得轉(zhuǎn)載。
2、電商號(hào)平臺(tái)僅提供信息存儲(chǔ)服務(wù)，如發(fā)現(xiàn)文章、圖片等侵權(quán)行為，侵權(quán)責(zé)任由作者本人承擔(dān)。
3、如對(duì)本稿件有異議或投訴，請(qǐng)聯(lián)系：info@dsb.cn

相關(guān)閱讀

小米開源首個(gè)推理大模型Xiaomi MiMo

2025-04-30 11:46:03

小米首個(gè)推理大模型開源。

小米推出首個(gè)AI大模型計(jì)算攝影平臺(tái)“Xiaomi AISP”

2024-02-22 20:35:38

2月22日消息，據(jù)小米手機(jī)官方微博，小米推出首個(gè)AI大模型計(jì)算攝影平臺(tái)“Xiaomi AISP”。該平臺(tái)全面整合CPU、GPU、NPU和ISP算力，可實(shí)現(xiàn)可60TOPS的計(jì)算能力，提供“超級(jí)抓拍”和“超級(jí)底片”功能。

小米升級(jí)大模型“小愛同學(xué)”：持續(xù)開放邀請(qǐng)內(nèi)測(cè)

2023-09-07 11:35:01

9月7日消息，小米大模型首個(gè)落地產(chǎn)品“小愛同學(xué)”正在持續(xù)開放邀請(qǐng)內(nèi)測(cè)。據(jù)首批邀請(qǐng)內(nèi)測(cè)的用戶反饋，小愛大模型在翻譯、規(guī)劃、寫代碼等等場(chǎng)景中表現(xiàn)良好。小米公司官微發(fā)布信息稱，小愛大模型擁有強(qiáng)悍的理解能力和豐富的知識(shí)儲(chǔ)備，現(xiàn)在，可以寫周報(bào)、做旅游攻略、制定健身計(jì)劃，甚至寫代碼。

淘寶Apple Vision Pro版升級(jí)至3.0，集虛擬試妝、試駕、試聽于一身

2024-09-11 11:54:09

日前，淘寶Apple Vision Pro版更新至3.0版本，上線多項(xiàng)重大更新，不僅在首頁新設(shè)更沉浸式的入口，進(jìn)一步豐富消費(fèi)者的體驗(yàn)形式，還上線了站內(nèi)消息推送等系統(tǒng)功能。目前，淘寶已經(jīng)和大疆、小米汽車、梅森馬吉拉、魅可、COLMO、哈曼卡頓等品牌上線深度合作，還聯(lián)合科沃斯、石頭、舒服德等品牌在淘寶Apple Vision Pro版打造了首個(gè)“AI智能節(jié)”，創(chuàng)新品牌與消費(fèi)者的連接形式。高端家電品牌COLMO則希望通過淘寶Apple Vision Pro版，帶給用戶“AI新體驗(yàn)”。

比iPad mini屏幕更大，2K+真全面屏小米MIX FOLD的折疊屏有多強(qiáng)？

2021-04-15 14:56:03

小米折疊屏MIX FOLD搭載業(yè)內(nèi)最大的英寸折疊屏。展開屏幕，立即獲得比iPad mini更大的屏，顯示面積也超過了目前所有的手機(jī)設(shè)備。大屏只是為移動(dòng)辦公提供了硬件支持，軟件方面，小米折疊屏MIX FOLD同樣遙遙領(lǐng)先。最最重要的是，小米折疊屏MIX FOLD更加完美的適配了辦公利器WPS，首頁全新布局、內(nèi)容呈現(xiàn)也更加豐富。從開啟預(yù)售至今，小米折疊屏MIX FOLD已成為眾多機(jī)友關(guān)注的焦點(diǎn)。4月16日上午10點(diǎn)，小米折疊屏MIX FOLD正式開售。

小米小愛同學(xué)新增一句話多指令功能

2021-07-25 10:27:11

7月25日消息，近日，小愛同學(xué)新增“一句話多指令”功能。用戶可以對(duì)小愛同學(xué)說“大點(diǎn)聲放首歌”、“播放米小圈上學(xué)記聲音小一點(diǎn)”，可以簡化操作，不用重復(fù)進(jìn)行多次請(qǐng)求。官方表示，后續(xù)一句話多指令還將不斷擴(kuò)展到其它功能上，敬請(qǐng)期待。

小米首個(gè)省級(jí)產(chǎn)教融合基地落地常熟

2025-02-26 16:35:40

2月26日消息，小米產(chǎn)教融合大會(huì)暨2025小米產(chǎn)教融合共同體年會(huì)日前在常熟舉辦，會(huì)上舉行了小米集團(tuán)產(chǎn)教融合基地簽約儀式，宣布小米首個(gè)省級(jí)產(chǎn)教融合基地落地常熟。據(jù)介紹，該基地將為大專院校及職業(yè)技術(shù)院校學(xué)生提供實(shí)習(xí)實(shí)訓(xùn)機(jī)會(huì)，同時(shí)也為企業(yè)員工打造職業(yè)培訓(xùn)和技能提升平臺(tái)。

雷軍：小米汽車預(yù)計(jì)2024年上半年正式量產(chǎn)

2021-10-19 11:26:50

10月19日消息，小米今日召開投資者會(huì)議，雷軍表示小米汽車預(yù)計(jì)2024年上半年量產(chǎn)。據(jù)了解，9月1號(hào)，小米汽車有限公司正式注冊(cè)成立，注冊(cè)資金100億元人民幣，小米集團(tuán)創(chuàng)始人、董事長兼CEO雷軍出任法定代表人。雷軍透露，小米汽車首個(gè)工廠會(huì)落戶在北京亦莊，目前已收到2萬份簡歷，到崗研發(fā)團(tuán)隊(duì)453人。截至發(fā)稿，小米集團(tuán)漲近5%，報(bào)22.40港元，總市值5621.36億港元。

李迎

你好，我是李迎

欧美videosvideo喷水,欧美成ee人免费视频,亚洲欧洲日本综合aⅴ在线,国产精品美女久久久久久福利,国产成人午夜福利高清在线观看

小米突然放大招，開源大模型干趴阿里、Open AI

小米突然放大招，開源大模型干趴阿里、Open AI