張一鳴藏了一手,抖音AI沖上全球第一梯隊
字節(jié)跳動按下了AI智能體發(fā)展的快進鍵。
豆包1.5深度思考模型發(fā)布
隨著 AI 技術(shù)的快速發(fā)展,AI 已經(jīng)快速邁入 Agentic AI 時代。
近日,火山引擎總裁譚待宣布,火山引擎正式發(fā)布豆包1.5·深度思考模型。

圖源:火山引擎公眾號
深度思考模型是讓 AI 模擬人類的思維過程,對復雜問題進行精準分析和邏輯推導。
對于這一點,火山引擎團隊表示,豆包1.5·深度思考模型在數(shù)學、代碼、科學等專業(yè)領(lǐng)域推理任務(wù)中,已經(jīng)達到或接近全球第一梯隊水平;在創(chuàng)意寫作等非推理任務(wù)中,可以適配廣泛和復雜的使用場景。

圖源:火山引擎公眾號
就技術(shù)層面而言,豆包1.5·深度思考模型采用 MoE 架構(gòu),總參數(shù)為2000億,激活參數(shù)僅200億,比同等類型的大模型省了近一半的資源。
與此同時,豆包1.5·深度思考模型的響應(yīng)速度卻并未縮水,API延遲低至20毫秒。

圖源:百度
就解決問題層面而言,豆包1.5·深度思考模型通過定向訓練,在查詢互聯(lián)網(wǎng)信息,進行多輪搜索和思考時,已經(jīng)可以做到“邊想邊搜”。
區(qū)別于其他推理模型的“先搜索再思考”,豆包可以更高效精準地解決用戶的問題,如同和人面對面交流一般。

圖源:百度
就理解能力層面而言,豆包1.5·深度思考模型具備視覺理解能力,能跟人一樣對文字和畫面進行思考,使思考結(jié)果更加綜合立體,如同擁有了“大腦”和“眼睛”。

圖源:百度
不難看出,豆包1.5·深度思考模型拓寬了AI的想象力空間,給用戶提供了更便捷的AI選擇,讓AI與人的交互更為親密了。
此外,在發(fā)布豆包1.5·深度思考模型的同時,火山引擎還對豆包·文生圖模型3.0和豆包·視覺理解模型進行了升級。

圖源:火山引擎公眾號
升級后的豆包·文生圖模型3.0,優(yōu)化了文字排版表現(xiàn),擁有了實拍級的圖像生成效果,還能生成2K 的高清圖片,幾乎涵蓋了各類圖片使用場景。
因此,豆包·文生圖模型3.0直接在最新的文生圖領(lǐng)域權(quán)威榜單上進入了全球第一梯隊。

圖源:火山引擎公眾號
而升級后的豆包·視覺理解模型具備更強的視覺定位能力,可以更精準定位,滿足各類定位需求。
與此同時,豆包·視覺理解模型的視頻理解能力更智能了,可以直接進行語義搜索,以及對食品進行記憶理解等。

圖源:火山引擎公眾號
值得一提的是,火山引擎還針對不同需求,發(fā)布了對應(yīng)的模型來解決更具體的場景問題——
面向Agent服務(wù),發(fā)布OS Agent解決方案、GUI Agent大模型——豆包1.5·UI-TARS模型;面向大規(guī)模推理,發(fā)布AI云原生·ServingKit推理套件。

圖源:火山引擎公眾號

圖源:火山引擎公眾號
正如火山引擎CEO譚待所言:“深度思考模型是構(gòu)建Agent的基礎(chǔ),模型要有能力做好思考、計劃和反思,并且一定要支持多模態(tài),就像人類具備視覺和聽覺一樣,Agent才能更好地處理復雜任務(wù)。”
顯而易見,字節(jié)跳動對于布局AI產(chǎn)業(yè)生態(tài)和持續(xù)發(fā)展是認真的,或許是想趁著AI的風口,尋找新的增長點。
字節(jié)跳動布局AI
字節(jié)跳動對于AI的布局早已開始,其AI布局已涉獵多個板塊,由一張圖即可看出——

圖源:百度
可見,字節(jié)跳動的AI產(chǎn)品覆蓋聊天、創(chuàng)作、教育等場景,包括聊天機器人豆包、AI視頻即夢、AI寫真星繪、AI搜題Gauth、AI修圖醒圖等20+應(yīng)用,其中半數(shù)產(chǎn)品同步在海外市場進行布局。?
其中,截至2025年3月底,豆包大模型日均tokens調(diào)用量已超過12.7萬億。

圖源:火山引擎公眾號
IDC報告顯示,2024年中國公有云大模型調(diào)用量激增,火山引擎以46.4%的市場份額位居中國市場第一。

圖源:百度??
顯而易見,字節(jié)跳動的AI布局已經(jīng)在AI市場上不僅是占據(jù)一席之地,還可以說是全面開花。
而這些都與字節(jié)跳動逐步的鋪墊和積累息息相關(guān)——
2016年,字節(jié)跳動成立?AI Lab?,設(shè)立計算機視覺、自然語言處理、語音處理等團隊,早期聚焦推薦算法優(yōu)化,支撐今日頭條和抖音的精準推送。
雖然當時字節(jié)跳動并未將重心放在AI方面,卻也積累了算法、模型等技術(shù),為后來布局AI埋下了伏筆。
2023年,字節(jié)跳動成立?Seed團隊?,啟動大模型自主研發(fā),構(gòu)建三層技術(shù)架構(gòu)—— ?
Stone?(技術(shù)中臺):整合算法資源,支撐多業(yè)務(wù)線協(xié)同?; ?
Seed?(大模型研發(fā)):推進豆包大模型開發(fā);
?Flow?(應(yīng)用開發(fā)):快速落地AI產(chǎn)品。?
2024年,字節(jié)跳動開始進入全面開花階段——
一面布局C端產(chǎn)品矩陣,推出豆包、星繪、Gauth等軟件;
一面布局硬件生態(tài),發(fā)布首款AI智能耳機?OlaFriend?,支持語音喚醒豆包大模型,聯(lián)合李未可推出AI眼鏡?Meta Lens Chat?,集成AR導航與實時翻譯。
2025年,字節(jié)跳動更是宣布?1600億元AI投資計劃?,其中900億用于GPU采購(60%算力預算投向國產(chǎn)芯片),同時已建成萬卡A100/A800集群,支撐大規(guī)模訓練需求。
回顧字節(jié)跳動的AI布局發(fā)展,不難看出,其目的是想要開辟新的增長曲線,在AI方向?qū)ふ倚碌耐黄婆c創(chuàng)新,并且取得了一定的成效——
AI算法驅(qū)動抖音、今日頭條用戶使用時間增加;AI賦能電商直播GMV增加;AI工具增加收入;開拓AI短劇、虛擬陪伴等新付費場景……
不過,字節(jié)跳動的AI發(fā)展依舊存在一定隱憂,比如,豆包大模型在復雜推理、長文本處理等場景仍落后于OpenAI等頭部廠商;AI硬件銷量未達預期,硬件營收不足,難以支撐研發(fā)投入等。
要解決這些問題,在AI市場中創(chuàng)造新的增長點,字節(jié)跳動或許需要更多的技術(shù)創(chuàng)新。
AI之爭如火如荼
如今AI的風頭正盛,各大企業(yè)都想要分一杯AI的時代紅利——
就巨頭企業(yè)方面,字節(jié)跳動依托豆包大模型構(gòu)建閉環(huán)生態(tài),但復雜推理能力仍落后頭部廠商。?
阿里通過AI優(yōu)化電商搜索與推薦,但技術(shù)深度不及垂直AI企業(yè),更多依賴與第三方模型合作。?????
騰訊和百度?則是以“接入替代自研”的策略擁抱DeepSeek-R1模型,降低開發(fā)成本并快速補齊能力短板。
就創(chuàng)業(yè)公司方面,“大模型六小虎”戰(zhàn)略分化,?智譜沖擊IPO、零一萬物轉(zhuǎn)向產(chǎn)業(yè)大模型、MiniMax收縮B端業(yè)務(wù),部分企業(yè)面臨邊緣化風險。
DeepSeek異軍突起?,開源模型性能超越頭部大廠,7天獲取1億用戶,成為行業(yè)新星。
不難看出,多家公司押注的AI行業(yè)已是未來發(fā)展的重頭戲,而對于未來AI市場的發(fā)展,或許會更注重于便捷與情感——
AI營銷工具爆火,伴隨著AI技術(shù)融入互聯(lián)網(wǎng),無論是企業(yè),還是消費者,都能享受到AI帶來的創(chuàng)作便捷性?。
抖音虛擬陪伴產(chǎn)品“貓箱”用戶突破3000萬,35%用戶日均互動超2小時,或?qū)⒋呱孪M市場。
此外,值得一提的是,DeepSeek的開源策略像在AI界復刻安卓模式,不斷催生技術(shù)迭代和進步創(chuàng)新,AI的發(fā)展速度日新月異,不斷激發(fā)著人們的想象。
在未來,或許AI與人的交互會譜寫出一個又一個新的創(chuàng)意與發(fā)展的可能。
不過,在AI這片新的市場之中,到底誰能笑到最后,仍待時間驗證。?????
2、電商號平臺僅提供信息存儲服務(wù),如發(fā)現(xiàn)文章、圖片等侵權(quán)行為,侵權(quán)責任由作者本人承擔。
3、如對本稿件有異議或投訴,請聯(lián)系:info@dsb.cn
