張一鳴藏了一手，抖音AI沖上全球第一梯隊

科技頭版

2025-04-21 11:45

字節(jié)跳動按下了AI智能體發(fā)展的快進鍵。

豆包1.5深度思考模型發(fā)布

隨著 AI 技術(shù)的快速發(fā)展，AI 已經(jīng)快速邁入 Agentic AI 時代。

近日，火山引擎總裁譚待宣布，火山引擎正式發(fā)布豆包1.5·深度思考模型。

圖源：火山引擎公眾號

深度思考模型是讓 AI 模擬人類的思維過程，對復雜問題進行精準分析和邏輯推導。

對于這一點，火山引擎團隊表示，豆包1.5·深度思考模型在數(shù)學、代碼、科學等專業(yè)領(lǐng)域推理任務(wù)中，已經(jīng)達到或接近全球第一梯隊水平；在創(chuàng)意寫作等非推理任務(wù)中，可以適配廣泛和復雜的使用場景。

圖源：火山引擎公眾號

就技術(shù)層面而言，豆包1.5·深度思考模型采用 MoE 架構(gòu)，總參數(shù)為2000億，激活參數(shù)僅200億，比同等類型的大模型省了近一半的資源。

與此同時，豆包1.5·深度思考模型的響應(yīng)速度卻并未縮水，API延遲低至20毫秒。

圖源：百度

就解決問題層面而言，豆包1.5·深度思考模型通過定向訓練，在查詢互聯(lián)網(wǎng)信息，進行多輪搜索和思考時，已經(jīng)可以做到“邊想邊搜”。

區(qū)別于其他推理模型的“先搜索再思考”，豆包可以更高效精準地解決用戶的問題，如同和人面對面交流一般。

圖源：百度

就理解能力層面而言，豆包1.5·深度思考模型具備視覺理解能力，能跟人一樣對文字和畫面進行思考，使思考結(jié)果更加綜合立體，如同擁有了“大腦”和“眼睛”。

圖源：百度

不難看出，豆包1.5·深度思考模型拓寬了AI的想象力空間，給用戶提供了更便捷的AI選擇，讓AI與人的交互更為親密了。

此外，在發(fā)布豆包1.5·深度思考模型的同時，火山引擎還對豆包·文生圖模型3.0和豆包·視覺理解模型進行了升級。

圖源：火山引擎公眾號

升級后的豆包·文生圖模型3.0，優(yōu)化了文字排版表現(xiàn)，擁有了實拍級的圖像生成效果，還能生成2K 的高清圖片，幾乎涵蓋了各類圖片使用場景。

因此，豆包·文生圖模型3.0直接在最新的文生圖領(lǐng)域權(quán)威榜單上進入了全球第一梯隊。

圖源：火山引擎公眾號

而升級后的豆包·視覺理解模型具備更強的視覺定位能力，可以更精準定位，滿足各類定位需求。

與此同時，豆包·視覺理解模型的視頻理解能力更智能了，可以直接進行語義搜索，以及對食品進行記憶理解等。

圖源：火山引擎公眾號

值得一提的是，火山引擎還針對不同需求，發(fā)布了對應(yīng)的模型來解決更具體的場景問題——

面向Agent服務(wù)，發(fā)布OS Agent解決方案、GUI Agent大模型——豆包1.5·UI-TARS模型；面向大規(guī)模推理，發(fā)布AI云原生·ServingKit推理套件。

圖源：火山引擎公眾號

圖源：火山引擎公眾號

正如火山引擎CEO譚待所言：“深度思考模型是構(gòu)建Agent的基礎(chǔ)，模型要有能力做好思考、計劃和反思，并且一定要支持多模態(tài)，就像人類具備視覺和聽覺一樣，Agent才能更好地處理復雜任務(wù)。”

顯而易見，字節(jié)跳動對于布局AI產(chǎn)業(yè)生態(tài)和持續(xù)發(fā)展是認真的，或許是想趁著AI的風口，尋找新的增長點。

字節(jié)跳動布局AI

字節(jié)跳動對于AI的布局早已開始，其AI布局已涉獵多個板塊，由一張圖即可看出——

圖源：百度

可見，字節(jié)跳動的AI產(chǎn)品覆蓋聊天、創(chuàng)作、教育等場景，包括聊天機器人豆包、AI視頻即夢、AI寫真星繪、AI搜題Gauth、AI修圖醒圖等20+應(yīng)用，其中半數(shù)產(chǎn)品同步在海外市場進行布局。?

其中，截至2025年3月底，豆包大模型日均tokens調(diào)用量已超過12.7萬億。

圖源：火山引擎公眾號

IDC報告顯示，2024年中國公有云大模型調(diào)用量激增，火山引擎以46.4%的市場份額位居中國市場第一。

圖源：百度??

顯而易見，字節(jié)跳動的AI布局已經(jīng)在AI市場上不僅是占據(jù)一席之地，還可以說是全面開花。

而這些都與字節(jié)跳動逐步的鋪墊和積累息息相關(guān)——

2016年，字節(jié)跳動成立?AI Lab?，設(shè)立計算機視覺、自然語言處理、語音處理等團隊，早期聚焦推薦算法優(yōu)化，支撐今日頭條和抖音的精準推送。

雖然當時字節(jié)跳動并未將重心放在AI方面，卻也積累了算法、模型等技術(shù)，為后來布局AI埋下了伏筆。

2023年，字節(jié)跳動成立?Seed團隊?，啟動大模型自主研發(fā)，構(gòu)建三層技術(shù)架構(gòu)—— ?

Stone?（技術(shù)中臺）：整合算法資源，支撐多業(yè)務(wù)線協(xié)同?； ?

Seed?（大模型研發(fā)）：推進豆包大模型開發(fā)；

?Flow?（應(yīng)用開發(fā)）：快速落地AI產(chǎn)品。?

2024年，字節(jié)跳動開始進入全面開花階段——

一面布局C端產(chǎn)品矩陣，推出豆包、星繪、Gauth等軟件；

一面布局硬件生態(tài)，發(fā)布首款AI智能耳機?OlaFriend?，支持語音喚醒豆包大模型，聯(lián)合李未可推出AI眼鏡?Meta Lens Chat?，集成AR導航與實時翻譯。

2025年，字節(jié)跳動更是宣布?1600億元AI投資計劃?，其中900億用于GPU采購（60%算力預算投向國產(chǎn)芯片），同時已建成萬卡A100/A800集群，支撐大規(guī)模訓練需求。

回顧字節(jié)跳動的AI布局發(fā)展，不難看出，其目的是想要開辟新的增長曲線，在AI方向?qū)ふ倚碌耐黄婆c創(chuàng)新，并且取得了一定的成效——

AI算法驅(qū)動抖音、今日頭條用戶使用時間增加；AI賦能電商直播GMV增加；AI工具增加收入；開拓AI短劇、虛擬陪伴等新付費場景……

不過，字節(jié)跳動的AI發(fā)展依舊存在一定隱憂，比如，豆包大模型在復雜推理、長文本處理等場景仍落后于OpenAI等頭部廠商；AI硬件銷量未達預期，硬件營收不足，難以支撐研發(fā)投入等。

要解決這些問題，在AI市場中創(chuàng)造新的增長點，字節(jié)跳動或許需要更多的技術(shù)創(chuàng)新。

AI之爭如火如荼

如今AI的風頭正盛，各大企業(yè)都想要分一杯AI的時代紅利——

就巨頭企業(yè)方面，字節(jié)跳動依托豆包大模型構(gòu)建閉環(huán)生態(tài)，但復雜推理能力仍落后頭部廠商。?

阿里通過AI優(yōu)化電商搜索與推薦，但技術(shù)深度不及垂直AI企業(yè)，更多依賴與第三方模型合作。?????

騰訊和百度?則是以“接入替代自研”的策略擁抱DeepSeek-R1模型，降低開發(fā)成本并快速補齊能力短板。

就創(chuàng)業(yè)公司方面，“大模型六小虎”戰(zhàn)略分化，?智譜沖擊IPO、零一萬物轉(zhuǎn)向產(chǎn)業(yè)大模型、MiniMax收縮B端業(yè)務(wù)，部分企業(yè)面臨邊緣化風險。

DeepSeek異軍突起?，開源模型性能超越頭部大廠，7天獲取1億用戶，成為行業(yè)新星。

不難看出，多家公司押注的AI行業(yè)已是未來發(fā)展的重頭戲，而對于未來AI市場的發(fā)展，或許會更注重于便捷與情感——

AI營銷工具爆火，伴隨著AI技術(shù)融入互聯(lián)網(wǎng)，無論是企業(yè)，還是消費者，都能享受到AI帶來的創(chuàng)作便捷性?。

抖音虛擬陪伴產(chǎn)品“貓箱”用戶突破3000萬，35%用戶日均互動超2小時，或?qū)⒋呱孪M市場。

此外，值得一提的是，DeepSeek的開源策略像在AI界復刻安卓模式，不斷催生技術(shù)迭代和進步創(chuàng)新，AI的發(fā)展速度日新月異，不斷激發(fā)著人們的想象。

在未來，或許AI與人的交互會譜寫出一個又一個新的創(chuàng)意與發(fā)展的可能。

不過，在AI這片新的市場之中，到底誰能笑到最后，仍待時間驗證。?????

抖音抖音AI

聲明

1、該內(nèi)容為作者獨立觀點，不代表電商派觀點或立場，文章為作者本人上傳，版權(quán)歸原作者所有，未經(jīng)允許不得轉(zhuǎn)載。
2、電商號平臺僅提供信息存儲服務(wù)，如發(fā)現(xiàn)文章、圖片等侵權(quán)行為，侵權(quán)責任由作者本人承擔。
3、如對本稿件有異議或投訴，請聯(lián)系：info@dsb.cn

科技頭版

一起見證改變世界的力量

欧美videosvideo喷水,欧美成ee人免费视频,亚洲欧洲日本综合aⅴ在线,国产精品美女久久久久久福利,国产成人午夜福利高清在线观看

張一鳴藏了一手，抖音AI沖上全球第一梯隊