欧美videosvideo喷水,欧美成ee人免费视频,亚洲欧洲日本综合aⅴ在线,国产精品美女久久久久久福利,国产成人午夜福利高清在线观看

DeepSeek深夜整活,Google、OpenAI有點(diǎn)慌了

李迎
2025-03-27 09:03

在任何行業(yè),一但有中國(guó)公司殺入,氣氛就開始緊張,DeepSeek的一舉一動(dòng),都牽動(dòng)著老美科技的那根筋。

一、DeepSeek、Google及OpenAI突發(fā)更新

深夜,當(dāng)人們已經(jīng)進(jìn)入夢(mèng)鄉(xiāng)之時(shí),AI領(lǐng)域的競(jìng)爭(zhēng)卻絲毫未減。

3月25日晚,DeepSeek突然在Hugging Face平臺(tái)發(fā)布了新版本DeepSeek-V3-0324模型。

這次更新延續(xù)了DeepSeek一貫低調(diào)的風(fēng)格,沒(méi)有高調(diào)的宣傳,只有模型權(quán)重和一個(gè)空白的README文件。

而此次更新也一如既往地在AI社區(qū)內(nèi)引發(fā)了不小的震動(dòng)。

ssFSfmpY1v-800.png

圖源:Hugging Face

從技術(shù)層面來(lái)看,DeepSeek-V3-0324很可能被視為DeepSeek即將推出的推理模型DeepSeek-R2的基礎(chǔ)。

此前,路透社曾透露,DeepSeek正在加快R1模型的后續(xù)產(chǎn)品R2的研發(fā)和發(fā)布進(jìn)程,原計(jì)劃在5月初發(fā)布,但公司現(xiàn)在希望能夠盡早推出 。

不過(guò),在隨后不久,DeepSeek官方迅速否認(rèn)了該傳聞,表示消息不實(shí)。

業(yè)內(nèi)人士推測(cè),DeepSeek-R2模型預(yù)計(jì)將在代碼生成除英語(yǔ)外的更多語(yǔ)種推理能力方面有不小的提升。

這也是為什么R2在全球都有人期待其快速到來(lái)。

而就在DeepSeek深夜更新其v3模型后一天時(shí)間內(nèi),AI領(lǐng)域的另一巨頭Google也突然在深夜發(fā)布了一項(xiàng)重磅更新——正式推出了全新的Gemini 2.5 Pro模型,并聲稱這是迄今為止最智能的AI模型。

Google強(qiáng)調(diào),Gemini 2.5 Pro是一款具備“思考”能力的模型,能夠逐步分析任務(wù),做出更明智的決策,從而在處理復(fù)雜提示時(shí)能夠給出更準(zhǔn)確和更符合上下文的回復(fù)。

AwszNgj1K8-800.png

圖源:X平臺(tái)

Google選擇與DeepSeek幾乎在同一天發(fā)布其最新、最強(qiáng)大的模型,無(wú)疑是對(duì)市場(chǎng)競(jìng)爭(zhēng)格局變化的積極回應(yīng)。

然而,面對(duì)如此激烈的市場(chǎng)競(jìng)爭(zhēng),OpenAI并沒(méi)有選擇避其鋒芒。

這一次,OpenAI暫時(shí)放棄了在基座或推理模型方面的競(jìng)爭(zhēng),而是另辟蹊徑,對(duì)GPT-4o和Sora進(jìn)行了重大升級(jí),并推出了全新的文生圖模型。

OpenAI的CEO奧特曼親自站臺(tái),稱這一新模型為“令人難以置信的產(chǎn)品”。

qufwwEIXgs-800.png

圖源:X平臺(tái)

在這場(chǎng)看似突然的三方混戰(zhàn)中,實(shí)則每個(gè)巨頭都有著自己的戰(zhàn)略重點(diǎn)。

DeepSeek此次更新專注于基座模型的優(yōu)化。

眾所周知,目前主流的大模型一般分為兩種,一種是“基座模型”,字面意思就像是各種大模型的“地基”;

而另一種是“推理模型”,DeepSeek-R1就是其中之一。

此次更新的Gemini 2.5 Pro則也是推理模型中的一種。

谷歌這一次的發(fā)力,不僅打破了多項(xiàng)跑分記錄,該模型的實(shí)際體驗(yàn)也十分出色,這點(diǎn)我們后續(xù)再說(shuō)。

OpenAI的文生圖模型則類似處于另一維度,雖然都幾乎同步更新,也都給行業(yè)帶來(lái)了震撼,但OpenAI此次更新的時(shí)間實(shí)在是意味深長(zhǎng)。

二、實(shí)測(cè)對(duì)比,誰(shuí)更勝一籌?

盡管DeepSeek-V3-0324的發(fā)布方式非常低調(diào),但其在技術(shù)上的進(jìn)步卻不容忽視。

根據(jù)Artificial Analysis Intelligence Index的評(píng)估,DeepSeek-V3-0324已經(jīng)成為得分最高的非推理模型。

在基準(zhǔn)測(cè)試中超越了包括Google的Gemini 2.0 Pro、Anthropic的Claude 3.7 Sonnet以及Meta的Llama 3.3 70B等一眾明星模型 。

XZPV2KXoaT-800.png

圖源:Artificial Analysis Intelligence Index

此外,在面對(duì)復(fù)雜問(wèn)題時(shí),DeepSeek-V3-0324的表現(xiàn)也可圈可點(diǎn),特別是編程能力大幅提升。

根據(jù)Aider LLM的多語(yǔ)言基準(zhǔn)測(cè)試,V3-0324的得分從之前的不到50%一舉提升到了55%。

尤其是在代碼生成方面,V3-0324已經(jīng)能夠與Claude 3.7 Sonnet一決高下,甚至在某些任務(wù)上超越了DeepSeek自家的R1模型。

并且,作為咱中國(guó)自己的AI模型,這次更新后其中文寫作能力也得到了提升,風(fēng)格和內(nèi)容質(zhì)量更加接近R1的標(biāo)準(zhǔn),在中長(zhǎng)篇文章的寫作方面也有所進(jìn)步。

為什么這一點(diǎn)要單拎出來(lái)說(shuō)?

因?yàn)榇蠹叶贾?,DeepSeek的R1深度思考模型時(shí)常會(huì)出現(xiàn)服務(wù)器繁忙的現(xiàn)象,極度影響使用體驗(yàn)。

而當(dāng)我們把“深度思考(R1)”關(guān)閉后,使用的則是DeepSeek-V3。

因此在這一次更新過(guò)后,對(duì)于那些需要用DeepSeek寫文案的中國(guó)用戶來(lái)說(shuō),關(guān)閉R1使用V3或許是個(gè)不錯(cuò)的選擇。

IAC1rs2264-800.png

圖源:新華社

Google發(fā)布的Gemini 2.5 Pro同樣不容小覷。

根據(jù)公開測(cè)試結(jié)果,Gemini 2.5 Pro在多項(xiàng)測(cè)試中超越了現(xiàn)有主流模型。

它不僅在數(shù)學(xué)、科學(xué)和編碼基準(zhǔn)測(cè)試中擊敗了DeepSeek-R1、Grok 3和Claude 3.7,還幾乎全面優(yōu)于OpenAI家的兩款模型——o3-mini和GPT4.5。

Gemini 2.5 Pro現(xiàn)在在競(jìng)技排行榜上位居第一,這是有史以來(lái)最大的分?jǐn)?shù)跳躍,比Grok-3/GPT-4.5高出40分。

1BYAWXYt6w-800.png

圖源:鯨AI

在模型正式上線后,許多外網(wǎng)網(wǎng)友實(shí)際體驗(yàn)后表示,Gemini 2.5 Pro在處理復(fù)雜的編程任務(wù)時(shí)展現(xiàn)了過(guò)硬的實(shí)力,不僅速度很快,生成的結(jié)果質(zhì)量也非常高。

為了更直觀地感受該模型的性能,這里編輯進(jìn)行了一項(xiàng)對(duì)比測(cè)驗(yàn)。

實(shí)測(cè)中,編輯使用同一提示詞:

d5BOc5Uuit-800.png

隨后分別讓Gemini 2.5 Pro、DeepSeek-R1及更新后的DeepSeek-V3來(lái)完成這次任務(wù)。

實(shí)驗(yàn)結(jié)果顯示,Gemini 2.5 Pro在輸出質(zhì)量上表現(xiàn)最為出色。

它生成的游戲不僅具備完整的功能按鈕,實(shí)際操作體驗(yàn)也非常良好。

LVp9frrV7Z-800.gif

圖源:Gemini

相比之下,DeepSeek-R1在輸出質(zhì)量上稍遜一籌,生成的游戲雖然能夠運(yùn)行,但在體驗(yàn)卻有所欠缺。

生成的貪吃蛇游戲會(huì)經(jīng)常直接判罰,且無(wú)重新開始的按鈕,只能自行創(chuàng)新網(wǎng)頁(yè)。

7wHk1qzEme-800.gif

圖源:DeepSeek

反觀DeepSeek-V3給出的游戲則更加亮眼,同樣具備了功能性按鈕及正常的游戲操作體驗(yàn),用來(lái)空閑打發(fā)時(shí)間或者摸魚都是一把好手。

Y62pI1EUJa-800.gif

圖源:DeepSeek

在響應(yīng)時(shí)間上,Gemini 2.5 Pro也最為出色。

多次實(shí)驗(yàn)后發(fā)現(xiàn),谷歌Gemini 2.5 Pro的響應(yīng)時(shí)間幾乎都在1分鐘以內(nèi),推理及生成的速度都極快,當(dāng)然這也與這次的任務(wù)比較簡(jiǎn)單有關(guān)聯(lián)。

但DeepSeek方面,R1模型的響應(yīng)速度平均在1-3分鐘之間,V3模型的響應(yīng)速度則不太穩(wěn)定,平均在2分鐘開外。

不過(guò),DeepSeek也有自己的優(yōu)點(diǎn),用DeepSeek生成的網(wǎng)頁(yè)游戲可以一鍵加載,哪怕是部署到本地步驟也十分簡(jiǎn)單。

z1n7RM1oy0-800.pngHlxhbBNmwr-800.png

圖源:DeepSeek

相比之下,Gemini 2.5 Pro生成的游戲部署則較為復(fù)雜。

但對(duì)于那些只需要代碼生成的用戶來(lái)說(shuō),這根本不算什么缺點(diǎn)。

zlk7xTvrxB-800.png

圖源:Gemini

通過(guò)上述對(duì)比實(shí)驗(yàn),我們可以看到,雖然DeepSeek的更新有著顯著進(jìn)步,但在性能及體驗(yàn)上,Gemini 2.5 Pro帶來(lái)的震撼更勝一籌。

當(dāng)然,DeepSeek-R2尚未到來(lái),用早已更新的R1和V3來(lái)與谷歌的推理模型相比顯然不占優(yōu)勢(shì)。

未來(lái)R2與Gemini 2.5 Pro的交鋒才是亮點(diǎn)。

三、OpenAI的文生圖模型,顛覆想象還是營(yíng)銷噱頭?

另一方面,OpenAI此次發(fā)布的GPT-4o文生圖模型,單從官方演示的效果來(lái)看或許也是一款爆炸性顛覆的產(chǎn)品。

官方演示中,給出的提示詞是:

“這是用手機(jī)拍攝的玻璃白板的廣角圖像,拍攝地點(diǎn)是一間俯瞰海灣大橋的房間。視野中可以看到一位女士正在寫字,她身穿一件印有大型OpenAI標(biāo)志的T恤。筆跡看起來(lái)很自然,但有點(diǎn)凌亂,我們可以看到攝影師的倒影?!?/span>

這樣的描述聽起來(lái)十分復(fù)雜,而最后生成的圖像質(zhì)量之高卻令人難以置信。

從反射的畫面到密密麻麻的文字,每一個(gè)細(xì)節(jié)都處理得恰到好處,幾乎無(wú)法讓人相信這是AI生成的圖像。

x8Xnp2mpmH-800.png

圖源:OpenAI

第二步演示則更加驚艷,一句簡(jiǎn)單的“攝影師的自拍照,她轉(zhuǎn)身與他擊掌”,最后得到的圖片不僅保留了原來(lái)的背景,圖片中的人物形象也十分貼合。

可以說(shuō),該模型完全理解了官方給出的提示詞,極大降低了普通用戶的使用門檻。

2mBnPmmATD-800.png

圖源:OpenAI

不過(guò),這里也要暫時(shí)潑大家一盆冷水,正如一些從業(yè)者質(zhì)疑的那樣,這段演示是否由官方特調(diào)還有待考量。

只有在更多用戶實(shí)際體驗(yàn)的檢測(cè)下,才能判斷這款模型是否真的做到了“一句話完美P圖”

但有一點(diǎn)不得不說(shuō),在DeepSeek和Google依然聚焦于基座模型和推理能力的傳統(tǒng)競(jìng)爭(zhēng)時(shí),OpenAI的文生圖模型則徹底跳出了這個(gè)框架。

通過(guò)視覺(jué)內(nèi)容生成,OpenAI開辟了全新的應(yīng)用場(chǎng)景,為行業(yè)帶來(lái)了更大的想象空間。

這種差異化競(jìng)爭(zhēng)的策略不僅避免了與對(duì)手的正面沖突,還為OpenAI又一次開辟了新的市場(chǎng)空間。

隨著技術(shù)的不斷迭代,未來(lái)還將有怎樣的驚喜?讓我們拭目以待。

1、該內(nèi)容為作者獨(dú)立觀點(diǎn),不代表電商派觀點(diǎn)或立場(chǎng),文章為作者本人上傳,版權(quán)歸原作者所有,未經(jīng)允許不得轉(zhuǎn)載。
2、電商號(hào)平臺(tái)僅提供信息存儲(chǔ)服務(wù),如發(fā)現(xiàn)文章、圖片等侵權(quán)行為,侵權(quán)責(zé)任由作者本人承擔(dān)。
3、如對(duì)本稿件有異議或投訴,請(qǐng)聯(lián)系:info@dsb.cn
相關(guān)閱讀
網(wǎng)友:DeepSeek梁文鋒還未出手,更牛逼的還在后面。
敢開源才是真的OpenAI!
3月31日消息,據(jù)AI分析平臺(tái)aitools.xyz,DeepSeek已經(jīng)成為全球增長(zhǎng)最快的AI工具,其每月新增網(wǎng)站訪問(wèn)量已經(jīng)超過(guò)OpenAI的ChatGPT。 報(bào)告稱,DeepSeek 2025年2月訪問(wèn)量達(dá)到5.25億次,超過(guò)ChatGPT 5億次。 目前,DeepSeek市場(chǎng)份額6.58%,僅次于ChatGPT和Canva,二者分別占比43.16%和8.27%。
3月21日消息,零一萬(wàn)物創(chuàng)始人兼CEO 李開復(fù)在參與一檔對(duì)話節(jié)目時(shí)公開表示,DeepSeek掀起的行業(yè)變革徹底顛覆了人工智能行業(yè)的發(fā)展模式,“可能讓OpenAI創(chuàng)始人輾轉(zhuǎn)難眠”。他同時(shí)預(yù)測(cè),中國(guó)市場(chǎng)最終可能只剩下DeepSeek、阿里巴巴和字節(jié)跳動(dòng)三家主要的AI模型公司,其中DeepSeek目前勢(shì)頭最強(qiáng)。
當(dāng)ChatGPT用戶搜索商品時(shí),聊天機(jī)器人會(huì)推薦一些商品圖片和評(píng)論,并附上鏈接,用戶可以通過(guò)這些鏈接直接購(gòu)買商品。目前,該功能僅適用于有限數(shù)量的產(chǎn)品類別,隨著時(shí)間的推移將擴(kuò)展到更多類別。據(jù)用戶反饋,這項(xiàng)最新嵌入的購(gòu)物功能對(duì)ChatGPT的5億活躍用戶以及未登錄的AI聊天機(jī)器人免費(fèi)訪客全部開放。
山姆·奧特曼開始上硬貨。
一場(chǎng)好戲即將上演。
李迎
你好,我是李迎