周鴻祎談DeepSeek成功原因:資源緊張但足夠聚焦
2月4日消息,周鴻祎日前發(fā)文談到DeepSeek能夠取得巨大技術(shù)突破的原因。周鴻祎認為,首先在人才策略上,DeepSeek研究人員都是年輕人,且為國內(nèi)名校碩博畢業(yè)五年內(nèi);其次,組織架構(gòu)上,DeepSeek是扁平研究的文化,團隊一百多人,只有梁文鋒、小組長和一線員工三層,并且很多組長不打績效,不會過度分工;第三,梁文鋒對創(chuàng)新的渴求很高,鼓勵突破式創(chuàng)新。而且DeepSeek用自己的錢,“不用看任何人臉色”;第四,目標,DeepSeek最重要的是專注,它的資源很緊張,但是足夠聚焦。

圖源:周鴻祎微博
以下是周鴻祎全文(有部分刪改):
很多人問我說為什么deepseek能取得如此大的技術(shù)突破,以至于以一己之力撼動了全球的ai工業(yè)。別的公司為什么研究不出來?
我覺得分成這么幾點吧。
第一,人才策略上,deepseek的研究人員是清一色的年輕人,都是國內(nèi)名校碩博畢業(yè)五年內(nèi)的。梁文峰也說過自己的招聘標準,聰明加熱愛,不要經(jīng)驗多的,與大廠要經(jīng)驗完全不同,沒有行業(yè)老人,沒有十年以上所謂的資深ai研究員。因為大模型17年才出來,國內(nèi)正式研究大模型23 年才開始,所以以前積累的所謂的人工智能經(jīng)驗,什么自然語言處理經(jīng)驗,基本都是負資產(chǎn)。很多大廠的老研究人員因為有歷史的包袱,還停留在哪里不懂就標注哪里的階段,沒有scaling規(guī)?;睦砟睢?/p>
不客氣的講,在巨大的技術(shù)變革面前,經(jīng)驗更多的是束縛,一張白紙加上第一性原理才是創(chuàng)新的源頭。
第二,組織結(jié)構(gòu)上,是扁平化研究的文化,deepseek團隊也就一百來人,就三層,梁文峰、小組長和一線員工,并且很多組長也不打績效,主要協(xié)調(diào)下面的資源,也不會過度分工,大家一起為最終模型的效果負責(zé)。日常都在一些群里討論,主打一個自由寬松的研究風(fēng)格。
反觀互聯(lián)網(wǎng)大廠,一線到一把手少的五層多的八層,傳話就夠累的,更別提高效決策了。分工也分的特別細,就像我要吃個炒雞蛋,有人打蛋,有人切蔥花,有人倒油,有人架鍋,有人炒蛋,還有人端盤子。分工分的細呢就導(dǎo)致每個人都不對結(jié)果負責(zé),每個人都要背一個自己的kpi,短期壓力很大,即使有能力也沒有勇氣創(chuàng)新,半年沒產(chǎn)出就要給你降級了。
那為什么創(chuàng)業(yè)公司也不行呢?那就要聊聊文化。
其實公司的文化核心就是老板的文化,在小公司更是如此。梁峰對創(chuàng)新的渴求很高,小創(chuàng)新他根本看不上,會鼓勵突破式創(chuàng)新。同時也親自為高風(fēng)險負責(zé),失敗了也不用你背鍋。而其他公司哪個老板能做到呢?
這里還有一個重要的點,deepseek用自己的錢,不用看任何人臉色,就不用被VC或者CEO牽著鼻子轉(zhuǎn),想咋干就咋干。所以一個懂技術(shù)、有理想、財富自由的老板才是核心。
第四個,目標,deepseek最重要的是專注。其實deepseek的資源是非常緊張的,應(yīng)該也就一萬來張卡吧,肯定不止兩千張卡了,但是它足夠聚焦。

圖源:周鴻祎微博
2、電商號平臺僅提供信息存儲服務(wù),如發(fā)現(xiàn)文章、圖片等侵權(quán)行為,侵權(quán)責(zé)任由作者本人承擔(dān)。
3、如對本稿件有異議或投訴,請聯(lián)系:info@dsb.cn
