2025年2月1日星期六

DeepSeek背後不管的管理文化 - 林護仁

2025年2月1日 - 信報

商業潮流變得比時裝潮流更快,兩個月前大家還在捧讀《英偉達之道》、學習Nvidia的成功竅門,但隨着國產「天才AI程式」DeepSeek橫空出世、震動全球,人們現在最想知道的是,該程式的研發商、杭州「深度求索」公司僅聘請百多名「天才青少年」,只用了500多萬美元,為何便能與美國巨企的千億美元程式一較高下?事實上,該公司頗為神秘、非常低調,其創辦人、來自廣東湛江的梁文鋒近年只曾兩次接受專訪,從中可窺見這家公司「不管理的管理」文化特色。

梁文鋒生於1985年,自小便是學霸,17歲入讀浙江大學,主攻機器視覺研究。但他畢業後並非立刻投身科研,卻利用機器學習和量化技術「炒股」,其創辦的「幻方量化」對沖基金之資金規模一度超過1000億元人民幣,被稱為A股市場「量化四大天王」之一。

及至AI熱潮興起後,梁文鋒於2023年5月在杭州成立「深度求索」公司,親任CEO,投入研發AI大模型。該公司於2024年12月26日發布AI程式DeepSeek V3版本,據報只花了550萬美元訓練,其表現相較於OpenAI、Alphabet、Meta等美國巨企斥千億美元打造的同類程式,卻顯得有過之而無不及。

深度求索僅百多員工  只聘天才

DeepSeek「用蔗渣價錢做出燒鵝味道」,其橫空出世震撼全球科技業界,不但拖累Nvidia、台積電等「AI概念股」一度股價暴跌,還被部分人視之為AI時代的「史普尼克時刻」(Sputnik Moment,源自蘇聯於1957年發射第一顆人造衞星Sputnik,令西方世界震驚和恐慌,引發「太空競賽」)。

因此,「深度求索」這家成立僅一年半、只有百多名員工的公司引起各界高度好奇,很多人都想知道該公司何以「締造奇蹟」。不過,梁文鋒向來非常低調,他近年只曾兩次接受媒體專訪,第一次正是2023年5月份、「深度求索」剛宣布成立之時;第二次則是2024年7月份、DeekSeek V2版本發布之後。從該兩次罕有的專訪中,我們可窺見「深度求索」充滿特色的管理文化和用人之道。

首先,正如不少媒體報道提到,「深度求索」在招聘上奉行「天才路線」,只招攬「最頂尖1%天才」,主要來自清華和北大,還須於公開競賽贏過金獎,就連銀獎得主也不予考慮。

有趣的是,雖然很多人認為AI領域最頂級精英絕大部分身處美國,「深度求索」卻屬100%「本土化」,並無任何「海歸」,亦未從美國聘請外籍人才。梁文鋒解釋:「如果追求短期目標,找現成有經驗的人是對的。但如果看長遠,經驗就沒那麼重要,基礎能力、創造性、熱愛等更重要。從這個角度看,國內合適的候選人就不少……(全球)前50位頂尖人才可能(目前)不在中國,但也許我們能自己打造這樣的人。」

重才能輕經驗  直探問題本質

事實上,「深度求索」一大特色正是重才能、輕經驗,梁文鋒認為:「不一定是做過這件事的人才能做這件事,我們招人有條原則是看能力,而不是看經驗。我們的核心技術崗位,基本以應屆和畢業一兩年的人為主。」他進一步解釋:「做一件事,有經驗的人會不假思索告訴你『應該這樣做』,但沒有經驗的人會反覆摸索、很認真去想應該怎麼做,然後找到一個符合當前實際情況的解決辦法。」某程度上,梁文鋒所講的這種「拋開經驗直探問題本質」的做法,有點像馬斯克(Elon Musk)很倚重的「第一性原理」。

換言之,「深度求索」獨特模式的第一步是「找來一批最頂尖、沒經驗的年輕天才」,第二步則要讓這批「天才」產出成果。梁文鋒奉行「不管理的管理」:「我們的總結是,創新需要盡可能少的干預和管理,讓每個人有自由發揮的空間和試錯機會。創新往往都是自己產生的,不是刻意安排的,更不是教出來的。」

「深度求索」甚至連「任務」和關鍵績效指標(KPI)都沒有,亦不會「由上而下」設置崗位分工:「每個人有自己獨特的成長經歷,都是自備想法的,不需要push他。探索過程中,他遇到問題,自己就會拉人討論。不過當一個idea顯示出潛力,我們也會自上而下地去調配資源。」

當然,這也不代表「深度求索」屬於漫無方向的「無人駕駛」。梁文鋒認為,最重要是在招聘之時,便確保員工和公司擁有同一個宏大目標,以及價值觀一致;待員工入職後,便透過企業文化維持步調一致。梁文鋒定出大方向,讓「天才」們自行發揮:「交給他重要的事,並且不干預他,讓他自己想辦法。」

DeepSeek這次能夠憑Multi-Head Latent Attention(MLA)架構取得突破性成果,正是源自其中一位「天才」靈感一閃。梁文鋒透露:「在總結出Attention架構的一些主流變遷法則後,他(該員工)突發奇想去設計一個替代方案。不過從想法到落地,中間是漫長的過程。我們為此組了一個team,花了幾個月時間才跑通。」

講到底,梁文鋒招攬人才最看重三點:熱愛、扎實的基礎能力、年輕。「其他都沒那麼重要,他們的熱情通常會表現出來,因為他真的很想做這件事,所以這些人往往同時也在找你……不是所有人都能瘋狂一輩子,但大部分人,在他年輕的那些年,可以完全沒有功利目的,投入地去做一件事……很多人對做研究的渴望,遠超對錢的在意。」

經驗和慣性會束縛創新

「深度求索」模式如此特別,底裏有其原因。梁文鋒認為,市場不斷變化,所謂「大廠」建基於上一個時代、曾經行之有效的管理模式,已不能適應AI時代:「很多大公司的組織結構已經不能快速回應和快速做事,而且他們很容易讓之前的經驗和慣性成為束縛,而這波AI新浪潮之下,一定會有一批新公司誕生。」

當然,「深度求索」雖然於短時間內以極低成本做出舉世震驚的成績,卻不代表該公司的模式就是金科玉律。正如梁文鋒所講,在不同的時代解決不同的問題,都要有相應的組織結構和管理文化。在AI時代,「深度求索」暫時取得的成功經驗值得借鑑。

原文:

沒有留言:

發佈留言