2024年8月26日星期一

輝達「霸權」兩大隱憂 - 王華

2024年8月26日 - 信報

美國晶片製造廠輝達(Nvidia)是與雲端客戶和整個產業鏈競爭,暫時領先一籌,但這種姿態也逼出同行強烈的反抗。另外,繪圖處理器(GPU)無序擴張是否必要及持續有效呢?輝達能否繼續創新高?

產業鏈內反抗力量被低估

我們先討論競爭因素,因為大部分人比較容易從對比之中理解。一般人對輝達GPU的理解,是指和AMD的GPU或CPU競爭,或頂多知道最大的對手是輝達雲端客戶自家研發的晶片(例如Google的TPU),這個當然都是事實,但產業鏈內的反抗力量可能被遠遠低估。大眾可能遠遠小看了Google的能力,Google繼續依賴軟硬體及開發系統底層融合的能力,企圖突破CUDA(輝達研發的計算平台與程式設計模型)霸權。

最後,亦是最重要的,幾何級數式地擴張GPU的能力以達致通用人工智能的路徑是否真可行? 讓我們展開來說:

第一,我認為大部分人可能忽略了商業模式變化所產生的競爭。輝達不止積極引入自家製的CPU及網通晶片,而且更直接挑選板卡和Tray上的周邊晶片來提供全套方案,說得再清楚一點,輝達所提供的整套晶片組,除了自家的GPU、Grace CPU、DPU外,還傾向在其板卡及Tray上選定其他模擬和數位晶片,以代工模式(鴻海集團的工業富聯或緯創)把這些輔助晶片放在板卡及Tray上賣給雲端伺服器製造商(如鴻海或廣達)。

即是說,整套方案及晶片組無論是不是輝達品牌,都有可能由輝達集中提供,你可以說這標準化的模塊對雲端客戶來說,可能是品質更穩定,為成本更低的工板方法。但是,這令原本透過客制化獲取較高毛利的周邊晶片廠家非常不爽。

輝達對這些晶片同業形成了強大的壓力,無論是直接競爭的產品或是其周邊的晶片產品,因為輝達嘗試打破這些周邊晶片的慣常供應鏈,嘗試以渴市的GPU主晶片主導整個GPU板卡及Tray內晶片的產業鏈,因此會引致更多的晶片公司(如博通〔Broadcom〕、Marvell)加入協助雲端廠家(如Google和Meta)客製化整套AI晶片。

其實,雲端廠家也一直被脅迫投入巨大的資本開支,在未能完全商業化之前,仍要投入巨額資金升級他們的數據中心,而且愈買愈貴,AI系統內愈來愈多輝達對晶片組的主導權。當然,你亦可以將此解讀為輝達核心競爭力的延伸。

第二,長倉基金界主要的辯論是Scaling Law(尺度定律,意指模型的最終性能主要與計算量、模型參數量和訓練數據量三者的大小相關)是否依然可以走下去,而且仍會是幾何級數的上升?CUDA、NVLink、CoWoS所形成的護城河,已經深深造就了輝達的成功。這些都是市場已大致反映的因素。

GPU無序擴張前設受衝擊

麻省理工學院(MIT)6月時在Nature期刊上發表報告,顯示了語言不是思維,這份強而有力的報告可能震撼了對腦科學有研究的投資者,但時間慢慢過去,大部分人又開始忘記了這精闢有力的分析。我認為,MIT這個研究正在衝擊一個GPU需要無序擴張的大前設,就是所謂的「大力出奇蹟」(emergent property)。

我個人和很多科學家相似,比較着重仿腦模型路線圖,但我已在過去一、兩年提及人類右腦以多維度關連能力為主,大型語言模型(LLM)幾乎沒有人類左腦的高低維度切換能力,因此很難有因果式If…then…else邏輯模式。即是說,不斷擴展平衡運算的GPU,不可以最終提升理解力。

如果這個說法是對的,那麼用GPU資本開支高速擴張而產生的邊際效益就會逐漸減慢,因此日後毋須要幾何級數地擴張GPU能力。

輝達股價稱王當然有很多原因,這些原因也大量被媒體及投資報告宣傳,但是市場似乎忽略了以上兩點隱憂,故此我們需要密切觀察這兩點的動態變化。

王華(Fred)為易方資本創辦人及投資總監

原文:

沒有留言:

發佈留言