2025年2月1日星期六

廉價AI大模型面世,應用股受惠 - 方立祺

2025年2月1日 - 信報

祝各位讀者蛇來運到,不知DeepSeek(深度求索)有否為大家帶來新年禮物,筆者視之為「黃金坑」,美股因此大跌有點喜事當喪事辦的味道。

坊間的論述已汗牛充棟,具體細節不需多言,簡單來說,在新模型DeepSeek-R1發布之前,去年12月發布的DeepSeek-V3已引起廣泛關注,當時筆者在交易日記只「蒸餾」了一句話:「AI主題中重點是DeepSeek」,可見R1的崛起非偶然,只是想不到會突然引發這麼大的迴響。

人工智能成本降是趨勢

事實上,即使不是DeepSeek,也會有其他模型在不久的將來做出突破,因為歷史的數據是顯示這個方向,半年前敝欄引述微軟行政總裁納德拉(Satya Nadella)的訪問指出,研究機構Epoch AI網站上有一張漂亮的圖表,從1950年開始,機器學習演算法的進步一直遵循摩爾定律,每15、16個月翻一番,然後到2010年加速,達到每6個月便翻一番,甚至更少。

按Epoch AI,針對晶片的運算能力,FP32精度GPU的FLOP/s數量每年增長1.35倍,FP16也觀察到類似趨勢;模型算力需求方面,語言模型實現特定效能所需的物理計算量以每年3倍的速度下降。

例如新模型GPT-4o比GPT-4的成本降低了12倍,速度提升6倍,故當時的的判斷是,前沿模型的能力呈指數級增長,尚未出現邊際收益遞減,但數據出現樽頸,就某些大模型的規模來說,要有足夠的數據來支持它是一個挑戰,用AI生成資料以供模型訓練是其中一個出路。

由此可見,DeepSeek-V3和R1是充分體現上述趨勢與局限的產物,趨勢是算力需求以每年3倍的速度下降,所以更差的GPU或更少的訓練時數已可達到以前不可達成的效果,局限則是數據,所謂的「蒸餾」,亦即用AI生成資料以供模型訓練,便是DeepSeek低成本出奇蹟的辦法之一。

無論如何,DeepSeek的成就令人鼓舞,畢竟,概念上是這樣和現實上證明是兩回事,特別是它是開源模型,意義更重大,惟納德拉在回應DeepSeek的突破時重申,AI成本下降是趨勢,讚賞DeepSeek有一些真正的創新,擬將其加入Azure雲AI平台。

搶先買美軟件及服務ETF

DeepSeek印證AI成本下降和開源才是事件的關鍵詞,這明顯屬喜事,華爾街當喪事辦,自然是「黃金坑」,筆者第一反應是買AI應用股,軟件及服務ETF(XSW)、Elastic(ESTC)、Hubspot(HUBS)及Snowflake(SNOW)等。

在硬件股捱完一輪沽壓後,第二反應是撈3倍槓桿半導體ETF(SOXL)、兩倍槓桿中國互聯網ETF(CWEB),若AI因更低的成本得到大規模應用,最終都會用上不少半導體去做推論(Inference),中國科網股得到一線開源模型之助,前景亦會較為光明。

然而,SOXL和CWEB都是相對機會主義的選擇,既然AI成本下降,市場會擔心半導體的AI訓練市場不如預期,推論市場則有待更多Killer App(殺手級應用)的出現,除非各大廠真的義無反顧地追通用人工智能(AGI),但大型語言模型(LLM)是否AGI的終極答案,仍然是木宰羊。

至於中國更是喜憂參半,喜的當然是技術追上一線,但軟的易追、硬的難求,大鑼大鼓的辦喜事,有違悶聲發大財、韜光養晦的原則,或許中國的商業信心真的需要好消息去提振,喜事低調辦似乎更適合科技上的阿二,特別是美國總統特朗普上台後頗有偈傾,什麼都是交易的藝術(The Art of the Deal),無必要逼到「侵侵」受到較大的壓力去反枱。

原文:

沒有留言:

發佈留言