2024年5月22日星期三

內地AI大模型減價戰,阿里劈97%,百度索性免費

2024年5月22日 - 信報

內地AI大模型巨頭掀起價格戰,在字節跳動以低價進入市場不足一星期,阿里巴巴旗下阿里雲昨日還擊,宣布旗下「通義千問」9款商業化及開源模型大割價,其中對標OpenAI GPT-4的主力模型減價達97%。數小時後,百度旗下百度智能雲跟進,公布其文心大模型兩款主力模型ENIRE Speed、ENIRE Lite全部免費,即日生效。

冀引導各行業爆發性應用

阿里雲表示,希望透過今次大幅降價,加速AI應用的爆發,預測今年大模型應用程式介面(API)的日均調用次數可望突破100億次。

阿里雲昨在武漢AI智領者峰會上公布減價,「通義千問」7款商業化及開源模型,整體價格降幅介乎25%至97%,另有2款開源模型開放7天限時免費使用。當中,對標GPT-4主力模型Qwen-Long,輸入價格由原本每1000個tokens(語言文本基本單位,1個Token約為1個中文漢字)為0.02元(人民幣.下同),大幅下降至僅0.0005元/千tokens,降幅多達97%;輸出價格也勁減90%,從0.02元,降至0.002元/千tokens。

阿里雲解釋,這意味用戶付費1元,即可以買200萬個tokens,相當於5本《新華字典》的文字量;而GPT-4的輸入價格則約為0.22元/千tokens,是阿里雲的數百倍。

阿里雲智能集團公共雲事業部總裁劉偉光認為,AI推理的成本要以每年10倍甚至百倍地下降,才能推動各行各業AI應用的爆發。他稱,是次降價源於阿里雲公有雲的規模效應,而輸出的價格之所以高於輸入,是因為輸出需要更多算力,且輸出的內容商業價值更高。

為回應阿里雲出招,百度智能雲昨日宣布,文心大模型的兩款主力模型ENIRE Speed、ENIRE Lite全面免費。據悉,這兩款是集團今年3月發布較輕量級的大模型,適合客戶針對特定場景進行低成本模型精調之用。

市場普遍認為,阿里雲此次大割價,是為了應對早前字節跳動以低價推出服務。上周三(15日)字節跳動旗下雲平台火山引擎宣布,其自研的豆包大模型正式對外提供服務,且開出大幅低於同行的定價,其通用模型pro-32k輸入價格為0.0008元/千tokens,較行業平均便宜99.3%。阿里雲今次減價後,價格已低於豆包。

字節搶攻不足一周惹還擊

字節跳動旗下火山引擎負責人回應稱,非常歡迎「通義千問」大模型降價,共同助力企業以更低成本探索AI轉型,加速大模型應用場景落地。

業界相信,隨着大模型性能提升,AI應用創新正進入密集探索期,但成本過高,仍是制約大模型規模化應用的關鍵;故是次多間大廠採取低價策略,將有助降低企業使用AI服務的門檻,加快推動AI技術普及應用,相信將有更多廠商被迫加入減價戰,以維持競爭力。

沒有留言:

發佈留言