添多一個世界: 內地AI大模型減價戰，阿里劈97%，百度索性免費

2024年5月22日星期三

內地AI大模型減價戰，阿里劈97%，百度索性免費

2024年5月22日 - 信報

內地AI大模型巨頭掀起價格戰，在字節跳動以低價進入市場不足一星期，阿里巴巴旗下阿里雲昨日還擊，宣布旗下「通義千問」9款商業化及開源模型大割價，其中對標OpenAI GPT-4的主力模型減價達97%。數小時後，百度旗下百度智能雲跟進，公布其文心大模型兩款主力模型ENIRE Speed、ENIRE Lite全部免費，即日生效。

冀引導各行業爆發性應用

阿里雲表示，希望透過今次大幅降價，加速AI應用的爆發，預測今年大模型應用程式介面（API）的日均調用次數可望突破100億次。

阿里雲昨在武漢AI智領者峰會上公布減價，「通義千問」7款商業化及開源模型，整體價格降幅介乎25%至97%，另有2款開源模型開放7天限時免費使用。當中，對標GPT-4主力模型Qwen-Long，輸入價格由原本每1000個tokens（語言文本基本單位，1個Token約為1個中文漢字）為0.02元（人民幣．下同），大幅下降至僅0.0005元/千tokens，降幅多達97%；輸出價格也勁減90%，從0.02元，降至0.002元/千tokens。

阿里雲解釋，這意味用戶付費1元，即可以買200萬個tokens，相當於5本《新華字典》的文字量；而GPT-4的輸入價格則約為0.22元/千tokens，是阿里雲的數百倍。

阿里雲智能集團公共雲事業部總裁劉偉光認為，AI推理的成本要以每年10倍甚至百倍地下降，才能推動各行各業AI應用的爆發。他稱，是次降價源於阿里雲公有雲的規模效應，而輸出的價格之所以高於輸入，是因為輸出需要更多算力，且輸出的內容商業價值更高。

為回應阿里雲出招，百度智能雲昨日宣布，文心大模型的兩款主力模型ENIRE Speed、ENIRE Lite全面免費。據悉，這兩款是集團今年3月發布較輕量級的大模型，適合客戶針對特定場景進行低成本模型精調之用。

市場普遍認為，阿里雲此次大割價，是為了應對早前字節跳動以低價推出服務。上周三（15日）字節跳動旗下雲平台火山引擎宣布，其自研的豆包大模型正式對外提供服務，且開出大幅低於同行的定價，其通用模型pro-32k輸入價格為0.0008元/千tokens，較行業平均便宜99.3%。阿里雲今次減價後，價格已低於豆包。

字節搶攻不足一周惹還擊

字節跳動旗下火山引擎負責人回應稱，非常歡迎「通義千問」大模型降價，共同助力企業以更低成本探索AI轉型，加速大模型應用場景落地。

業界相信，隨着大模型性能提升，AI應用創新正進入密集探索期，但成本過高，仍是制約大模型規模化應用的關鍵；故是次多間大廠採取低價策略，將有助降低企業使用AI服務的門檻，加快推動AI技術普及應用，相信將有更多廠商被迫加入減價戰，以維持競爭力。

添多一個世界

2024年5月22日星期三

內地AI大模型減價戰，阿里劈97%，百度索性免費

沒有留言:

發佈留言

作者

網誌封存

Daddy Pow專欄

人生

新時代‧靈性‧趣味

健康

投資、理財

市場‧商業‧經濟

文化‧學術

成長‧家庭

政府‧政治