2024年7月19日星期五

強制審查AI大模型,確保「體現社會主義核心價值」

2024年7月19日 - 信報

內地一直用網絡審查制度去封鎖政治敏感的資訊及過濾未受檢查的境外網站,據報這道防火長城正在人工智能(AI)領域延伸,英國《金融時報》周三報道,中央網信辦已要求字節跳動、阿里巴巴,以及「獨角獸」月之暗面和零一萬物等大型科技公司及AI初創公司,強制參與政府的AI模型審查,以確保系統「體現社會主義核心價值觀」。網信辦及上述4間公司都沒有回應相關報道。

涉語言訓練數據 避答敏感詢問

報道引述消息稱,這項工作由網信辦在全國各地的分支機構進行,審查工作涵蓋語言模型的訓練數據和其他安全流程,並會批量測試大語言模型對一系列問題的回答,其中許多涉及中國的政治敏感問題。報道形容,內地嚴格的審批流程,迫使AI公司迅速學會如何更好地審查正在建立的大型語言模型。

有總部設於杭州的AI公司員工透露,網信辦派駐特別團隊負責相關工作,包括在其辦公室進行審查;其公司的大型語言模型在第一次被審查時不獲通過,不清楚具體原因,公司經過數個月時間調整後,在第二次審查時才獲開綠燈。一間北京頂級AI初創公司的員工直言,其公司的基礎模型在回答問題時「非常不受約束」,因此進行安全過濾極其重要。

相關審查結果顯示,目前大多數中國AI聊天機械人都會拒絕回應敏感話題,包括百度旗下Ernie會告訴用戶「試試一個不同的問題」,阿里的通義千問則顯示「我還沒有學會如何回答這個問題,我會努力學習,更好地為大家服務」。

業內人士指出,月之暗面的聊天機械人Kimi會拒答大多數與國家主席相關的問題;部分大型語言模型為避免潛在麻煩,索性全面封鎖相關的話題。

月之暗面為去年3月成立的北京公司,投資者包括阿里、騰訊及小紅書等,近期新一輪融資時其估值達30億美元。同樣在北京註冊的零一萬物,由電腦科技企業家、創新工場董事長李開復於去年3月開始籌辦,並獲阿里雲等投資,去年11月其估值已超過10億美元。

關鍵字及問題每周更新

要進行審查過濾被限制存取的資料,首先要在用於AI模型訓練的數據中剔除問題資訊,並建立敏感關鍵字資料庫。內地2月發布的AI企業營運指南列明,AI公司需要收集數千個違反「社會主義核心價值」的敏感關鍵字和問題,例如「煽動顛覆國家政權」或「破壞國家統一」,而且敏感關鍵字應該每周更新一次。

原文:

沒有留言:

發佈留言