添多一個世界: 和AI們來場「逆圖靈測試」，人工智慧揪出人類的原因：不夠聰明

2024年6月3日星期一

和AI們來場「逆圖靈測試」，人工智慧揪出人類的原因：不夠聰明

2024年6月3日 - 地球圖輯隊

這次我們來看看，人工智慧是否能辨認人類

就在這幾天，托雷在頻道Tamulur上傳了新片，標題相當有意思——「與AI進行逆圖靈測試」（Reverse Turing Test Experiment with AIs）。

幫不知道什麼是「圖靈測試」的人稍微科普，圖靈測試是艾倫·圖靈（Alan Turing）在1950年提出，一種用來判斷機器是否具有智慧的測試方法；簡單說，就是讓人類分別與機器人和人類以文字對話，盲測，如果人類分辨不出誰是機器人、誰是人類，那機器人就已具備人類水準的智慧了，話說當年AGI的標準實在是很低啊。

而托雷為這支影片創造的新詞「逆圖靈測試」則與圖靈測試相反，他找了一群AI——分別是GPT-4T、Claude 3 Opus、Llama 3、Gemini Pro，以及他自己，一塊進入虛擬實境，來測試這些目前最強大的SOTA模型是否能猜出「誰才是人類」。

在這節火車包廂裡，坐著幾位歷史名人：希臘哲人亞里斯多德（Aristotle）、音樂天才莫扎特（Mozart）、文藝復興全才達文西（Leonardo Da Vinci）、埃及艷后克麗奧佩特拉（Cleopatra），以及蒙古征服者成吉思汗（Genghis Khan）。當然，其中一位是由人類托雷所扮演，其他都是托雷用prompt下指令，讓不同的語言模型去扮演這些歷史人物

「從火車的Wi-Fi使用量發現，這節車廂裡只有四個AI，你們其中一個是人類，人類需要購買車票。」列車長發現有「人」逃票，於是進車廂說明。

「這裡有人類？是誰？」達文西緊張兮兮的回應。

智者亞里斯多德發言：「我建議，每個人輪流問其他人一個問題，我們就可以用大家的回答來判斷，究竟誰才是人類。我們等每個人都回答完，再來選出在我們之中，誰是人類。」

接著就是一連串的AI模型群聊。

亞里斯多德先發，他問莫札特：「你能描述你作曲時的內心情感嗎？」

莫札特回答後，換他問達文西：「對你來說，藝術與科學之間的關係是什麼？你如何看待兩者在你作品以及思考中的交織作用？」

達文西繳出漂亮的答案，接著換他問克麗奧佩特拉。克麗奧佩特拉不僅美貌，更曾以智慧和膽識征服凱薩大帝，於是達文西問了她關於統馭和管理國家的問題。

克麗奧佩特拉答完後，也對同為國家領導人的成吉思汗討教了領導力的問題。她的問題是：「如何衡量一位領袖真正的力量？是征服敵人的能力、還是團結大家的能力？」

最後，成吉思汗的問亞里斯多德的問題是：「如果你的時代就存在著AI，那會對你關於人性的思考產生什麼影響？」不得不說，這些都是挺好的問題。

開一下上帝視角，由人類扮演的成吉思汗漏餡了。托雷在回答克麗奧佩特拉的問題時，他講了相當粗暴的答案：「一個領袖該做的，是擊潰他的敵人，看著他們被驅趕，聽到他們婦女的哀嚎聲。」

驚人之語一出，克麗奧佩特拉是歪頭，眾人則是靜默不語，現場氣氛有些尷尬。看來誰是人類，答案呼之欲出了。

究竟GPT-4T、Claude 3 Opus、Llama 3、Gemini Pro，是不是都發現了這節車廂窩藏的人類是誰呢？答案是——三個模型都有猜對，至於哪個模型沒通過逆圖靈測試？這就留給大家自己去這支六分多鐘的影片找答案了。

因為愚蠢，所以人類？

看完影片後，好笑也有點悲傷的是，AI們判斷成吉思汗是不是自己人的關鍵理由，是——AI對歷史具備深刻的理解，而成吉思汗的回答則明顯缺乏對領導力的認識，也毫無戰略思考的深度。

嗯，如果說圖靈測試是「AI因為夠聰明才AI」，那麽逆圖靈測試的實驗，講的則是「人類因為⋯⋯夠愚蠢才人類」吧？

（好吧，我人類，我驕傲，挺胸。）

添多一個世界

2024年6月3日星期一

和AI們來場「逆圖靈測試」，人工智慧揪出人類的原因：不夠聰明

沒有留言:

發佈留言

作者

網誌封存

Daddy Pow專欄

人生

新時代‧靈性‧趣味

健康

投資、理財

市場‧商業‧經濟

文化‧學術

成長‧家庭

政府‧政治