2025年7月11日 - 信報
在許多企業與組織中,領導力往往被視為團隊表現的關鍵,但真正能夠準確衡量一個人是否具備領導能力,卻始終是一項艱巨挑戰。領導才能並非單靠學歷、年齡或過往履歷便能判斷,而傳統上要有效評估領導力,常需依賴昂貴且耗時的實地觀察,例如把同一位參與者多次隨機分派到不同團隊,觀察其對團隊表現的實質影響。然而,這種方式無論在人力、成本還是時間上皆有極大限制。
溝通同理心可量化
哈佛甘迺迪學院的幾位學者近期發表一項實驗性研究,正是以此問題為出發點【註】。他們設計了一個名為「AI領導力測驗」的實驗,讓人類參與者帶領由大型語言模型(LLM)所驅動的AI代理人團隊,解決一系列需要團隊合作的複雜問題,然後將其表現與他們在帶領真人團隊時的實際表現做比較。
研究結果顯示,參與者在AI測驗中的表現,與其在真人團隊中的領導效果高度一致,兩者之間的相關系數高達0.81(1為最高),若控制住輸入變數(如流體智力、打字速度、任務技能)後,仍有0.69的高度一致性。亦即是說,AI測驗不僅能反映參與者在「硬實力」方面的能力,更能捕捉到其「軟實力」──例如溝通、同理心、決策策略等,這些正是傳統上難以量化的領導特質。
更重要的是,AI與真人團隊中所呈現的成功領導特徵極為相似:表現優異的領導者傾向於提出更多問題、鼓勵團隊進行輪流發言,以及使用集體導向的語言(如「我們」、「一起」)。而年齡、性別、教育背景等變項,則對領導成效無顯著影響。
在成本方面,AI版本測驗明顯優於真人測驗。根據研究資料,進行一位參與者的真人團隊評估需花費約114美元與兩位研究人員的協同監控;相較之下,AI版本僅需約23美元,並且幾乎可完全自動化進行。除此之外,AI代理人不受時間與人力安排限制,可隨時重複進行,極大降低了操作門檻。
這結果代表什麼?首先,在人才甄選層面,企業與機構可以透過這類AI測驗,公平且高效地辨識潛在的優秀領導者,減少過度依賴面試印象或背景條件。其次,在領導力培訓領域,相關教育計劃可利用AI測驗作為評量工具,驗證培訓成效,提升學習目標的明確性與可衡量性。最後,在學術研究領域,AI代理人有機會成為人力稀缺時的替代樣本,擴大團隊動力與組織行為研究的實驗規模與深度。
低成本高效率 仍難取代真人
儘管結果令人鼓舞,但研究團隊亦坦言AI測驗與真人情景仍有差異。例如,在真人團隊中,正向情緒用語(如讚賞、鼓勵)顯著提升團隊表現,但在AI團隊中則無明顯效果。此外,部分參與者表示,真人隊員在資訊篩選與策略建議方面更具主動性與靈活性,這些目前仍難以完全由AI模擬。
此外,AI代理人的「行為多樣性」仍然有限。目前的大型語言模型雖已具備基本語言能力與互動邏輯,但與人類個體在價值觀、經驗與情緒表達上的差異,仍難以完全反映團隊互動中的多元動態。
總括而言,這項研究提供了一項具潛力的「替代方法」:在無法大量動員真人團隊進行評估的情況下,AI代理人可以成為成本低廉、效率高且具科學基礎的測試工具。雖然無法完全取代真實互動,但在甄選、訓練、研究等應用場景中,AI測驗無疑是一項有價值的補充。
在一個愈來愈重視「軟實力」的時代,若我們能透過技術手段更精確地發掘潛在領袖,不但能提升組織效能,也可能帶來更公平、更多元的用人環境。
作者為維克森林大學經濟系副教授
註:Weidmann, Ben, Yixian Xu, and David J. Deming(2025). "Measuring Human Leadership Skills with AI Agents." NBER Working Paper No. 33662. National Bureau of Economic Research.
來源:
.jpg)
沒有留言:
發佈留言