2024年12月31日 - 信報
領導小米大模型團隊
羅福莉被喻為95後AI「天才少女」。據公開資料顯示,她本科就讀於北京師範大學電腦專業,碩士畢業於北京大學電腦語言學專業。她2019年在北大讀碩士時,因在人工智能領域頂尖國際會議ACL發表了8篇論文,從而登上知乎熱搜。
碩士畢業後,羅福莉進入阿里達摩院做人工智能研究,從事預訓練語言模型相關工作,負責阿里達摩院AliceMind開源項目,主導開發多語言預訓練模型VECO。2022年,她加入幻方量化從事深度學習相關策略建模與演算法研究,後來跳槽到DeepSeek擔任深度學習研究員,參與研發MoE大模型DeepSeek-V2。
小米擬以重金招攬羅福莉,是公司全面發力AI大模型的其中一個動作。早前有報道指出,小米正大力投入AI大模型,並着手搭建自家GPU萬卡集群。據悉,其大模型團隊在成立時已有6500張圖像處理器(GPU)資源。
原文:
沒有留言:
發佈留言