快科技12月29日消息,小米在大模型賽場,頻頻按下快進(jìn)鍵。
先是,“雷軍親自重金挖人,開出千萬年薪”的風(fēng)傳。
據(jù)國內(nèi)媒體報道,雷軍開出千萬年薪招攬了一位95后AI天才少女——DeepSeek開源大模型DeepSeek-V2的關(guān)鍵開發(fā)者之一羅福莉。
在B站上,羅福莉的ID是“我不是AI小蘿莉”,其簡介為“一位95后從事AI研究的小蘿莉,從北大碩士畢業(yè),目前在阿里達(dá)摩院工作。”
公開資料顯示,羅福莉碩士畢業(yè)于北京大學(xué)計(jì)算語言學(xué)專業(yè),曾在阿里巴巴達(dá)摩院任職,因在國際頂會發(fā)表8篇論文而走紅。
加入小米后,羅福莉或?qū)⒐┞氂谛∶譇I實(shí)驗(yàn)室,領(lǐng)導(dǎo)小米大模型團(tuán)隊(duì)。
羅福莉出生在四川小城一個普通家庭,甚至在上大學(xué)之前幾乎沒接觸過電腦。本科就讀于北京師范大學(xué),保研進(jìn)入北京大學(xué)計(jì)算語言學(xué)研究所。
2019年,羅福莉在NLP國際頂會ACL上發(fā)表8篇論文(其中2篇一作),迅速登上知乎熱搜而走紅。她提出的詞義消歧方法,和文本風(fēng)格轉(zhuǎn)換框架等成果,推動了NLP技術(shù)發(fā)展,因而成為“天才AI少女”。
2022 年,羅福莉離開阿里,在 DeepSeek 擔(dān)任深度學(xué)習(xí)研究員,參與了 DeepSeek 的 MoE 大模型 DeepSeek-V2 的開發(fā)。
知情人士稱,雷軍認(rèn)為小米在大模型領(lǐng)域發(fā)力太晚,于是親自挖人,重金招募能夠領(lǐng)軍小米大模型的人才,支付的薪酬水平在千萬元級別。
而后,又曝出小米集團(tuán)AI大模型研發(fā)投入進(jìn)一步增加,用于訓(xùn)練和優(yōu)化其AI大模型的GPU萬卡集群正在搭建中。
據(jù)界面新聞報道,小米正在著手搭建自己的GPU萬卡集群,將對AI大模型大力投入,小米大模型團(tuán)隊(duì)在成立時已有6500張GPU資源。
知情人士稱,該計(jì)劃已施行數(shù)月之久,雷軍在其中扮演了重要的領(lǐng)導(dǎo)角色。“在AI硬件這件事情上,最核心的是手機(jī)而不是眼鏡,小米在這個領(lǐng)域不‘all in’是不可能的。”
據(jù)了解,去年4月,小米正式組建AI實(shí)驗(yàn)室大模型團(tuán)隊(duì),任命欒劍擔(dān)任大模型團(tuán)隊(duì)負(fù)責(zé)人,向小米技術(shù)委員會副主席、AI實(shí)驗(yàn)室主任王斌匯報。
對于小米對大模型和AIGC看法的問題,雷軍表示,小米在AI領(lǐng)域已經(jīng)耕耘多年,有AI實(shí)驗(yàn)室、小愛同學(xué)、自動駕駛等團(tuán)隊(duì)。
“對于大模型,我們當(dāng)然會全力以赴,堅(jiān)決擁抱。我們正在研發(fā)一些有趣的技術(shù)和產(chǎn)品,等我們打磨好了,再給大家展示。”雷軍說。
對于小米而言,手機(jī)影像、汽車性能等故事已經(jīng)被雷軍和高管們講得七七八八。
而同行紛紛發(fā)力AI和大模型,小米再不出牌就太被動。榮耀、華為、OV等幾乎清一色將AI提升到較高優(yōu)先級,理想CEO李想直接宣布由汽車公司轉(zhuǎn)型為AI公司。還有消息稱,字節(jié)跳動在AI上投入巨大,2024年資本開支達(dá)到800億元,接近百度、阿里、騰訊三家的總和(約1000億元)。
有媒體認(rèn)為,AI大模型之于小米,確實(shí)到了該拼產(chǎn)出、該講新故事的階段。