12月17日,在2025小米“人車家全生態合作夥伴大會”上,有“天才少女”之稱的羅福莉,完成了加入小米之後的首次公開演講,並詳述了小米在大模型領域的最新進展。
公開資料顯示,羅福莉是一位95後ai研究者,碩士期間曾在國際頂級會議acl上發表多篇論文,畢業後加入阿里巴巴達摩院,主導開發了多語言預訓練模型veco。之後,羅福莉轉戰深度搜索,是moe大模型deepseek-v2的關鍵開發者之一。2024年年底,有報道稱,羅福莉被小米集團創始人雷軍以千萬年薪挖走,或將擔任小米ai實驗室的大模型團隊負責人。
“大模型通過語言的爆發,通過scaling(擴展)算力和數據,從而理解了人類的思維和對世界的理解。”
此次公開演講中,羅福莉以小米mimo大模型負責人亮相。她表示,小米從語言出發,構建了全新一代面向agent(智能體)的基座模型——mimo-v2-flash。
mimo-v2-flash:成本更低,速度更快
“mimo-v2-flash的總參數為309b,激活參數只有15b。但它的代碼能力和agent能力在世界級公開公正的評估榜單上,已經進入了全球開源模型top 1-2的行列。”
羅福莉表示,基本上,mimo-v2-flash大部分評估基準已經超過或者與deepseek-v3、kimi、qwen等模型相當,而這些模型的總參數量通常是mimo-v2-flash的兩倍到三倍。
據羅福莉介紹,在推理價格和推理速度方面,mimo-v2-flash比deepseek-v3.2,更便宜一點,但推理速度大概是其的三倍。“再比如gemini 2.5 pro,雖然綜合性能相當,且推理速度差不多,但gemini 2.5 pro的推理成本比 mimo-v2-flash貴了整整20倍。”
目前,mimo-v2-flash已經開源了所有模型權重,並同步了技術報告細節,提供了api供開發者接入web coding ide。
“雖然現在的大模型能聊天、能寫代碼,但我相信大家還是不放心把身邊複雜的任務交給它。我認為真正的下一代智能體系統,不應該只是一個語言模擬器,而是需要跟世界共存。”
羅福莉表示,下一代智能體必須具備兩個潛能:第一,從“回答問題”變成“完成任務”。這不僅需要記憶、推理、規劃能力,更需要一個omni(全模態)的感知能力。有了這個基礎,模型才能無縫嵌入到像眼鏡這樣的智能終端,融入我們的生活流。
第二,構建物理模型。現有大模型本質上是用算力的“暴力美學”攻克了頂層的語言和第二層的強化學習,但跳過了中間對世界的感知和模擬,以及底層的實體交互。這就是為什麼大模型能做奧數、模仿莎士比亞,卻不懂重力等物理法則,經常產生具身幻覺。
因此,ai進化的下一個起點,一定要有一個可以跟真實環境交互的物理模型。這意味着ai能力的本質跨越——不僅僅是看懂畫面,而是理解背後的物理規律;不僅僅是處理文本,而是推演世界的運作邏輯。
未來五年,研發資金投入2000億元
“小米未來五年將在研發上投入2000億元,長期目標是成為全球硬核科技的引領者。”
小米集團總裁盧偉冰表示,具體到今年,預計小米研發投入將達到320-330億元,2026年預計投入約400億。
據盧偉冰介紹,今年4月以來,小米陸續推出了xiaomi mimo語言、多模態、語音系列基座大模型,並面向全球開發者開源;11月,小米還發布了智能家居未來探索方案xiaomi miloco和具身大模型mimo-embodied,同樣面向全球開發者全面開源。
小米專為物聯網領域定製的輕量化操作系統xiaomi vela,開源版本openvela此前已在github、gitee、gitcode三大平台全面開源,目前,openvela全球合作夥伴已突破100家,深度賦能1500個種類產品,搭載xiaomi vela系統設備數已超過1.6億台。
此外,小米全球月活躍用戶數達到7.42億;硬件生態方面,小米aiot平台連接設備數達到10.4億,硬件合作夥伴數量突破15000家;軟件生態方面,小米全球開發者規模達到120萬,國內應用生態每月應用分發量突破11億。
在此基礎上,小米汽車cariot宣布已向汽車行業全面開放,為汽車廠商和硬件製造夥伴提供統一的生態硬件接口、車載生態件產品。
據大會最新披露,目前cariot已開放品類超過30種,並與比亞迪、廣汽豐田等4家車企達成深度合作。(文 | 科技潛線,作者 | 饒翔宇 編輯 | 鍾毅)
更多精彩內容,關注鈦媒體微信號(id:taimeiti),或者下載鈦媒體app