記者:陸彥君、吳洋洋
表格整理:陸彥君、梁夏琦
製圖:程星
編輯:吳洋洋
key points
2023年啟動大模型研發以來,騰訊第一次把大語言模型變成一把手工程,負責人是個27歲的年輕人;
混元下一個版本將是一個agent模型,主要由姚順雨主導訓練;
在姚順雨入職前,混元有過兩位總負責人:張正友與蔣傑。兩人背景主要是計算機視覺和大數據,而非自然語言處理;
chatgpt發布的2022年,騰訊正在經歷多重低谷。低谷之一是遊戲業務,在此之前,騰訊在2020年左右面臨過一個更大的危機:qq的「孵化器魔法」失效了;
有「配方」、也有更多資源後,騰訊訓練出下一代基座模型的時間可能會更短。但也意味着,姚順雨和騰訊的甜蜜期差不多就是半年。
2025年11月下旬,大學畢業生林楓在深圳參加了騰訊青雲計劃閉門會。活動採取定向邀請制,為期兩天,會議內容除了郵輪觀光、參觀騰訊總部,還有一個環節是部門見面會——姚順雨在現場。
這次見面會兩個小時左右,姚順雨是開場發言者,他講了大概只有20分鐘,但富有雄心。
「他說混元的目標是對標全球最頂尖的一批大模型。」林楓對第一財經「新皮層」說。
林楓對姚順雨印象深刻,除了「感覺他是主導混元大模型研發進度的管理者」,他還是林楓在現場看到的騰訊高管中為數不多的年輕人。
姚順雨,2025年下半年加入騰訊,此前任職於openai。
青雲計劃是騰訊2023年下半年提出的面向優秀畢業生的ai人才專項招聘,對標字節跳動的top seed人才計劃。
與青雲計劃同時進行的是騰訊持續一年的高薪挖人行動。長期從事基座模型招聘的許嵐告訴「新皮層」,騰訊最重要的挖人對象之一是字節跳動。字節跳動2-2職級的候選人,跳槽到騰訊後可以獲得t12或t13的職級,相當於在字節跳動的原職位連升兩級。而且,薪酬也會直接翻倍,有的甚至會提升200%。「這種行情最近一個月才出現,以前字節2-2的候選人會定下t9或t10的職級,薪資漲幅只有30%。」許嵐說。
2025年的騰訊就是2024年的字節跳動。2024年,字節跳動加速基礎模型的研發進度,第一個動作也是搶人才——它當時的搶人對象主要是阿里巴巴,一年後,騰訊「接棒」,從字節跳動搶奪人才。
多位接近騰訊的人士對「新皮層」稱,騰訊大概2024年年底就開始大規模對外招募基礎模型相關的人才,並啟動一系列組織架構調整。2025年9月姚順雨的加入加速了這一進程。
姚順雨新政
最開始,入職騰訊混元的外部人才主要來自微軟。自2024年12月起,微軟開源模型wizardlm團隊核心成員孫慶豐、微軟亞洲研究院視覺計算組前首席研究員胡瀚、微軟wizardlm團隊項目創建者徐燦陸續加入騰訊。然後是2025年8月,在月之暗面研究語音模型的研究員譚旭入職騰訊——加入月之暗面前,他任職於微軟亞洲研究院。
「騰訊只看來自deepseek、月之暗面、字節和阿里這4家基座模型團隊的候選人,其他公司是不看的。」接近騰訊招聘的人士陳立峰對「新皮層」說。
他對「新皮層」稱,2025年年中,字節跳動曾通過發放「豆包虛擬股」激勵員工,相當於為其大模型團隊漲薪。但正是在這輪股權激勵期間,部分字節豆包員工乘勢轉身加入了騰訊混元,原本年薪總包約為250萬至300萬元的字節跳動員工,加入混元後能拿到年薪300萬以上的offer。
2025年12月,字節跳動再次向全球員工發布了一封漲薪郵件,將公司整體獎金和調薪投入分別提升35%和1.5倍,以確保員工薪酬的競爭力和激勵回報在全球各個市場都「領先於頭部水平」。
在字節的防守下,騰訊的搶人計劃也加大了力度。「姚順雨的加入是騰訊混元人才招聘的一個關鍵節點。」許嵐說,姚順雨來之前,高管加盟騰訊「屬於大廠間的正常人才流動」,姚順雨加入後,混元不僅加強了招聘力度,「對候選人信息的保密性處理也升級了」。以姚順雨的加入為節點,騰訊招募了更多大語言模型(llm)相關的人才,在此之前,包括孫慶豐、胡瀚、徐燦、譚旭等在內的加入者主要研究方向都以多模態為主。
多位招聘方人士告訴「新皮層」,姚順雨會在與llm相關的招聘中擔任面試官,部分候選人由他親自引薦。這些新招募的人中,至少有3位t12職級的人才來自字節seed團隊和deepseek,其中一位負責預訓練的數據工作,還有一位和姚順雨一起做大模型的前沿探索。
部分混元員工因為姚順雨的到來信心備增。「他們認為姚順雨可能會為內部爭取更多激勵,就像字節seed為團隊成員發豆包股一樣。」許嵐說,姚順雨接手騰訊混元大模型不久,就與每位團隊成員都有過接觸、聊天,還參加了不同研究小組的團建和聚餐。
姚順雨的舉動獲得了部分員工的信任。一位內部員工認為他「性格討喜,跟着他幹活有信心」,另一位內部員工認為他「管理能力出色」。但也有部分混元成員開始擔心能力不足被調整,開始主動尋求外部機會。「從混元離職的人可能會變多,無論主動還是被動。」許嵐說。
換血只是姚順雨加入混元後的新政之一。在模型策略上,他也提出了不同於混元大模型前任領導者的觀念。
接近騰訊混元的人士告訴「新皮層」,相較於前任負責人,姚順雨更加重視後訓練——這在很多人的意料之中,姚順雨此前的主要工作都與後訓練更相關。不過除此之外,他還打算從預訓練的數據部分入手,「從數據開始重新訓練混元」,這相當於回到起點。林楓稱,姚順雨在11月的青雲計劃閉門會上還提出過一個明確要降低「發版速度」的計劃,「他說以前混元模型在內部更新版本的速度很快,有時候一周就會發布兩個版本。他來到這裡的第一件事就是降低發版速度,打磨好整體模型再發。」林楓說。
在被騰訊挖角之前,姚順雨只在openai工作過一年,深度參與operator、deep research等智能體項目。更早之前,他剛剛從普林斯頓博士畢業,研究方向是自然語言處理與強化學習。攻讀博士學位期間,他的主要科研成果有兩個,一個是tot(tree of thoughts,思維樹),這個計算框架讓ai在解決複雜問題時能夠將問題拆解為多步思維步驟並探索多條路徑,最終找到最優路徑。還有一個是react,這個算法讓大模型可以邊推理邊行動。tot和react都可應用於模型的後訓練階段,提升模型的多步推理和動手操作能力。openai的operator、deep research等智能體項目中都有tot和react的影子。
也就是說,騰訊把姚順雨從openai挖過來時,他只有一年的工作經驗。但騰訊提供的可能是國內大模型人才戰中無論職位還是薪酬都最高的標準。2025年9月,市場傳聞騰訊為了挖走他開出了上億元的薪水,騰訊隨後闢謠。這個數字不一定真實,但1998年出生的姚順雨一定是國內大廠中最年輕的大語言模型(llm)「一號位」。
2025年12月,騰訊宣布混元組織架構調整,官宣姚順雨出任「ceo/總裁辦公室」首席ai科學家,向騰訊總裁劉熾平彙報,他同時兼任ai infra部、大語言模型部負責人。一位接近騰訊的人士告訴「新皮層」,姚順雨平時在香港辦公室工作。另據一位騰訊內部人士稱,騰訊的ceo/總裁辦公室在列的人員名單上只有姚順雨一個人。
這是2023年啟動大模型研發以來,騰訊第一次把大語言模型變成一把手工程。而且,這個模型負責人對下轄的團隊擁有直接而全面的管理權和人事權。「劉熾平是財務出身,並非技術背景。姚順雨直接向他彙報,獲得資源支持的效率就更高了。」騰訊ai lab離職員工秦瑩瑩對「新皮層」說,在此之前,騰訊的自研模型混元有着很長的向上彙報鏈路,以及複雜的向下管理體系。
混元跟着跑
2025年從年頭衝刺到年尾的一系列人事和組織變陣表明,騰訊在大模型領域開始着急。令這家大公司着急的直接原因就是,其自研模型混元的表現在大模型競爭中不夠靠前。
「很多公司發新模型時,會被拿來在benchmark中對比的模型基本就是gpt、claude、gemini、千問、kimi和deepseek,你不會看到豆包,也不會看到混元。」一位大模型業內人士對「新皮層」說,這種選擇基本代表了行業對誰在模型第一梯隊的認知。
馬化騰在2023年5月的股東大會稱,「對於工業革命(級的機遇)來講,早一個月(還是晚一個月)把電燈泡拿出來,在長的時間跨度上來看是不那麼重要的。」但大模型如今已經變成了一門「實驗科學」,「從基礎架構到注意力機制,從參數量到優化算法……每個環節都有多種方案,你需要做實驗才知道能不能行得通、在多大規模的參數量上行得通。」上述大模型業內人士說。這種實驗性意味着,晚起步雖然有成熟方案可以借鑒,但也會比其他選手缺少從實驗中積累的經驗,行動越慢差距越大、越難追趕。
騰訊是國內大廠中最晚推出自研大模型的公司。2022年11月的最後一天,openai發布chatgpt。4個月後,2023年3月,百度發布了第一代大模型文心一言;同年4月,阿里巴巴發布通義千問大模型;同年8月,字節跳動也發布了首代大模型雲雀(註:後更名為豆包大模型)。
騰訊的起跑速度就慢於這3家公司。2023年2月,騰訊才開始組建一個叫「混元助手」的團隊,從各事業群集結人才,由時任騰訊ai lab主任張正友擔任項目總負責人。
多位騰訊離職員工對「新皮層」稱,騰訊在大模型領域的緩慢起跑與公司內部節奏有相當大關係。在chatgpt發布的2022年,騰訊正處於一段低迷期。
其中之一是遊戲業務。2022年,中國遊戲行業版號獲批通過的總量同比減少了32%,是過往年份中數量最少的一年。另一位騰訊離職員工告訴「新皮層」,遊戲是騰訊最賺錢的業務之一,受版號銳減影響,遊戲營收不確定性變高,公司當年就進行了「降本增效」,就連騰訊teg(技術工程事業群)這樣的技術中台也要自負盈虧。後來主導混元模型研發的張正友所領導的ai lab就隸屬於teg。「那時ai lab並不鼓勵研究員發論文,員工若要參加學術會議,還要蹭高校的預算才能去開會。」他對「新皮層」說。
騰訊ai lab離職員工秦瑩瑩稱,ai lab在2016年成立時主要任務還是做基礎研究。但2018年左右,ai lab就拆分成了兩個部分,只有少部分人繼續留做ai基礎研究,其他大部分成員都要開始服務於公司的遊戲與廣告業務。
而且,這位ai lab離職員工稱,在遊戲業務陷入危機之前,騰訊在2020年左右面臨過一個更大的危機:qq的「孵化器魔法」失效了。
2020年之前,騰訊的很多新業務、新產品——比如qq音樂、騰訊視頻——都是通過qq孵化成功的。那時qq扮演了一個分發渠道和入口的角色——就像今天抖音在豆包的分發中所扮演的角色一樣。但在2020年左右,騰訊的很多新業務發展不及預期,如騰訊電商,騰訊微視。
眾多新業務中,唯一一個被騰訊高層認為有潛力的是視頻號。上述騰訊離職員工稱,2022年,騰訊創始人、董事長兼ceo馬化騰在內部員工大會上稱「微信事業群最亮眼的業務是視頻號,基本上是全場的希望」。到了2023年,馬化騰又在股東大會上表示「ai是類似工業革命一樣幾百年不遇的機會」,但整個2023年和2024年,這位騰訊離職員工稱,他都沒有聽到公司從整體戰略上多麼強調過大模型,不斷被強調的依然是視頻號。
根據上述騰訊ai lab離職員工的說法,2023年時騰訊內部不同事業部如果想要訓練模型,需要向公司總辦申請預算和立項,「當時訓練模型的成本還很高,一次試錯動輒幾百萬美元。就算訓練成功,模型的用途是什麼?那時候還沒人能說清楚。」這位騰訊ai lab離職員工稱。
一號位難當
3年的大模型軍備競賽已經讓業界發現,大模型不僅是門實驗科學,還開創了前所未有的開發範式:它無法通過工業時代那樣主要依靠自上而下的明確規劃分工,以及大量工程師之間的分工合作完成;與這種依賴各個技術骨幹的開發模式不同,大模型開發是一種系統工程,如果沒有一號位頭腦中對模型從預訓練數據到預訓練架構和算法、後訓練路徑以及基礎設施層面的整體實驗構想,一個模型無法從多個技術骨幹的暴力開發中產生。
上述騰訊ai lab離職員工告訴「新皮層」,啟動大模型研發後的3年中,騰訊很長時間裡沒有為混元團隊匹配到一位合適的技術領導者。微信團隊也曾訓練過一個模型,後來放棄了。
上述騰訊ai lab離職員工告訴「新皮層」,在姚順雨入職前,騰訊混元有過兩位總負責人:張正友與蔣傑。張正友的研究方向是計算機視覺,他發明的平板攝像機標定法在全球被普遍採用,被稱為「張氏方法」。但大模型中最核心的模型是llm,llm的核心是自然語言處理,而非圖像處理。
「張正友管理了近半年後,並沒有交出夠好的成果。蔣傑之後主動接手了混元項目,因為他認為大模型可以服務於廣告投放。」秦瑩瑩說。
蔣傑2012年加入騰訊,是騰訊企業發展事業群(cdg)與技術工程事業群(teg)副總裁,負責騰訊廣告平台產品技術管理工作。
在蔣傑的總負責下,劉威和王迪都曾短暫地直接管理過混元一段時間,「劉威類似於統籌者,王迪類似於執行者」,秦瑩瑩告訴「新皮層」。不過,劉威和王迪的技術背景也都與自然語言處理關聯不深,其中劉威的核心工作方向是計算機視覺,他在2024年年底從騰訊離職後,創辦了一家叫rebirth的公司,主要方向是視頻生成。王迪2008年通過校招加入騰訊,主導混元llm模型前主要在teg負責數據與搜廣推算法方面的工作。
2024年11月,蔣傑也開始不再實際管理混元項目下的llm部分了,只實際負責混元多模態模型。前述騰訊ai lab離職員工稱,當時整個llm團隊都在等待一位據說是「來自微軟的高階人才」,但這位微軟系一把手一直沒有被等到。直到2025年9月,姚順雨來了。
在姚順雨負責混元llm模型並直接向騰訊總裁劉熾平彙報之前,混元的llm負責人是個向上、向下都很難推動工作的夾心角色。秦瑩瑩告訴「新皮層」,在張正友與蔣傑帶隊期間,混元llm模型曾有一個小組長,但他的職級並不高,距離觸達劉熾平至少存在大模型技術負責人王迪、混元大模型負責人蔣傑、teg總裁盧山三個層級。這種架構使他不可能像姚順雨那樣與劉熾平直接溝通、獲得資源支持。
對下管理方面,這位組長也需要橫跨teg的多個部門,才能接觸到他的項目相關成員。2023年成立的混元是一個虛擬團隊,其成員來自ai lab,甚至是teg的多個部門。
秦瑩瑩對「新皮層」說,機器學習部、數據平台部等部門均隸屬於teg舊的組織架構,而非混元團隊。抽調去參與混元項目的員工們還要額外服務於騰訊不同部門、不同業務的ai需求。「混元有小半年的時間比較混亂,職責與權限沒有梳理清楚。無論是張正友還是蔣傑,都沒能把團隊真正整合起來。」她說。
直到2025年4月,騰訊才從組織上配備了一個類似字節seed那樣的獨立團隊,在teg體系內成立大語言模型部與多模態模型部。12月官宣姚順雨入職後,騰訊進一步調整組織架構,新成立了ai infra部、ai data部與數據計算平台部,第一次從組織架構上匹配大模式時代的研發需求。
多位招聘方人士及騰訊員工對「新皮層」稱,騰訊ai lab目前已被逐漸弱化,多位成員已經離職,ai lab副主任俞棟也將於1月底離開。許嵐告訴「新皮層」,ai lab現在的工作重點就是做探索性研究、對外發表論文。這意味着騰訊2016年成立的ai lab實際上已經反過來成為混元的一個下屬部門,而不再是它的上層管理機構。
「新皮層」獲得的消息稱,隨着俞棟離職,ai lab的語音與自然語言處理研究方向也將被裁撤。剩下的兩個方向是胡瀚負責的多模態理解方向,以及一位來自字節seed前成員負責的多模態理解和生成統一方向。
直到2025年年底,混元才變成一個更接近於字節seed的架構,而類似的組織架構調整,字節在2023年下半年就動手了。這個遲來但大手筆的調整意味着,擺在姚順雨這位27歲大語言模型一號位面前的障礙,騰訊已基本為其掃清。
加速理論與甜蜜期
進入大模型軍備競賽的第三年,落後者趕上先發者的最優路徑已經非常清晰:要想快速交出符合市場預期的模型,最好直接效仿被證明有效的成熟做法,走別人走過的成功之路,而不是想着如何創新、彎道超車。
最能說明這一成功法則的例子就是google。2025年之前,「起個大早趕個晚集」在國內形容的是百度,在硅谷形容的則是google——它發明了大模型的基礎架構transformer,但在自chatgpt發布以來的全球模型競賽中,google的gemini始終被認為落後於openai的gpt和anthropic的claude。
上述大模型業內人士告訴「新皮層」,gemini 2.0發布之前,google一直堅持encoder+decoder(註:編碼器+解碼器,google在2017年發明 transformer 架構時的原始形態)架構。2024年2月發布gemini 1.5時,其模型論文中還在強調該架構為什麼更優,但到了2024年年底發布gemini 2.0時,google不再宣傳encoder+decoder的架構如何富有潛力,而是開始和openai一樣採取decoder only(註:純解碼器)架構。
不再偏執地堅持自研架構後,google很快就帶着2025年3月發布的gemini 2.5重回業界視野,11月發布的gemini 3.0直接讓openai拉響「紅色警報」,以應對gemini帶來的流量壓力。根據similarweb統計的11月數據,用戶在gemini上的平均停留時間已超越了chatgpt。
這位業內人士告訴「新皮層」,deepseek 2024年12月和2025年2月先後發布並開源的v3和r1模型,也分別扮演了gpt的decoder only架構曾經扮演的角色——告訴大家一個類gpt-4和openai o1效果的模型可能是怎樣的架構。其中,v3模型為業界提供了一個可以訓練出等效於gpt-4模型的「配方」——表明要得到類似的模型效果,模型需要是一個moe(混和專家模型)架構,而不能是稠密模型;時隔一個多月後發布的r1模型又提供了類openai o1的推理模型「配方」——表明強化學習可以直接通過對有推理步驟的語料的模仿學習實現。
「此前,大家其實不知道gpt-4是怎麼訓練出來的,也不知道o1是怎麼訓練出來的。」這位業內人士說,整個2024年,國內大模型公司的主要目標就是「趕上gpt-4」,但不知道如何趕上,openai從gpt 3.5開始就不再在論文中公開其模型核心架構和算法、甚至不發表技術報告了。
deepseek v3和r1模型的發布和開源加速了全球類gpt-4和openai o1模型的推出。聘任一個在openai直接參与過模型後訓練、並接觸過其預訓練的研究者擔任llm模型負責人,對騰訊混元來說是也是一種加速。
姚順雨加入騰訊兩個月後,2025年12月初,騰訊發布混元2.0模型,總參數為4060億。其英文名更新為hy2.0,被視為重視全球市場的舉措。有人猜測該模型就是姚順雨入職後的成果。但按照業內訓練一代模型的周期來看,混元2.0不太會是姚順雨從零開始訓練的模型。
「模型參數量與模型能力之間是必要不充分關係,參數量大,模型性能不一定強,但參數量小,模型潛力一定有限。」上述業內人士說,姚順雨大概率會訓練出一個參數量更大的模型,估計需要大半年時間——在有「配方」、有更多資源的條件下,時間可能會更短。這意味着,姚順雨和騰訊的甜蜜期差不多就是半年,這位27歲的年輕管理者需要交出一些實際成果,才能在騰訊這個有着11萬人的大廠坐穩大模型一號位。
2025年4月,姚順雨在其個人博客中寫下《the second half》(下半場)一文,「宣布」大模型已經具備足夠的推理能力,大模型競爭已經完成上半場的預訓練戰鬥,進入以後訓練和agent開發為主題的下半場。但在騰訊,他得重新鏖戰上半場。
一位接近騰訊混元的人士對「新皮層」稱,混元下一個版本將是一個agent模型,主要由姚順雨主導訓練。
(應採訪對象要求,文中林楓、許嵐、陳立峰、秦瑩瑩為化名,記者王傑夫、實習記者李昂、肖赫對本文亦有貢獻)
題圖來源:視覺中國,拍攝於2015年。
-end-