機器比人類分析師更會賺錢嗎?|學術光華

來源:【北京大學】

導語

在人工智能與大數據浪潮席捲全球的今天,“機器學習”已成為金融投資領域炙手可熱的詞彙之一。很多投資者甚至從業者不禁都要問:依靠強大算法的機器,是否已經能夠徹底超越人類分析師,輕鬆捕捉市場中的超額收益?

日前,北京大學光華管理學院金融學系副教授張英廣與合作者在金融學頂級期刊金融研究評論上發表了一項研究。這篇名為《人與機器學習再審視》(Man versus Machine Learning Revisited)的論文,聚焦機器學習與傳統方法在公司盈利、股票回報預測中的表現之爭,通過對經典研究的系統性復現與再評估,得出了一系列具有現實意義的結論。通過嚴謹的實證檢驗,修正了學界對機器學習在金融預測中作用的認知,也為業界理性看待機器學習的應用提供了關鍵參考。

01

故事的起源,一項引發巨大反響的研究

故事的起點源於2023年的一項研究。當時,有學者利用隨機森林(一種流行的機器學習模型)預測分析師的盈利預測誤差,並據此構建投資策略。結果顯示,該策略每月能獲得高達1.54%的超額收益,且統計顯著性極高。

這一發現在學術界和業界引起了巨大反響:它似乎證明了機器學習擁有某種天然優勢,能夠發現人類分析師無法察覺的市場規律。這一突破性發現迅速影響了後續相關文獻的研究方向,同時也引發了關於機器學習在金融預測中是否更具有優勢的廣泛討論。

02

被忽視的漏洞

然而,科學的精神在於懷疑與驗證。張英廣老師與合作者的研究在對上述研究進行復現時,完整重建了原研究的預測框架、模型設定與數據處理流程,並逐步檢視了其中的變量定義、模型訓練方式以及預測期限設置。研究發現,模型中的一個關鍵變量——“上一期真實盈利”,在跨期預測場景中被錯誤地定義為未來期尚未可觀測的盈利信息。

通俗來說,這就好比在考試開始前,學生已經偷偷看到了試卷的答案,自然能考出高分。這一雖細微但關鍵的定義錯誤導致了嚴重的前視偏誤,導致機器學習模型虛假地擁有了預知未來的能力,從而極大地高估了其預測準確率和策略收益。

03

修正偏誤後,機器學習優勢大幅縮水

為了還原模型的真實表現,研究團隊剔除了這一前視偏誤,對模型進行了重新檢驗,結果出現了根本性變化:原本接近1的夏普比率(衡量投資策略風險調整後收益的核心指標,數值越高代表策略性價比越高)降至0.15,意味着模型的風險收益比大幅降低,其構建的投資策略所產生的超額收益,在統計和經濟意義上都不再顯著。

更關鍵的是,修正偏誤後,這款機器學習模型相較於分析師預測的優勢大幅縮小,面對傳統線性模型,也不再有顯著優勢。甚至傳統線性模型在交易收益表現上反而更勝一籌。研究團隊還嘗試了其他機器學習模型及模型組合,均無法恢復原研究中高預測能力。

此外,研究還對原研究中關於市場現象的解釋進行了重估,發現公司股權增發、股票收益異象等市場表現,並非主要由分析師預測偏誤驅動,而是更多與企業實際盈利水平、基本面屬性相關,這也讓原研究的部分經濟學解釋的可靠性顯著減弱。

04

為機器學習在金融中的應用提供方法論基準

這項研究並非要否定機器學習的價值,而是通過嚴謹的復現與分析強調:任何模型的表現都必須在嚴格遵守數據時序邏輯、確保特徵變量在預測時點可觀測的前提下進行評價。

這一研究的價值也不止於修正一項經典研究的結論,更從方法論、實證研究和經濟機制分析三個層面,為機器學習在金融領域的應用劃定了清晰的邊界,提供了重要的實踐啟示:

首先,該研究對一項具有廣泛影響的研究進行了系統性復現,再次強調了時間一致性和數據處理細節在預測建模中的關鍵作用。機器學習模型對數據高度敏感,變量的定義、數據的可觀測性設定,直接決定了模型的有效性,這也為後續金融領域的機器學習研究,建立了更嚴謹的方法規範。

第二,研究通過嚴謹的實證分析表明機器學習模型的表現高度依賴於變量構建與變量可觀測性的設定,其相對於傳統方法的信息優勢並非必然存在。這一結論對機器學習在違約預測、信用評估、市場微觀結構分析等其他金融場景的應用,也具有重要的參考意義。

第三,研究對分析師預測偏誤、上市公司行為與機器學習預測之間的因果關係提出了更為審慎的解釋框架,避免了因模型設定偏誤所導致的錯誤機制推論被進一步放大。

歸根結底,學界與業界也應對機器學習在金融應用中的表現持有更合理的預期。在金融市場日益複雜、技術迭代不斷加快的今天,這項研究不僅為機器學習的金融應用校準了方向,也為金融研究的創新發展提供了重要啟示:無論技術如何進步,尊重市場規律、堅守研究嚴謹性,始終是金融研究和實踐的核心底色。

註:本篇論文的其他作者還包括中央財經大學金融學院助理教授朱彥頔、達特茅斯塔斯克商學院教授Juhani T. Linnainmaa。

機器比人類分析師更會賺錢嗎?|學術光華 -

張英廣,北京大學光華管理學院金融學系副教授、博士生導師。他於2019年在南加州大學馬歇爾商學院獲金融學博士學位,2011年在加州大學伯克利分校獲經濟學和統計學榮譽雙學士學位。 張英廣的研究興趣主要為資產定價、行為金融、金融科技以及中國金融問題。他關注市場參與者的預期動態、企業的預期管理、以及人工智能和機器學習的在金融應用中的價值與局限。張英廣的研究成果發表於金融研究評論、金融評論、太平洋盆地金融雜誌《金融研究》,《經濟學》(季刊),《中國會計評論》等學術期刊。他參與的合作論文曾獲Alpha Letters/CQA 最佳論文獎、中國金融前沿學術論壇最佳論文獎,並多次應邀在美國金融協會年會(AFA)、美國經濟學年會(AEA)、中國金融國際年會(CICF)宣講論文。

來源| 北大光華對外關係部

排版| 李珅

編輯 | 王小雅

審閱| 塔娜

本文來自【北京大學】,僅代表作者觀點。全國黨媒信息公共平台提供信息發布傳播服務。

編號:jrtt

分享你的喜愛