Categories
科技報導

400餘篇論文被發現可能來自同一“論文工廠” 涉數十家三甲醫院



“學術打假人”Elisabeth Bik 再次拉響了學術造假警報。她和團隊發現了 400 多篇來自不同機構的論文,在條帶、圖形版式和標題上高度雷同,似乎都產自同一個“論文工廠”。根據 Bik 爆料顯示,這些論文幾乎全部來自中國的幾十家醫院,其中包含了多家三甲醫院。

截止發稿前,共有 412 篇論文在列表中。 Bik 認為,這樣的出自論文工廠的文章可能有幾千篇。疑似造假論文列表還在更新中:http://suo.im/6bWNkK

400餘篇論文被發現可能來自同一“論文工廠” 涉數十家三甲醫院 1

(圖源:forbettercsience)

這次的打假團隊包括 Elisabeth Bik(實名)、Smut Clyde、Morty、TigerBB8 等人。

打假團隊成員告訴 DeepTech,國外科研圈對此事的反應激烈,“這幾百篇文章會給科學論文帶來很多污染。”具體來說,這些批量生產的論文,其錯誤結果可能會誤導那些將其作為參考文獻的其他研究者,造成科研資源的浪費。

同時,此次涉及的期刊不是所謂的“灌水刊”,整體質量還不錯,這也是此次造假事件引起很大轟動的原因。

值得強調的是,Elisabeth Bik 的打假團隊成員都有良好的學術背景,有些目前工作在科研一線,打假是一份業餘愛好。

從 Elisabeth Bik 本身來說,她是一名微生物學家和科學誠信顧問,此前曾是斯坦福大學助理研究員,後來去往生物技術公司 uBiome 工作,2018 年離開該公司,全職無薪從事學術打假工作。

她是科研打假網站 Retraction Watch 和 PubPeer 的積極撰稿人。她的調查揭露了數種期刊中嚴重的學術不端行為,尤其在檢測科學出版物中的照片處理方面被廣泛認可。在過去五年中,她大約花費 5000 個小時檢查論文,她的工作促成了數十次撤稿。

400餘篇論文被發現可能來自同一“論文工廠” 涉數十家三甲醫院 2

圖 | Elisabeth Bik(來源:The Scientist)

從數據到標題“流水線作業”

早在 2018 年,圖像數據完整性分析師 Jana Christopher 就在 FEBS Letters 上發表了一篇論文描述“論文工廠”。她發現有 12 份手稿都用了蛋白質印跡法,結果圖都具有非常規則的間隔和形狀特別的條帶,而​​且缺少污點和染色劑。這些手稿來自不同機構的不同研究小組。

一個月前,匿名用戶 Indigofera Tanganyikensis 在同行評議網站 PubPeer 上首次指出了一些論文的蛋白質印記檢測板之間的背景相似性。之後他們發現,不僅是同一篇論文的背景相似,不同論文的檢測板之間也出乎意料地相似。

Elisabeth Bik 注意到這條線索,並跟進研究,發現在 400 多篇論文中,蛋白質印跡條帶之間的間隔都非常規則,外觀呈啞鈴或者蝌蚪狀,沒有常見的污跡。所有的條帶都放在相似的背景上,表明它們是從其他來源複製和粘貼過來的,或者是電腦合成的。

400餘篇論文被發現可能來自同一“論文工廠” 涉數十家三甲醫院 3

圖 | 背景圖高度相似(來源:PubPeer)

另外,流式細胞圖也被發現極為相似。以下的這些 “紅毛球” 是 FACS 散點圖,每一個小紅點是一個細胞,通過其表面蛋白質的測量來定位。許多細胞在這些獨立的實驗中產生了相同的值。

400餘篇論文被發現可能來自同一“論文工廠” 涉數十家三甲醫院 4

圖 | 對比圖 4D 中的第 3 和第 6 個 FACS 圖(菏澤市立醫院心內科唐守義等人論文 Long noncoding RNA MEG3 deteriorates inflammatory damage by downregulating microRNA‐101a)

除了數據圖本身,這些論文的柱狀圖也很有規律:以灰色調居多,左邊是黑色條,每幅圖都是雙邊誤差線。不排除這樣的佈局可能是一個比較流行的標準圖像樣式,但不同機構上百篇論文的版面設計都一樣,這的確少見。

400餘篇論文被發現可能來自同一“論文工廠” 涉數十家三甲醫院 5

圖 | 以灰色調居多,左邊是黑色條,每幅圖都是雙邊誤差線(來源:Elisabeth Bik)

最後,Elisabeth Bik 總結出了這些 “論文工廠” 的標題模板:

400餘篇論文被發現可能來自同一“論文工廠” 涉數十家三甲醫院 6

圖| 插入一個分子名稱、選一個動詞(一般現在式、第三人稱單數形式)、選一到兩個細胞轉化過程、選擇一種癌症或者細胞類型、選一個連詞、選一個動詞(現在進行式) 、插入miRNA 或者神經通路的名稱(來源:Elisabeth Bik)

在被發現的 400 多篇論文中,用模板套出的標題比如:

Bilobalide alleviates tumor necrosis factor‐alpha‐induced pancreatic beta‐cell MIN6 apoptosis and dysfunction through upregulation of miR‐153

mir-488 inhibits cell growth and metastasis in renal cell carcinoma by targeting hMgn5

Baicalein retards proliferation and collagen deposition by activating p38MAPK‐JNK via microRNA‐29

一位中國科學院遺傳與發育研究所的專家看過上述證據後,告訴 DeepTech,“證據都是直觀的,感覺靠譜。”

點名六種期刊、六家醫院,出版社:我們正在緊急調查

這批涉事論文中,許多作者都來自中國的醫院或者醫學院附屬醫院,其中涉及到多家三甲醫院,Elisabeth Bik 的博文中提到了以下 6 家三甲醫院:

濟寧市第一人民醫院(三甲):101 篇論文(幾乎沒有重複作者。涉及到兒科 15 篇、心髒病學 6 篇、內分泌學 6 篇、腎病學 6 篇、血管外科 5 篇等不同科室)

吉林大學中日聯誼醫院(三甲):59 篇論文

青島大學附屬醫院(三甲):23 篇論文

臨沂市中心醫院(三甲):16 篇論文

鄭州大學第一附屬醫院(河南最大的三甲):16 篇論文

濟寧醫學院附屬醫院(三甲):12 篇論文

她的博文中寫道,這些相似的論文中,最早一篇發表在 2016 年,大部分論文出自 2018-2020 年間。被列出的 400 多篇論文大部分發表在以下 6 種期刊中,涉及多家出版社,其中,Cellular Physiology and Biochemistry 已於 2019 年 1 月被踢出 SCI:

Artificial Cells Nanomedicine and Biotechnology (Taylor & Francis): 76 篇論文,影響因子:4.462

Journal of Cellular Biochemistry (Wiley): 57 篇論文,影響因子:3.448

Biomedicine & Pharmacotherapy (Elsevier): 45 篇論文,影響因子:3.743

Cellular Physiology and Biochemistry (Karger): 26 篇論文

Experimental and Molecular Pathology (Elsevier): 26 篇論文,影響因子:2.350

Journal of Cellular Physiology (Wiley): 21 篇論文,影響因子:4.522

400餘篇論文被發現可能來自同一“論文工廠” 涉數十家三甲醫院 7

圖 | 知名學術期刊出版商 Wiley 回應打假鬥士 Morty(來源:Twitter)

團隊表示,他們已經主動聯繫四大學術出版社包括 Springer,ELSEVIER,WILEY 和 Taylor&Francis Group,其中多數已經回復稱,會組建團隊對事件進行調查。

Wiley 出版的《細胞生物化學雜誌》(journal of Cellular chemistry)尤其受到論文工廠有組織的“攻擊”。它的編輯委員會匯集了許多傑出的美國科學家,但也包括某些名聲不太好的科學家。多年來,這份雜誌一直由學術編輯、現年 77 歲的 Gary Stein 管理,直到 2020 年 1 月中旬,Gary 辭職,來自 Wiley 的員工現在擔任臨時主編。

該出版社此前曾表示:在最近的期刊中,大約 90% 的論文都有中國作者,好像有某種模式。

Taylor&Francis 出版道德經理表示感激,並補充說:“ 我們正在緊急調查受影響的文章。”

論文作者青睞更可靠的“論文工廠”

這批全部來自中國,但作者、機構甚至科室都不同的論文中,一系列可疑的特徵均指向:這批論文可能出自同一個“論文工廠”。

在眾多論文中,Bik 團隊發現多篇論文中的圖片存在背景完全一致的現象,而這在正常論文中是不可能出現的情況。上文提到的模板式的標題也是一個非常明顯的特徵。

Bik 團隊認為,對圖像和數據進行分析是揪出論文造假漏洞的重要途徑,這些明顯模板式的文章背後極有可能出自同一個團隊之手,他們甚至懷疑某些期刊內部有期刊編輯是所謂的“內線”,配合論文工廠讓問題論文順利發表。

據團隊介紹,在正常情況下,論文作者所在地並不是需要統計的數據,而在整理數據庫過程中,團隊感覺到作者所在地與往常不太一樣,隨即將地理位置信息也加入到數據庫中。

結果發現,這 400 篇論文作者出現了明顯的聚集的情況。

在此前疑似論文數量只有 320 例的時候,有超過一半的論文來自山東省,近五分之一來自吉林,十分之一來自河南。根據最新的統計,僅有 1 篇來自北京,9 篇來自廣東,1 篇來自上海,117 篇來自山東。

TigerBB8 披露,這些客戶都聚集在山東濟寧周圍。

在醫學界,2017 年的撤稿事件還歷歷在目,當時,醫學期刊《腫瘤生物學》一次性撤下與德國學術出版商Springer 合作期間發表的107 篇論文,創下正規學術期刊一次性撤稿數量的紀錄,而這涉及的超過500 名作者全部與中國研究機構有關。

而在最新披露的一批 “問題論文” 中,大部分論文出自 2018-2020 年間,這兩次事件之間是否存在內在聯繫?

團隊推測,在2017 年撤稿事件之後,部分醫生對於“買論文” 變得更加謹慎,這一定程度上讓更多醫生買家在周邊關係中尋找更加可信的“論文工廠”,依賴半公開式甚至是口口相傳的推廣模式,也就一定程度上導致了這批論文作者過於集中的現狀。

400餘篇論文被發現可能來自同一“論文工廠” 涉數十家三甲醫院 8

圖 | 老虎 BB8 披露,這些客戶都聚集在山東濟寧周圍(來源:forbettercsience)

“這次你暴露我們,可能使我們丟了工作”

德國獨立科學記者 Leonid Schneider 撰文揭露了更多細節一些通訊作者留下了前綴奇怪的 Gmail 地址,比如 [email protected],他認為這些賬戶肯定不是中國某個被列為論文作者的醫生,而是論文工廠的經營者。

他認為,中國的論文工廠甚至會處理提交的作品、同行評審(如果有同行評審的話),並在版權同意書上簽字,同時假裝是作者。

另外,論文工廠還會為客戶創建虛假的 ORCID 賬號。ORCID 是為研究學者創建唯一身份驗證的系統,它會將研究活動和研究成果與賬號相關聯。部分期刊會使用該系統進行作者識別。目前已經發現一些學者在提交手稿之後註冊虛假身份。

論文工廠也會註冊一些一次性的電子郵箱,比如在 Journal of Cellular Biochemistry 中就發現,有作者在不同的論文中用不同的郵箱:

Dexin Yin:

yindexin221 @ sina.com;

mudanren8646ktd @ 163.com

Dajun Sun:

[email protected]

[email protected]

[email protected]

TigerBB8 提到了一個提供服務的網站“鵬程SCI”,其官網掛著它可幫客戶在SCI 和EI 索引期刊上發表論文的說明,同時標榜規避作者風險、保護作者成果、確保每一篇文章成功發表的宗旨。並稱,迄今為止已經成功發表文章上萬篇。

400餘篇論文被發現可能來自同一“論文工廠” 涉數十家三甲醫院 9

圖 | 鵬程官網

論文工廠會通過郵件等方式聯繫有發論文需求的學生、老師,某位在醫院工作的人士曾收到過很多類似廣告,他向 DeepTech 提供瞭如下截圖:

400餘篇論文被發現可能來自同一“論文工廠” 涉數十家三甲醫院 10

甚至還有關於此次疫情的相關論文:

400餘篇論文被發現可能來自同一“論文工廠” 涉數十家三甲醫院 11

“許多論文似乎都是醫院或醫學院附屬的作者,這並不奇怪。要成為中國醫學院校博士,一部分要求是至少要發表一篇出版物”,Elisabeth Bik 在博文中寫到。

在中國,如果臨床醫生希望晉升,就需要在國際期刊上發表一定數量的研究論文。一個簡單的方式就是找論文工廠,只要付錢就能買到全套服務。

TigerBB8 在揭露論文造假過程中,曾收到過來自中國論文買家的信息,輕吐苦水,“白天,我有門診手術;下班後,我得照顧我的孩子。晚上10 點以後,我只有一點點時間,但這遠遠不夠,因為科學研究需要大量的時間。”“只要係統保持不變,遊戲規則保持不變,偽造數據的類似行為肯定會繼續。”

“這次你暴露了我們,可能使我們丟了工作。”信息中寫到。

400餘篇論文被發現可能來自同一“論文工廠” 涉數十家三甲醫院 12

圖 | TigerBB8 在揭露論文造假之中,曾收到過來自中國論文買家的信息(來源:forbettercsience)

Bik 拉響的警報並不止於 “論文工廠” 的存在,也不止於這些論文都通過了同行評審。她收到的消息稱,一些特定的 “論文工廠” 或許已經成功 “感染” 了某些期刊,這些期刊有可能正在和工廠合作催生更多的造假論文,並將此出售給渴望完成學術理想的大批有抱負的醫學博士。

更嚴重的情況或許還在水面之下,正如 Bik 在一條推特中的感慨,“我只是抓住了一些比較傻的造假者。聰明的壞人留下的痕跡更少。

打假團隊成員與 DeepTech 的問答

DeepTech:此次事件的影響有多大?

A:這次國外的反應非常大,因為這些論文發表之後,不僅僅是佔用了篇幅,而是這幾百篇文章會給科學論文帶來很多污染。

因為期刊本身是國際期刊,且影響力較大。那麼學生在規劃課題的時候就可能看到這些論文,從而被這些論文的錯誤結果誤導。一個學生可能只有三年時間來做一篇論文,作假論文如果不幸被用作論據來支持自己的實驗設計,那麼某個學生幾年的心血都可能因此荒廢,甚至人生都被耽誤了。不光是學生,對其他研究人員也是這樣的。

對文獻的污染是大家關注的焦點。

第二點就是,一直以來科學界都是假定論文是真實的,而幾乎不會考慮是否有專門造假的情況。這麼大規模的造假會讓很多人無所適從,讓很多人花更多時間,看看論文到底是真的還是假的,這會產生顛覆性影響。

DeepTech:發表學術論文有嚴格的流程,包括審稿和同行評議等,為何無法阻止論文造假事件發生?

A:首先,同行評議環節的審稿人在收到論文之後,一般不會懷疑數據、圖片的真實性。審稿人會去看論文中的實驗設計是否合理、是否存在不嚴謹的地方等等,而這批論文在這些部分並不是完全造假的,這也可看出此次造假水平並不差。

第二點,審稿過程也有可能是被破壞的,比如 2017 年撤稿事件中出現的偽造同行評審意見的事件,這也是懷疑期刊內部有 “內線” 編輯的原因。

第三點,假如一篇論文投稿失敗,論文工廠會鍥而不捨地把論文依次投到其他期刊,這樣可能在某些情況下混了過去。

我們希望期刊編輯部在做調查的時候,能詢問一下每篇涉案文章的審稿人,但我認為這是不可能的,因為每個期刊都有自己的審稿人庫,如果把審稿人惹怒了,以後就可能不幫你審了。

DeepTech:所以要從同行評議的環節進行改善對期刊來說是一件非常高成本的事情?

A:這對審稿人來說也是不現實的,如果審稿人每篇文章都要花很長時間去看圖片、數據有沒有造假,那麼審稿時間就會非常長,英美和中國不同,審稿人是完全沒有稿費的,而且不能佔用日常做研究的時間來做審稿工作,都是佔用自己的空閒時間。所以如果還要花更多時間來看圖片是不是造假,那乾脆說不審就好了。

我認為大期刊應該對審稿人進行一個培訓,能夠快速發現論文中的可疑信號。也有不少人同意,期刊應該設立專門的審查人員,專門做這個環節的工作。目前已經有一些期刊設立了這麼一個職位,不過還是極少數。