您當前的位置:首頁 > 詩詞

論文資料造假被發現的可能有多大?

作者:由 匿名使用者 發表于 詩詞時間:2018-01-11

論文資料造假被發現的可能有多大?鹽選科普2020-03-30 11:44:07

在造假的基礎上得出的研究資料,無論有多合理、多縝密,都免不了被發現的命運。

物理史及科學史上最大造假事件之一——舍恩事件,便是最好的證明。儘管其科學價值之重舉世罕見,心思縝密到前所未有,但依舊逃不開被揭穿的結局……

一、內向者舍恩

1997 年,年僅 27歲的揚·舍恩(

Jan Hendrik Schön

) 帶著他的博士學位走出德國最南端的康斯坦茨大學,加入了著名的貝爾實驗室。

貝爾實驗室

從未發表過世界最頂尖期刊 Nature 和 Science 的他,根本沒有想過在接下來的四年裡他會在這兩個期刊以及其他頂尖期刊以第一作者的身份發表數十篇論文,最快的時候每 8 天就能發表一篇論文。

也想不到他的研究也被 Science 評為 2001 年十大科技進展之首。更無法預料在短短一年之後,他的一系列重要突破被指造假。而一年之內,Nature,Science 撤回了他 15 篇論文,PRL 撤回了 6 篇他的論文。

他所獲得的大獎被收回,博士學位被母校剝奪。在頂刊上如此大規模的造假直接引起了學界對同行評審制度的質疑。其影響之大,之深遠,一直被認為是 50 年內物理學界最大的汙點。而舍恩的造假方式,僅僅只是修改了一些資料,讓他的結果看起來更符合人們對於這個實驗期待。

事發後的 Jan Hendrik Schön

舍恩的投機取巧,可以從他的青年時代說起。

1970 年,舍恩出生在在德國阿勒爾河畔的費爾登,母親再婚後隨繼父前往奧地利生活,舍恩的幼年時期是和祖父母一起度過的。

稍微年長後,十六歲的舍恩去往奧地利於養母於繼父在一個三國交界的小鎮一起居住,也因此逃避了兵役。隨後,避開兵役的舍恩回到德國,進入康斯坦茨大學攻讀物理學學位。

儘管輾轉多地,這位年輕的孩子依舊有著德國人獨有的氣質,彬彬有禮又沉著冷靜。

在本科學習期間,舍恩展現出了對物理學知識強大的記憶力。在被問到物理學問題時,他總能迅速給出正確答案,然後完美的複述出相關的公式。

根據他的本科同學回憶:「舍恩也從來不參加爭論,他總是在需要發言的時候給出適當的回答,一句不多,一句不少。「」

這低調的性格伴隨了舍恩很長一段時間,他完成本碩學習後進入德國知名的太陽能電池學家 Ernst Bucher 實驗室攻讀博士學位後,Ernst Bucher 給他的評價也是:「他(舍恩)用永遠不和我爭論,一直是那麼謙卑,無論我說什麼,他都只會說對,對,對。」

Ernst Bucher 教授是康斯坦茨大學知名的太陽能學者,在攻讀博士之前,舍恩就在 Ernst Bucher 進行過短期的學術訓練,當時他的任務是使用實驗室現成的計算機程式碼計算金屬氧化物對陽光的吸收率。

他小心翼翼的記錄著所有的資料,這時的他對編造和篡改資料沒有任何的概念,完全沒有想過透過捨棄幾個異常值或者更改幾個不那麼「完美」的資料來讓自己的論文產出更加順利。通過出色完成自己的碩士學習,他也拿了 Ernst Bucher 實驗室的博士入場券。

那時,沒人能想到這樣一個低調,喜歡團隊運動,甚至有點木訥的男孩子,幾年後居然透過學術造假將整個物理學界弄的天翻地覆。

Ernst Bucher 在事情敗露後接受記者採訪時,拿出了舍恩在他實驗室的第一份實驗報告。並指出了舍恩實驗報告圖表中一個明顯的異常值(outlier),並告訴記者這種因為樣品混入雜物的異常值最後肯定會被移除的,可舍恩還是一絲不苟的記錄的下來。

然而就是這樣一個孩子居然在幾年內就成為了一個編造完美資料的造假者。

舍恩在博士期間一共發表了 24 篇論文,以至於導師在他沒能成功完成博士課題的情況依舊讓他畢業。這時候的舍恩已經開始造假了麼?因為時間太過久遠,相關的文獻資料已經無法查證了。但是可以肯定的是,舍恩的第一次學術不端行為,就發生在他的博士階段。

在博士研究的初期,舍恩負責的工作還比較簡單,所以這時的他還不在乎在展示資料的時候算入異常值。而隨著研究的深入,他慢慢的開始發現,自己透過測量後分析得出的結果往往與別人報道的理論值有很大的偏差。

在一開始的一個研究 CGS 能量密度的實驗中,舍恩採集多個數據點後,試圖透過擬合得出曲線和公式,然後用公式得出的計算結果與文獻的能量密度進行對比。

可舍恩發現自己得出來的資料總是低於 1987 年的一篇論文。顯然,那時的他沒有能力解決這個問題,而他的實驗室同僚們也沒有研究 CGS 的經驗。可是為了發表論文,符合文獻資料的計算結果是必要的。

怎麼能夠透過自己的努力獲得合理的資料呢?其實說來也很簡單,舍恩決定使用不是自己資料擬合出來的曲線來進行計算,也就是編造實驗資料,透過這樣的方式舍恩輕而易舉的得到了文獻中報道的結果。

而這,也許是舍恩的第一次取巧。

當然,這種級別的學術不端是非常難以察覺的,就算被發現後舍恩聲稱自己計算失誤也可以矇混過關,外界很難認定他有嚴重的主觀捏造行為。但從這時開始,這些不好的資料處理習慣就已經為以後更嚴重的學術欺詐行為埋下了禍端。

左:舍恩博士論文 右:舍恩 1998 年發表的論文

左:舍恩博士論文 右:舍恩 1998 年發表的論文

左:舍恩博士論文 右:舍恩 1998 年發表的論文

在後來調查組對舍恩博士期間的論文進行調查時,就發現舍恩發表的論文中資料比他博士畢業論文中的資料多出兩個峰,而舍恩用此圖得出的結論是:「與文獻報道吻合。」

「與文獻報道吻合」

,這其實是一種很取巧的方法。就比如說,這個實驗的理想資料需要試驗材料為無雜質的某晶體,但是我們目前的提純工藝並沒有辦法獲得純度百分百的該晶體。那麼這個實驗之後測量的資料自然是與理想數值有偏差的。

但是舍恩論文中的資料,往往都和文獻中的理論資料高度吻合,哪怕他實驗中使用的晶體純度只有百分之八十,他也能得出使用純度為百分百的晶體來做實驗才能得出的結論。

「和已經報道的文獻一樣,這樣再錯也錯不到哪去,刪除、編造一點資料點也沒什麼。」

舍恩本著這樣的心態,完成了他博士期間的 24 篇論文,他也成功得到了他的博士學位。

二、貝爾實驗室的鐵三角

透過導師 Ernst Bucher 的推薦,舍恩成功的進入了貝爾實驗室實習。並和兩位貝爾實驗室的大牛:Christian Kloc 和 Bertram Batlogg 組成了鐵三角,這也為之後的造假提供了強有力的靠山。

鐵三角組合

1997 年 5 月時,舍恩結束了他在貝爾實驗室的實習,回德國完成自己的博士論文答辯,並在原實驗室進行一年的博士後工作。

在這短短一年間,舍恩「操作」資料的能力又上了一個臺階。他根據自己的理解隨意移除原始資料中難以解釋的內容,將完美的資料展示在外人面前。

這一招在頻頻發表德國本地德文期刊的康斯坦茨大學還行的通,因為德國本地的這些雜誌的影響力都不大,康斯坦茨大學也非常低調。

但貝爾實驗室不一樣,作為當時世界上最好的實驗室,貝爾實驗室致力於發明可以推動世界進步的東西。在貝爾實驗室的每一個人都想做出重大突破,這和一向低調造假的舍恩格格不入。

要知道,此時的舍恩,在半導體物理學的涉獵非常有限,而他唯一知道做的,就是同意他人的觀點。不管是對待上級的唯唯諾諾,還是捏造資料以和文獻達成一致,就是舍恩性格的體現。

但也正是貝爾實驗室高調的作風,裹挾著舍恩走向萬劫不復的深淵。

六噻吩

1998 年,舍恩回到新澤西正式成為了貝爾實驗室的一名博士後。這一年也是他豐收的一年,他在博士期間的兩篇論文被太陽能領域的雜誌接收。

為了讓資料更加好看,他在有機場效電晶體的研究裡最後的資料中加了數個虛假的資料點。他們關於 FET(場效電晶體)的文章也終於得以在 Physical Review B 和 Applied Physics Letters 發表。

這個豐收年也讓他終於清楚的意識到,自己以前做的都是小打小鬧,只要實驗得出的資料足夠好看,他就能發表更好的文章;也就是說,只要他「玩弄」資料的手段足夠高超,和文獻資料吻合度足夠高,那他的文章就可以源源不斷的產出,發表在各個地方,獲得各種他

想要的成就。這一刻,舍恩彷彿被打開了

奇怪的開關。

與此同時,他還有沒忘記自己博士期間的 CGS 課題。這本和他在貝爾實驗室的工作無關,也不是考核他工作的內容之一。可以說在 CGS 這個課題上,他沒有任何來自上級的壓力。但是這個課題,他在博士期間發過 24 篇論文,對於這個課題,他可以說已經瞭然於胸。

「既然我已經對它這麼熟悉了,那是不是也就意味著我可以得出更『完美』的資料了?」

於是這一次,舍恩不再是去除少量幾個異常數值來讓自己的曲線變得好看這麼簡單了。他透過遠超之前文章的捏造資料量,「成功」實現了 CGS 從 P 型半導體到 N 型半導體的轉化。這也是舍恩第一次捏造大量資料,這篇論文後來甚至還發表在了 Applied Physics Letters。

在無壓力的條件下,在研究中進行大規模的造假。這意味著,那個踏實肯幹,願意把所有資料真實的記錄下來的舍恩消失了。

現在的舍恩只是一個為了應對上級的期望,透過他精湛的演技和縝密的捏造瞞天過海的「資料操控者」。

憑藉自己「精湛」的「技術」,舍恩瞞過了貝爾實驗室的同僚和頂級期刊的審稿人,登上了所有學者都夢寐以求的頂級的雜誌——Nature 和 Science。

三、Rising Star

千禧之交,貝爾實驗室開始敦促自己的員工在 NS 上發表論文。與此同時,1997 年經濟危機對半導體行業造成的巨大沖擊,貝爾實驗室的母公司朗訊損失慘重,實驗室的工作人員都朝不保夕。加上舍恩的博士後是臨時工的職位,在這樣的背景下,舍恩為了尋求終身職位,必須要發表一些大文章。

遊戲升級,而舍恩的「奇蹟」才剛剛開始。

貝爾實驗室在有機材料領域的工作很快引起了「有機晶體之父」Norbert Karl 的注意。Κloc 在學術會議進行報告時,由於對文獻調研不充足而沒有引用Κarl 的相關研究引起了 Karl 的不滿。

得知此事後,喜歡讀文獻學習的舍恩馬上跟進了 Karl 的相關研究,發現 Karl 此前在另外一種有機材料裡觀察到過晶體內部在低溫時導電率提高的現象,舍恩自然而然想到他所研究的晶體表面是不是也有這種效應。

舍恩的實驗資料顯示低溫下有機晶體表面的遷移率上升了上千倍,儘管後來這被證明是捏造的資料,但這項研究在當時非常重磅。舍恩也終於開始被學界所認識。

1999 年,舍恩用有機晶體制造太陽能電池的研究終於被 Nature 接收,伴隨而來的是來自於同事們的祝賀。突然而來的名譽讓一向低調的舍恩不知所措。

在貝爾實驗室打算將他下一篇研究投往 Science 時,他向他的一位工作作者表示他覺得貝爾實驗室的大佬們把他的工作吹的太過了,他不想投 Sc

ience。

他開始怕了。那時只有他自己知道,他的資料

編造出來的。

可他編造的資料是那麼的完美,那麼的符合理論物理學家的預測,一段時間過後,依然沒有人發現他的秘密。可是為了終身職位,他不得不把主意打到大文章上。之前幾篇文章的成功,讓舍恩開始認為編造資料發大文章是一門不錯的生意,比起苦心經營發領域內的文章划算不少。他的造假也從小文章上升到 NS 級別。

1980 年,德國科學家發現了矽晶體在接近絕對零度時的阻力出現不連續,階梯式的下降,這種現象稱為量子霍爾效應,該研究獲得了 1985 年的諾貝爾物理學獎。而後來的分數量子霍爾效應也獲得了 1998 年的諾貝爾物理學獎。

其獲獎者,正是貝爾實驗室的資深員工,Horst Ludwig Störmer。Störmer 獲獎時,舍恩已經開始了在貝爾實驗室的研究。此時的他,已經不滿足於發表一般的 NS, 他還需要更大的新聞。

1999 年聖誕節的前幾天,貝爾實驗室的很多人都已經放假,而舍恩仍在實驗室熬了幾個晚上鼓搗他的實驗裝置。23 號早晨,徹夜工作的舍恩告訴 Kloc 他在並四苯晶體結構中觀測到了量子霍爾效應,並在隨後的聖誕晚會上展現了他的結果,連諾獎得主 Störmer 都在眾人面前對他的結果連連稱讚。

儘管後來他的同事回憶起他加班的時候一直在用電腦

,從未看到

他親手做實驗,可當時沒人懷疑他的資料是用電腦捏造出來的。

一段時間後,加州大學的前貝爾實驗室 Robert Haddon 找到舍恩,讓他試試用富勒烯 C-60 製作電晶體。在短短几個月後,舍恩就再次得到了「完美的」資料。看到資料後,Robert Haddon 顯得有點沮喪。

因為 Haddon 已經在這個專案上花費了數年,而舍恩作為一個門外漢,居然幾個月就搞定了富勒烯,而且資料非常完美。那時的 Haddon 把一切歸咎於「自己是一個糟糕的實驗學家」而認為舍恩是百年一遇的天才,完全沒有懷疑舍恩的完美資料是怎麼得到的。

富勒烯

這兩項研究很快就發表在 Science 之上,舍恩總是能輕易解決科學界遇到的重大問題。輕車熟路後,舍恩的造假之路也走的越來越順暢。而在學界享有盛名的舍恩的導師 Batlogg 也毫不吝嗇自己對舍恩的讚美。

使用 App 檢視完整內容

目前,該付費內容的完整版僅支援在 App 中檢視

App 內檢視

論文資料造假被發現的可能有多大?匿名使用者2020-05-06 18:48:45

如果你是學生,寫的是畢業論文,除開博士畢業論文,99%這一輩子也不會有人發現。

1%的情況是抽查並且被人嚴密推導資料了,那你就是是天選之人,趕緊買彩票吧,而且如果你不在學術界,發現了對你一點影響沒有,當然如果你的上級知道了,那還是挺危險的。

如果你是學生,發的是學術論文,那麼大機率也不會有人去查,除非你的論文太火,被很多人引,不然的話,沒人嫌著蛋疼去查的。哪怕是學生作為參考,發現你的資料有問題,他第一時間懷疑的必定是自己有沒有看懂你的論文,即使他聰明的知道你的資料確實造假了,一般正常人的做法絕不是舉報,而是另換論文,畢竟這個世界上多一事不如少一事,同類型的論文一抓一大把,何必搞得不開心呢?

如果你剛好碰到一個愣頭青,非要把你舉報了,那你就自認倒黴就好了,該處罰處罰。如果你不認真對待論文,建議以後千萬不要進入學術界,近年來草翻的頂級教授也不少了,這些都是嚴重的學術汙點,做學術的人真的要從本科開始就要珍惜自己的羽毛,如果你發一般刊都選擇造假的話,那還是儘早畢業進入業界,這樣學術界的一切破事都不會影響到你。

論文資料造假被發現的可能有多大?匿名使用者2020-07-18 21:53:06

工科的,除了某些SCI的可以看看,國內EI學報這種真實一言難盡。關鍵步驟不提的論文我就不說了,就算提了,反正我用論文裡的引數設定的模擬,每一步都一樣,從我上研究生開始到現在就沒有一篇能完完全全對上的。咱也不敢說是不是咱又少設定什麼了。

比如我們的論文,CFD模擬要和實驗對標證明模擬的真實性。有一篇論文拿RANS算的25度Ahmed模型,結果說氣動阻力系數誤差0。4%?然後說模擬極其準確,呵呵了我簡直,RANS方法算25度Ahmed分離區本來就不準確,再附著位置都算不對,你還敢說0。4%的模擬誤差。我按他的資料資料重新算的誤差7。6%。真的垃圾。這種問題,能不能用RANS算25度Ahmed,可以,但最好說明白該方法有這種缺陷,但對於本文的研究已經足夠,然後這個誤差就不要編地這麼小了。簡直可笑。

當然SCI也不是都行,那次參考了一篇風工程的SCI,正好我需要的那個資料有問題(這個我懷疑是筆誤,不是造假)。就發了一封郵件給他求證一下這個資料,結果是石沉大海。類似的還有摘要的單詞拼錯的,圖畫錯的,太多太多問題了。

不過話又說回來,至少中文EI學報就沒有哪一篇敢提缺點的,篇篇都是最優、最佳、最好、完美、為。。。奠定基礎,呵呵。很多頂級SCI在Conclusion裡會詳細敘述論文方法的侷限性或不完整性,這樣才有繼續研究的必要。你要是真的好好研究,不可能不知道你的研究存在什麼侷限性,那麼在這個侷限性就沒必要造假顯得方法特別正確,說出來大家都理解,有人去研究了能解決再發一篇文章完善就行了。比如驗證函數理論最優是0。2,你的最佳化函式只能得到0。5,但你們業內大家通常使用方法只能得到1。5,那也行啊,你的也有用,為啥都要編成0。21?這種例子簡直不要太多。但我看到有些高水平論文,比如JFM、JFS等等,甚至還有個別模擬和實驗誤差7%以上的,要知道工程模擬誤差要求才5%,這要放到中文學報,不編到1%、2%怎麼可能見刊?

我覺得吧,要是真有一個強有力的真·審稿機構,每篇論文有資料的上傳資料,有程式碼的上傳程式碼,有圖片的上傳圖片,除去審稿再加入專業的審資料,論文數能下降一半多,但篇篇至少都能用。當然這牽動太多人的利益了,估計成立當天晚上就被暗殺了,哈哈。

論文資料造假被發現的可能有多大?科研芝士2020-09-23 11:56:11

論文撤稿原因堪比恐怖小說,同一批實驗大鼠能被反覆殺死再復活?

論文造假被質疑,尤其是被質疑圖片造假,這不是一個新鮮新聞。被質疑後作者撤稿也不是什麼新鮮新聞。

但是撤稿宣告再次被啪啪打臉就是新鮮事了。

最近,就有1篇文章,分數還不低,發表在Cellular physiology and biochemistry上,影響因子5。5,生物二區期刊。

論文資料造假被發現的可能有多大?

知名打假人Hoya Camphorifolia一口氣對其提出3個圖片造假質疑。

論文資料造假被發現的可能有多大?

論文資料造假被發現的可能有多大?

圖片與其他毫不相干的課題組文章出現異常相似。

論文資料造假被發現的可能有多大?

沒過多久,第一作者就回應,會和期刊進行溝通。

論文資料造假被發現的可能有多大?

然後就撤稿了,但撤稿宣告中完全沒有解釋圖片異常,而是說統計學方法出錯了,應該使用重複測量方差分析,但錯誤地使用了單因素方差分析,因此可能影響結果的準確性。

單獨這麼看好像沒毛病,期刊編輯還感謝作者主動提出撤稿,避免了對其他研究者的誤導。

論文資料造假被發現的可能有多大?

然而,讓我們來仔細看一下這篇文章的研究設計。

這篇文章是《慢病毒介導的LFA-1基因沉默抑制腦淋巴阻滯後急性腦缺血大鼠海馬神經元凋亡》,其研究方法為:每組的大鼠都在0h、24h、48h和72h採用頸脫位處死。

論文資料造假被發現的可能有多大?

然後再讓我們來複習一下重複測量方差分析,應該是“同一觀察單位”在不同時間“重複”進行測量。

論文資料造假被發現的可能有多大?

那麼問題就來了,一批大鼠如果0h的時候被殺死了,腦子還被取出來做成切片在顯微鏡下觀察,那麼在24h、48h和72h的大鼠怎麼可能會是重複測量呢?

難不成大鼠在24h被殺死之後再救活了,然後48h再殺死,再復活,然後72h再殺死?

Pubpeer上直接就有人開口質疑。

論文資料造假被發現的可能有多大?

在另一個知名學術打假網站Forbetterscience上也有關於這個撤稿宣告的大段質疑。

論文資料造假被發現的可能有多大?

直接認為這完全是“horror movie”(恐怖電影)的玩法。

這也直接暴露了2個方面的問題

一是從作者層面,圖片的異常相似究竟是什麼原因?用重複測量方差這樣的理由來作為解釋,學術能力到底如何?學術態度又是怎樣?

二是從期刊編輯層面,是怎麼接受重複測量方差這一撤稿原因,甚至還在撤稿聲明裡面感謝作者的呢?

備註:上述內容翻譯自pubpeer和Forbetterscience官網,如有錯漏敬請指正

論文資料造假被發現的可能有多大?北緯2021-04-29 15:27:38

可能性不大。說實話,只要不是發一區二區,基本上沒人理你。

現在很多人資料造假都做得很“聰明”,只是微調,美化資料,不會讓人一眼就看出來。特別是生物化學,你懂的。當初我在實驗室western blot和co-ip做得最熟,大家好多人找我做,做到後來可以說是想跑出什麼圖就能跑出什麼圖,只需要微微調整抗體或者樣本的濃度(都是微摩爾級的),就能出想要的條帶。 更關鍵的是隻要記住這個調整的量,重複性也還不錯,最後只要重複出三五張趨勢類似的圖,地球上除了我沒人能知道這個趨勢是假的。

很多同學的論文根本也沒有創新點,也就重新排列組合,舊瓶裝新酒,其實大家都懂,根本沒有任何學術價值,完全是為了畢業。

很多東西也是先有結果後有資料和過程,老闆希望他是個什麼結果最後湊資料,把不符合結果的資料都去掉,湊過程,把幾次和結果偏離大的實驗過程隱去不提。然後一篇漂亮文章就誕生了。

也怪不得會有《如何八小時完成一篇SCI論文》這樣的指導書。

論文資料造假被發現的可能有多大?

你只是想發個水刊,基本上不會有人狙你,大家都很忙的,誰有精力來管你這些東西。但是不排除你可能會被有競爭關係的人盯上,一般這種就沒辦法,自認倒黴吧。畢竟要想人不知,除非己莫為。

現在科研氛圍就是這樣,學術都是激素催熟的,個個看著頭大,其實根本沒營養。特別是中堅力量,可以說是一無所有。科研本來就是有著很大風險的事情,好多幾千萬投下去連個水花都沒有。但現在只許成功不許失敗,面對這種要求難免就要操作一番。有時候都想問

“既然只有一種實驗結果被允許,那還有什麼必要做實驗?”

學術研究這麼多年,低垂的果實早就被前人摘掉了,剩下的就需要靠精力和經費去堆,如果沒有那個學術信仰,還是不要在這裡面掙扎了。不然很多年後想起來,即使發過不少文章,但總是問心有愧的。

所以你還在考慮透過學術造假來達到某種目的的話,我也沒辦法站在所謂的道德高地去指責你,因為很多事情可能就是不得已而為之,包括我。但如果真的以後要搞學術,還是要珍惜自己的羽毛,畢竟學術這一塊向來容不下汙點。這不像是羅永浩欠了錢,還能慢慢還回去。學術一個蘿蔔一個坑,你這個蘿蔔種壞了,坑可一直都會在那裡。