醫學論文統計學方法應用的錯誤解析論文
摘 要:統計學方法應用正確與否直接關系到醫學科研結果的可信度和有效性,在研究設計時的錯誤應用會否決整個科研研究方案,基于錯誤統計學方法上產生的結果會浪費科研人員的時間和精力。編審人員應該高度重視醫學論文的統計學方法應用,提高單篇文獻的質量和學術水平。
關鍵詞:統計學方法;醫學論文;解析
一、引 言
醫學由于其研究的復雜性和系統性,常需要應用嚴謹的統計學方法,由于有些作者對醫學科研的統計學理論和方法的應用缺乏深刻了解,在醫學論文中錯誤應用統計學方法的現象時有發生。統計學方法應用的錯誤直接導致統計結果的錯誤。例如統計學圖表、統計學指標、統計學的顯著性檢驗等。因此,正確應用統計學方法,并將所獲得的結果進行正確的描述有助于單篇論著的質量提高,現將醫學論文中統計學方法應用及其常見結果的錯誤解析如下。
二、醫學論文統計學方法應用概況
醫學論文的摘要是全文的高度濃縮[1],主要由目的、方法、結果、結論組成。一般要求要寫明主要的統計學方法、統計學研究結果和P值。一篇醫學論文的質量往往通過摘要的統計學結果部分就能判斷。統計學方法的選擇和結果的表達直接影響單篇論著的科研水平。
(一)材料與方法部分
正文中,材料與方法部分必須對統計學方法的選擇、應用、統計學顯著性的設定進行明確說明。通過對統計學方法的描述,讀者應該清楚論著的統計學設計思路。材料部分要清楚說明樣本或病例的來源、入組和排除標準、樣本量大小、研究組和對照組的設定條件、回顧性或者前瞻性研究、調查或者實驗性研究、其他與研究有關的一般資料情況,其目的是表明統計學方法應用的合理性和可靠性,他人作相關研究時具備可重復性。方法部分應詳細敘述研究組和對照組的不同處理過程、觀察的具體指標、采用的測量技術,要具備可比較性和科學性,
方法部分還要專門介紹統計分析方法及其采用的統計軟件。不同的數據處理要采用不同的方法,必須清楚的說明計數或者計量資料、兩組或者多組比較、不同處理因素的關聯性研究。常用的有兩組間計量資料的t檢驗,多組間計量資料的F檢驗,計數資料的卡方檢驗,不同因素之間的相關分析和回歸分析。有些遺傳學研究方法還有專門的統計學方法,要在這里簡要說明并給出參考文獻,還要簡單敘述統計方法的原理。統計學軟件要清楚的說明軟件的名稱和版本號,如基于家系資料研究的FBAT1.7.3版本。
(二)論文結果部分
論文結果部分要顯示應用統計學方法得到的統計量[2],所采用的統計學指標較多時,往往分開敘述。分組比較多時還要借助統計圖表來準確表達統計結果。對于數據的精確度,除了與測量儀器的精密程度有關外,還與樣本本身的均數有關,所得值的單位一般采用緊鄰均數除以三為原則。均數和標準差的有效位數要和原始數據一致。標準差或標準誤差有時需要增加一個位數,百分比一般保留一個小數。在統計軟件中,分析結果往往精確度比較高,一般要采用四舍五入的方法使其靠近實驗的實際情況,否則還會降低論文的可信度和可讀性。
結果部分的統計表采用統一的“三線”表,表題中要注明均數、標準差等數據類型。表格中的數值要按照行和列進行順序放置,要求整齊美觀,不能出現錯行現象。要明確標注觀察的例數,得到的檢驗統計量。統計圖可以直觀的表達研究結果,如回歸和相關分析的散點圖可以顯示個體值的散布情況。曲線圖表達個體均值在不同組別隨時間變化的情況或者不同條件下重復測量的結果。誤差條圖由均數加減標準誤繪出,描述的是67%的置信區間,不是95%,提倡在誤差條圖采用95%的置信區間。
關于統計量,一般采用均數與標準差兩個指標,均數不宜單獨使用。使用均數的時候要明確變異指標標準差或者精確性指標標準誤。關于百分比,分母的確定必須要符合邏輯,過小的樣本會導致分母過小而出現百分比過大的情況。百分率的比較要寫清兩者中不同的變化,可以采用卡方檢驗。
1.假設檢驗的結果中,常見只寫P值的情況,有時候會誤導讀者,也會隱藏計算失誤的情況,因此寫出具體的統計值,如F值、t值,可以增強可信度。對于率、相關系數、均數這類描述統計量,要清楚寫明進行過統計學檢驗并將結果列出。P值一般取0.05與0.01作為檢驗顯著性,對于結果的計算要求具體的P值,如P=0.23或P=0.02。
2.在對論文進行討論時,作為統計學方法產生的結果往往要作為作者的主要觀點支持其科學假設,對統計結果的正確解釋至關重要。P值很大表明兩組間沒有差別屬于大概率事件,P值很小表明兩組間沒有差別的概率很小。當P<;0.05,表明差異具有統計學意義。P值與觀察的樣本量的大小有關聯,當樣本量小的時候,數據之間的差別即使很大,P值也可能很大;當樣本量大時,數據之間的差別即使很小,P值也可能顯示有顯著性差異。相關系數統計學意義的顯著性也與相關系數的大小沒有絕對的關聯,有統計學意義的樣本相關系數可能很小。因此,有統計學差異的描述并不一定意味著兩組間差別很大,錯判的危險性很大,顯著性的檢驗為定性的結果,結合統計量大小方可判斷是否具有專業意義。
變量間虛假的相關關系與變量隨時間變化而變化相關,統計學意義的關聯并不表示變量間一定存在因果關系。因果關系的確定要根據專業知識和采用的'研究方法的不同來考量。使用回歸方程進行分析,當兩變量間具有顯著性關系,但是從自變量推測因變量仍然不會很精確。相關或回歸系數不能預測推測結果的精確程度,而只是預測一個可信區間。診斷性檢驗應用于人群發病率很低的疾病,靈敏度、特異度的高低對于明確疾病診斷并不能很肯定!凹訇栃月省迸c“假陰性率”根據實際的需要不同要求并不一致,在疾病患病率很低時,出現假陽性也是正常的,要確診疾病必須要與臨床癥狀體征相結合。因此,這兩個率的計算方法必須交待清楚。
三、醫學論文統計學方法應用的常見錯誤分析
(一)“材料與方法”中的統計學方法應用的常見錯誤
“材料與方法”中統計學方法常見的問題主要為:對樣本的選擇或者研究對象的來源和分組描述很少或者過于簡單。例如,臨床入組病例分組只采用簡單的隨機分組,未描述隨機分組的方法,未描述是否雙盲雙模擬,未設置空白對照組,分組后對性別、年齡、文化程度的描述未進行統計學檢驗,對于特殊的統計學方法沒有詳細交代;動物實驗分組的隨機化原則描述過于簡單,沒有具體說清完全隨機、配對或分層隨機分組等;統計分析方法沒有任何說明采用的分析軟件,有的只說明采用的分析軟件而不交代在軟件中采用的統計方法;沒有說明原因的情況下出現樣本量過于小等情況。
(二)“結果”統計學方法應用的常見錯誤
1.應用正確的統計學方法出現的結果表達并不一定正確。例如前文所述數據的精確度要求。醫學論文常見錯誤中包括均數、標準差、標準誤等統計學指標與原始數據應保留的小數位數不同;對于率、例數、比值、比值比、相對危險度等統計學指標保留的小數點位數過多;罕見疾病的發病率、患病率、現患率等指標沒有選擇好基數,導致結果沒有整數位;相關系數、回歸系數等指標保留的小數位數過多或者過少;常用的一些檢驗統計量,如F值、t值保留的位數不符合要求。
2.對統計學指標進行分析和計算時,一般采用計數資料和計量資料進行區分。計量資料常用三線表,在近似服從正態分布的前提下采用均數、標準差進行說明,如果不符合正態分布時,可以采用加對數或其他的處理方式使其近似正態分布,否則只能采用中位數和四分位數間距等指標進行描述。醫學論文中常見未對數據進行正態分布檢驗的計算,影響統計結果的真實性和可信度。對于率、構成比等常用的計數資料指標,常見樣本量過小的問題,采用率進行描述會影響統計結果的可靠性,采用絕對數進行說明會顯得客觀一些。還有一些文獻將構成比誤用為率,也是不可取的。
3.在判斷臨床療效之一指標時,兩組平均療效有差別并不意味著兩組的每一個個體都有效或無效,必須通過計算有效率進行計算。如比較某藥物治療糖尿病的療效,服藥一周后,研究組和對照組的對血糖降低值分別為6.7 ±2.4 和1.2 ±0.6 ( P = 0.000 1) 。按空腹血糖值低于7.7mmol/L的療效判定有效率,研究組和對照組的有效率分別為75.6%和12.4% ,盡管平均療效相差較多,但也要注意到該藥物對部分患者無效(24.4%)。對假設檢驗結果的統計學分析結果,P 值的表達提倡報告精確P值,如P = 0.015或P = 0.321等。目前的統計學分析軟件均可自動計算精確的P 值。例如常用的SAS,SPSS等,只要提供原始數據,就可以計算出t值、F值和相應的自由度,并可獲得精確的P值。
四、小 結
提高醫學論文中統計學方法的使用質量是編輯部值得重視的一項長期而又艱巨的工作[3],醫學論文中統計方法應用和統計結果的表達正確與否,不僅體現了論文的科學性和嚴謹性,而且對于提高期刊整體的學術質量,促進醫學科學的發展和傳播也有著重要作用[4]。
參考文獻:
[1] 李敬文,呂相征,薛愛華.醫學期刊評論性文章摘要的添加對期刊被引頻次的影響[J].編輯學報,2011(23).
[2] 陳長生.生物醫學論文中統計結果的表達及解釋[J].細胞與分子免疫學雜志,2008(24).
[3] 潘明志.新時期復合型醫學科技期刊編輯應具備的素質和能力[J].中國科技期刊研究,2011 (22).
[4] 張春軍,董凱.網絡信息時代加強醫學期刊編輯的信息素養[J].牡丹江醫學院學報,2011(32).
【醫學論文統計學方法應用的錯誤解析論文】相關文章: