- 相關(guān)推薦
科研論文寫作常見的統(tǒng)計(jì)學(xué)問題
隨著醫(yī)學(xué)科研工作的深入,醫(yī)學(xué)統(tǒng)計(jì)學(xué)的應(yīng)用越來越廣泛,下面是小編搜集整理的科研論文寫作常見的統(tǒng)計(jì)學(xué)問題,供大家閱讀參考。
未交待清楚所用統(tǒng)計(jì)學(xué)方法
論文中所用的統(tǒng)計(jì)方法應(yīng)在最后交待清楚。使用不正確的統(tǒng)計(jì)方法會(huì)得出錯(cuò)誤的結(jié)論,所以統(tǒng)計(jì)方法交待不清或根本不予交待,會(huì)使讀者對(duì)論文結(jié)論的正確與否無法判斷。有的作者只提一句“經(jīng)統(tǒng)計(jì)學(xué)處理”后就寫出結(jié)論,有的甚至于直接用P值說明問題了事。正確的做法應(yīng)寫明具體的統(tǒng)計(jì)方法,如有特殊情況,還應(yīng)說明是否采用了校正,這樣才有說服力。嚴(yán)格地說,應(yīng)寫明精確的統(tǒng)計(jì)量值和P值,如t值、F值、χ2值等,不應(yīng)籠統(tǒng)地以P>0.05或P<0.05代替。此外,最好能交待所使用的計(jì)算工具與統(tǒng)計(jì)軟件名稱。
不考慮統(tǒng)計(jì)方法應(yīng)用條件
每一種統(tǒng)計(jì)方法都有其適用條件。
在表示計(jì)量資料的平均水平時(shí)常用到平均數(shù)。然而平均數(shù)有算術(shù)平均數(shù)、幾何均數(shù)和中位數(shù),各有其應(yīng)用條件。應(yīng)用均數(shù)時(shí),必須首先確定數(shù)據(jù)為正態(tài)分布。如果數(shù)據(jù)是偏態(tài)分布,仍用均數(shù)表示其平均水平勢(shì)必導(dǎo)致錯(cuò)誤的結(jié)論。對(duì)于偏態(tài)分布的數(shù)據(jù),應(yīng)該用幾何均數(shù)或中位數(shù)表示其平均水平。
t檢驗(yàn)要求樣本來自正態(tài)總體,作兩樣本均數(shù)比較時(shí)還要求方差齊。如果不符合這些條件,則應(yīng)考慮進(jìn)行數(shù)據(jù)轉(zhuǎn)換或用非參數(shù)檢驗(yàn);當(dāng)兩小樣本均數(shù)比較方差不齊時(shí),可采用t檢驗(yàn)。例如臨床研究中常涉及病人的病程,有的論文中病程5d至24年的平均水平和離散度為(311±613)年,這種標(biāo)準(zhǔn)差接近或大于均數(shù)的數(shù)據(jù)顯然屬于嚴(yán)重的正偏態(tài),直接進(jìn)行t檢驗(yàn),無疑是錯(cuò)誤的。t檢驗(yàn)不能用于三組或三組以上的組間比較,即使資料符合t檢驗(yàn)的條件也是不行的。因?yàn)橐粍t將原來的多組整體設(shè)計(jì)割裂,失去了總變異和總剩余誤差,與原設(shè)計(jì)思想不符;二則損失了部分信息,降低了檢驗(yàn)效率。
對(duì)于三組或三組以上組間的均數(shù)或分布的比較可以用以下方法:
(1) 如果各樣本來自正態(tài)總體,且方差齊,可用方差分析;
(2) 如果各樣本來自正態(tài)總體,但方差不齊,則可作數(shù)據(jù)轉(zhuǎn)換,待方差齊后再用方差分析;
(3) 如果各樣本分布不清或分布不明,則可考慮用秩和檢驗(yàn)。
在t檢驗(yàn)中,把配對(duì)設(shè)計(jì)的資料作成組比較的t檢驗(yàn),是常見的失誤之一。有的作者誤將配對(duì)數(shù)據(jù)分為兩個(gè)獨(dú)立的組,分別設(shè)計(jì)兩組各自的均數(shù),并按兩組均數(shù)作成組比較的t檢驗(yàn)。這樣使原來只有差值之間的變異擴(kuò)大為“兩個(gè)樣本”各自的變異,錯(cuò)誤地增大了標(biāo)準(zhǔn)差和標(biāo)準(zhǔn)誤差,同時(shí)樣本含量也從原來的對(duì)子數(shù)變成了“兩個(gè)樣本”的例數(shù)之和。其結(jié)果大多使t檢驗(yàn)所得P值增大,可導(dǎo)致差異從有統(tǒng)計(jì)學(xué)意義變?yōu)闊o統(tǒng)計(jì)學(xué)意義。
卡方檢驗(yàn)中的計(jì)算公式較多,各有其適用條件,稍有不慎,即有誤用的可能,應(yīng)根據(jù)實(shí)驗(yàn)設(shè)計(jì)和資料性質(zhì)進(jìn)行正確選擇。
常見的失誤是:
(1) 四格表資料,當(dāng)140時(shí),沒有計(jì)算校正χ2值;
(2) 四格表資料,當(dāng)T<1或n<40時(shí),沒有選用四格表確切概率法;
(3) 行×列表資料,由于例數(shù)太少,致理論頻數(shù)太小,沒有采有適當(dāng)?shù)奶幚矸椒?而是直接計(jì)算χ2值,導(dǎo)致分析的偏性。例如兩組共計(jì)15例,就不宜用一般的卡方檢驗(yàn)公式計(jì)算,應(yīng)該使用確切概率法。
統(tǒng)計(jì)學(xué)基本概念不清
在作統(tǒng)計(jì)推斷時(shí),對(duì)樣本例數(shù)有一定的要求,一般認(rèn)為,樣本例數(shù)太少,所得到的數(shù)值不穩(wěn)定,不能輕易下結(jié)論。
統(tǒng)計(jì)學(xué)上,三組或以上的比較稱為一攬子比較,在作這種比較時(shí),應(yīng)先將所有的組一起比較。在得出差別有統(tǒng)計(jì)學(xué)意義的基礎(chǔ)上,再進(jìn)一步作兩兩比較或多個(gè)處理與同一對(duì)照組比較。論文中常見的錯(cuò)誤是將三組或以上組拆開分別作兩兩比較。正確的方法是:定量資料在方差分析P<0.05后,再用Q檢驗(yàn)或Dunnett法作兩兩比較;定性變量在R×C表資料χ2檢驗(yàn)P<0.05后,再作χ2分割法分析。
對(duì)于有序分類資料(即等級(jí)資料)的統(tǒng)計(jì)處理,在比較各處理組的效應(yīng)有無差別時(shí),宜用秩和檢驗(yàn)、Rid2it分析或交叉積差法及等級(jí)相關(guān)法,但有些作者則誤用卡方檢驗(yàn),此時(shí)作卡方檢驗(yàn)只能說明各處理組的效應(yīng)在構(gòu)成比上有無差異。
對(duì)于“率”與“比”的概念不清,會(huì)導(dǎo)致將構(gòu)成比誤認(rèn)為是發(fā)病率、患病率、死亡率。這三種率均為疾病統(tǒng)計(jì)指標(biāo),要做人群的流行病學(xué)調(diào)查才能得到。在臨床療效研究中,一般無法計(jì)算出這三種率。
相關(guān)回歸分析
相關(guān)分析是分析自變量x與因變量y的關(guān)系,醫(yī)學(xué)領(lǐng)域里完全相關(guān)(相關(guān)系數(shù)r=1或-1)的事件極少。
有作者將一組變量既作為自變量又作為因變量,r=1,認(rèn)為有完全相關(guān)性,這說明對(duì)相關(guān)的概念還不十分清楚。不能把相關(guān)、回歸關(guān)系直接看作因果關(guān)系。兩事物間有數(shù)量關(guān)系,可能是因果關(guān)系,也可能不存在因果關(guān)系,而僅僅是伴隨關(guān)系。
如果求得了兩個(gè)變量間數(shù)量關(guān)系的回歸方程式,或算出了r,在做結(jié)論之前,應(yīng)先作統(tǒng)計(jì)檢驗(yàn);若P>0.05,此回歸方程并無實(shí)際意義。r的實(shí)際意義如何,還要看r絕對(duì)值的大小,因r的統(tǒng)計(jì)學(xué)檢驗(yàn),不論P(yáng)值多么小,只能提供兩個(gè)變量是否相關(guān)的信息,卻不提供相關(guān)是否密切的信息。相關(guān)的密切程度常以r的數(shù)值大小為指標(biāo)。r的絕對(duì)值越接近于1,兩變量的相關(guān)關(guān)系越密切;越接近0,越不密切。r的平方即r2(決定系數(shù))也可表示因變量y與自變量x的關(guān)系密切程度,如果r2=0.22 =0.04,說明因變量y的變異中僅有4%與x有聯(lián)系;此時(shí)若P<0.01,仍不能認(rèn)為兩者“明顯相關(guān)”。
統(tǒng)計(jì)說法不嚴(yán)格
統(tǒng)計(jì)學(xué)上對(duì)差異作是否有顯著性意義的推斷與日常生活中對(duì)差異作是否顯著的推斷完全是兩個(gè)概念。主觀感覺兩個(gè)樣本均數(shù)間的差異并不顯著而統(tǒng)計(jì)學(xué)上作出差異有顯著意義的推斷,主觀感覺兩個(gè)樣本均數(shù)間的差異很大而統(tǒng)計(jì)學(xué)作出其間差異無顯著意義的推斷都是有可能的。既往所用的“差異顯著”、“差異非常顯著”等字句,容易與日常生活判斷的字句相混淆,故現(xiàn)在一般認(rèn)為用“差異有或無統(tǒng)計(jì)學(xué)意義”較為清楚明白。
對(duì)于假設(shè)檢驗(yàn)的結(jié)果,不僅要恰當(dāng)?shù)慕忉、正確地分析,還要準(zhǔn)確地予以表達(dá)。差異有無統(tǒng)計(jì)學(xué)意義,在檢驗(yàn)水準(zhǔn)α=0.05時(shí),一般是以P>0.05或P≤0.05為界線,有作者的結(jié)果為P>0.01,由此判斷差異無統(tǒng)計(jì)學(xué)意義,但P>0.01不一定就是P>0.05,也可能0.010.01同時(shí)也>0.05,才能判斷為差異無統(tǒng)計(jì)學(xué)意義。還有作者的假設(shè)檢驗(yàn)結(jié)果為P=0.100000,雖然不能說是錯(cuò)誤,可是不符合習(xí)慣用法。
數(shù)據(jù)統(tǒng)計(jì)不準(zhǔn)確
文內(nèi)所給出的各種數(shù)據(jù)及統(tǒng)計(jì)要準(zhǔn)確無誤,不能前后有別。有論文的文題是45例患者,而在統(tǒng)計(jì)表中相加為47例,但討論中又說是46例,究竟是多少例患者似乎論文作者自己也說不清,只好退修。對(duì)于相對(duì)數(shù),當(dāng)例數(shù)較少時(shí),一定要有相應(yīng)的絕對(duì)數(shù),如有的組只有4例,治愈2例,即報(bào)道治愈率為50%,這顯然是不妥的。在計(jì)算構(gòu)成比或有些率時(shí),一定要注意合計(jì)必須是100%,有的時(shí)候因?yàn)樗纳嵛迦?合計(jì)為99.18%或100.11%,此時(shí)要作調(diào)整。嚴(yán)格地說,要按有效數(shù)字的運(yùn)算法則“四舍六入,逢五前位奇進(jìn)偶舍”計(jì)算。數(shù)據(jù)錯(cuò)誤多,說明作者缺乏嚴(yán)肅認(rèn)真的科學(xué)態(tài)度。
統(tǒng)計(jì)表不規(guī)范
統(tǒng)計(jì)表的設(shè)計(jì)合理與否,對(duì)論文的質(zhì)量和科學(xué)性有重大的影響。統(tǒng)計(jì)表存在的問題主要有:
(1) 表題過于簡(jiǎn)略,甚至不寫表題;或過于繁瑣以及標(biāo)題不確切;
(2) 標(biāo)目過多,層次不清;
(3) 線條過多;
(4) 表內(nèi)同一指標(biāo)的小數(shù)位數(shù)不一致。
表題應(yīng)扼要說明統(tǒng)計(jì)表的內(nèi)容, 一般不宜超過15個(gè)字。橫標(biāo)目說明各橫行數(shù)字的涵義,縱標(biāo)目說明各縱列數(shù)字的涵義,必要時(shí)在橫、縱標(biāo)目上可冠以總數(shù)目。通常把主語置于橫標(biāo)目,謂語置于縱標(biāo)目。表的線條宜少勿多,常用三線表;除頂線、底線以及隔開縱標(biāo)目與數(shù)字的橫線外,其余線條均可省去,絕對(duì)不要用豎線,特殊情況下加輔助橫線。表內(nèi)數(shù)字一律用阿拉伯?dāng)?shù)字,同一指標(biāo)的小數(shù)位數(shù)應(yīng)一致,位次對(duì)齊。統(tǒng)計(jì)表強(qiáng)調(diào)以最小的篇幅說明最多的問題,避免一切不必要的線條與數(shù)字、符號(hào)和腳注,力戒繁瑣,且勿堆累。若用簡(jiǎn)潔的文字已能說明問題,則盡量不用表。如用了統(tǒng)計(jì)表,則文中不宜再完全重復(fù)其數(shù)據(jù),只需強(qiáng)調(diào)或描述其主要發(fā)現(xiàn)。同一資料,還要避免統(tǒng)計(jì)表與統(tǒng)計(jì)圖之間的重復(fù)。
【科研論文寫作常見的統(tǒng)計(jì)學(xué)問題】相關(guān)文章:
醫(yī)學(xué)論文寫作的常見問題11-18
sci論文寫作常見問題剖析03-22
SCI論文寫作發(fā)表常見問題03-15
科研論文的寫作要求03-25
科研論文寫作的技巧07-20
科研論文寫作格式要求08-30
醫(yī)學(xué)論文的常見問題11-20
論文答辯的常見問題11-24
論文答辯時(shí)常見的問題04-10