樣本量估算及G*Power實現詳細步驟(圖文詳解)
樣本量估算及G*Power實現詳細步驟(圖文詳解)
1。統計學基本概念
(1)假設檢驗、H0、H1
假設檢驗(hypothesis test)
又稱顯著性檢驗(significant test),我們進行研究的目的多是為了比較總體引數差異,但實際中能夠獲取的是樣本統計量資料,樣本資料間直接比較不能準確反應總體引數情況。
樣本統計量比較存在差異時,可能是總體引數差異引起的,也可能是樣本的抽樣誤差引起的。
假設檢驗中,引入
原假設(null hypothesis)H0
,和與H0完全對立的
備擇假設(alternative hypothesis)H1
。
H0:總體引數無差異
H1:總體引數有差異
可以根據樣本統計量的差值的資料型別、研究設計、推斷目的,選擇不同的檢驗統計量計算方法(t檢驗、z檢驗、F檢驗、卡方檢驗等),計算出得到該差值的機率P,
如果P≤α(預設的檢驗水準),可傾向於拒絕H0,傾向於接受H1;
如果P>α,則不足以拒絕H0,不足以接受H1。
(2)I類錯誤(α)、II類錯誤(β)
當H0成立,但因為樣本的隨機性,拒絕了H0,為
I類錯誤
,又稱
假陽性錯誤
,檢驗水準
α
即為預先規定的允許犯I類錯誤的機率。
當H1成立,但因為樣本的隨機性,不拒絕H0,為
II類錯誤
,又稱
假陰性錯誤
,用
β
表示(需要總體引數及樣本含量才能計算出)。
正如紅樓夢中所說,
假作真時真亦假
,其中假作真即為假陽性,I類錯誤;真亦假即為假陰性,II類錯誤。
當I類錯誤機率α約小,出現II類錯誤機率β越大,反之亦然。
增大樣本量,可以同時減少α和β。
(3)檢驗效能
檢驗效能(power of a test),
又稱
把握度,
H1成立時正確拒絕H0的能力,用
1-β
表示。
把握度大小取決於四個方面:①兩總體差異越大,1-β越大;②α越大,1-β越大;
③單側檢驗比雙側檢驗大;④樣本量越大,1-β越大。
(4)效應量
效應量(effect size),表示兩總體分佈的重疊程度,也就是自變數作用的大小。常見的效應量包括兩總體均數的差值、兩總體率的差值等。差值越大,表示兩總體重疊程度越小,效應越明顯。
(5)效應量與差異顯著性、相關顯著性的區別
差異顯著性、相關顯著性
只是告訴我們,我們有1-α的把握認為,這
差異、這相關係數是存在的,並不是完全由抽樣誤差造成的
。但這代表差異、相關有實際的意義。尤其是大樣本資料分析比較容易得到統計顯著性的結果,但不意味著差異有意義。
效應量
,表示的是
自變數作用的大小
。
(6)樣本量
樣本量(sample size),樣本量過小,假設檢驗效能不夠,無法顯現出不同處理組間的差異,樣本量過大,需要增加大量人力、物力的投入。
樣本量大小受以下因素影響:①α越小,樣本量越大;②β越小,樣本量越大;
③總體間效應量越小,即兩總體重疊約小,所需樣本量越大
④總體變異性越大,所需樣本量越大
2。G*Power 軟體安裝及軟體介紹
(1)G*Power安裝
下載地址(www。gpower。hhu。de)
解壓縮資料夾後,雙擊setup,進行安裝。
開啟後可見如下主介面。
(2)G*Power介紹
G*Power是德國杜塞爾多夫大學開發的,專門用於計算統計功效及樣本量的統計軟體。該軟體是完全免費的。軟體可以計算t檢驗、F檢驗、χ2檢驗、z檢驗、Fisher檢驗等不同檢驗方法的樣本量。
G*Power提供5種統計力分析型別:
3。G*Power計算樣本量
使用G*Power分析計算分為3步:
S1:選擇合適的統計方法
S2:選擇5種統計力分析型別中的1種
S3:輸入分析需要的引數,點選計算即可
(1) 如下圖,從Test family中選擇t檢驗、F檢驗、χ2檢驗、z檢驗或Fisher檢驗。
從Statistical test中進一步選擇分類
(2)G*Power中有5種統計力分析型別可選,計算樣本量選擇先驗分析(priori)。
(3)下框中輸入分析需要的引數,點選計算即可
4。例項演示-兩獨立樣本均數比較的樣本量計算
首先看第6版醫學統計學人衛版課本P159例15-4,該例子使用公式計算出了需要的樣本量。
使用G*Power,選擇兩組獨立樣本t檢驗,輸入引數:雙尾、d=δ/σ=2。76/1。70=1。62352941、α=0。05、1-β=0。9、N2/N1=1,點選計算得到N1=10,N2=10,(公式算出n1=n2=8)
使用G*Power,選擇兩組獨立樣本t檢驗,輸入引數:雙尾、d=δ/σ=2。76/1。70=1。62352941、α=0。05、1-β=0。9、N2/N1=2,點選計算得到N1=7,N2=15,(公式算出n1=6,n2=12)
可發現使用G*Power得到的樣本量與使用公式得到的樣本近似,但比公式結果略大。可能因為計算過程中精確度選擇原因導致。