糯米文學吧

位置:首頁 > 職務 > 統計師

分類數據的統計分析技巧

統計師2.41W

你知道分類數據的統計分析技巧有哪些嗎?你知道什麼是分類數據的統計分析嗎?下面是yjbys小編為大家帶來的關於分類數據的統計分析技巧的知識,歡迎閲讀

分類數據的統計分析技巧

  分類數據的統計分析

  1. 樣本數據與總體比較

1)二分類資料:

(1)小樣本數據:用二項分佈進行確切概率法檢驗;

(2)大樣本數據:用U檢驗;

2)多分類數據:用Pearson檢驗(又稱擬合優度檢驗)。

  2. 四格表(2×2表)數據

1)完全隨機設計的四格表數據的分析

(1)當樣本量n>40,並且4個格子理論數均大於5時,則用Pearson 檢驗;

(2)當樣本量n>40,並且4個格子理論數均大於1且至少存在一個格子的理論數<5時,則用校正檢驗或用Fisher’s精確概率法檢驗;

(3)當樣本量n£40或存在任一格子理論數<1,則用精確概率法檢驗;

2)配對設計的四格表數據的.分析

(1)b+c≥40,則用McNemar配對檢驗;

(2)b+c<40,則用二項分佈確切概率法檢驗;

  3. 2×C表或R×2表數據的統計分析

1)列變量為效應指標,並且為有序多分類變量,行變量為分組變量,則可以採用行平均得分差(Row Mean Scores Differ)的CMH 或成組的Wilcoxon秩和檢驗;

2)列變量為效應指標並且為二分類,行變量為有序多分類變量,則可採用普通的Pearson 檢驗比較各組之間有無差別,如果總的來説有差別,還可進一步作兩兩比較,以説明是否任意兩組之間的差別都有統計學意義。

3)行變量和列變量均為無序分類變量:

(1)當樣本量n>40,並且理論數小於5的格子數少於行列表中格子總數的25%,則用Pearson 檢驗;

(2)當樣本量n£40,或理論數小於5的格子數多於行列表中格子總數的25%,則用Fisher’s確切概率法檢驗;

  4. R×C表數據的統計分析

1)完全隨機設計的R×C表數據的統計分析

(1)列變量為效應指標,並且為有序多分類變量,行變量為分組變量,則CMH 或Kruskal Wallis的秩和檢驗;

(2)列變量為效應指標,並且為無序多分類變量,行變量為有序多分類變量,則採用普通的Pearson 檢驗比較各組之間有無差別,如果總的來説有差別,還可進一步作兩兩比較,以説明是否任意兩組之間的差別都有統計學意義;

(3)列變量和行變量均為有序多分類變量,可以作Spearman相關分析或者非零相關(none zero correlation)的CMH ;

(4)列變量和行變量均為無序多分類變量:

i. 當樣本量n>40並且理論數小於5的格子數少於行列表中格子總數的25%,則用Pearson 檢驗進行分析;

ii. 當樣本量n£40或理論數小於5的格子數多於行列表中格子總數的25%,則用Fisher’s 確切概率法檢驗;

2)配對設計的C×C表數據:

(1)配對比較:用McNemar配對檢驗;

(2)一致性檢驗(Agreement):用Kappa檢驗;

  Poisson分佈數據

1. 單樣本數據與總體比較:

1)當觀察值較小時:可以用確切概率法進行檢驗。

2) 當觀察值較大時:可以用正態近似的U檢驗。

2. 兩個樣本數據的比較:可以用正態近似的U檢驗。

  兩個變量之間的關聯性分析

1. 兩個變量均為連續型變量

1)當兩變量為小樣本並且兩個變量服從雙正態分佈時,可以用Pearson相關係數來衡量兩個變量之間的關聯性;

2)當兩變量為大樣本或兩個變量不服從雙正態分佈,則用Spearman相關係數來衡量兩個變量之間的關聯性;

2. 如果兩個變量均為有序分類變量,可以用Spearman相關係數來衡量兩個變量之間的關聯性;

3. 如果一個變量為有序分類變量,另一個變量為連續型變量,可以用Spearman相關係數來衡量兩個變量之間的關聯性。

標籤:統計分析