分類數據的統計分析技巧
你知道分類數據的統計分析技巧有哪些嗎?你知道什麼是分類數據的統計分析嗎?下面是yjbys小編為大家帶來的關於分類數據的統計分析技巧的知識,歡迎閲讀。
分類數據的統計分析
1. 樣本數據與總體比較
1)二分類資料:
(1)小樣本數據:用二項分佈進行確切概率法檢驗;
(2)大樣本數據:用U檢驗;
2)多分類數據:用Pearson檢驗(又稱擬合優度檢驗)。
2. 四格表(2×2表)數據
1)完全隨機設計的四格表數據的分析
(1)當樣本量n>40,並且4個格子理論數均大於5時,則用Pearson 檢驗;
(2)當樣本量n>40,並且4個格子理論數均大於1且至少存在一個格子的理論數<5時,則用校正檢驗或用Fisher’s精確概率法檢驗;
(3)當樣本量n£40或存在任一格子理論數<1,則用精確概率法檢驗;
2)配對設計的四格表數據的.分析
(1)b+c≥40,則用McNemar配對檢驗;
(2)b+c<40,則用二項分佈確切概率法檢驗;
3. 2×C表或R×2表數據的統計分析
1)列變量為效應指標,並且為有序多分類變量,行變量為分組變量,則可以採用行平均得分差(Row Mean Scores Differ)的CMH 或成組的Wilcoxon秩和檢驗;
2)列變量為效應指標並且為二分類,行變量為有序多分類變量,則可採用普通的Pearson 檢驗比較各組之間有無差別,如果總的來説有差別,還可進一步作兩兩比較,以説明是否任意兩組之間的差別都有統計學意義。
3)行變量和列變量均為無序分類變量:
(1)當樣本量n>40,並且理論數小於5的格子數少於行列表中格子總數的25%,則用Pearson 檢驗;
(2)當樣本量n£40,或理論數小於5的格子數多於行列表中格子總數的25%,則用Fisher’s確切概率法檢驗;
4. R×C表數據的統計分析
1)完全隨機設計的R×C表數據的統計分析
(1)列變量為效應指標,並且為有序多分類變量,行變量為分組變量,則CMH 或Kruskal Wallis的秩和檢驗;
(2)列變量為效應指標,並且為無序多分類變量,行變量為有序多分類變量,則採用普通的Pearson 檢驗比較各組之間有無差別,如果總的來説有差別,還可進一步作兩兩比較,以説明是否任意兩組之間的差別都有統計學意義;
(3)列變量和行變量均為有序多分類變量,可以作Spearman相關分析或者非零相關(none zero correlation)的CMH ;
(4)列變量和行變量均為無序多分類變量:
i. 當樣本量n>40並且理論數小於5的格子數少於行列表中格子總數的25%,則用Pearson 檢驗進行分析;
ii. 當樣本量n£40或理論數小於5的格子數多於行列表中格子總數的25%,則用Fisher’s 確切概率法檢驗;
2)配對設計的C×C表數據:
(1)配對比較:用McNemar配對檢驗;
(2)一致性檢驗(Agreement):用Kappa檢驗;
Poisson分佈數據
1. 單樣本數據與總體比較:
1)當觀察值較小時:可以用確切概率法進行檢驗。
2) 當觀察值較大時:可以用正態近似的U檢驗。
2. 兩個樣本數據的比較:可以用正態近似的U檢驗。
兩個變量之間的關聯性分析
1. 兩個變量均為連續型變量
1)當兩變量為小樣本並且兩個變量服從雙正態分佈時,可以用Pearson相關係數來衡量兩個變量之間的關聯性;
2)當兩變量為大樣本或兩個變量不服從雙正態分佈,則用Spearman相關係數來衡量兩個變量之間的關聯性;
2. 如果兩個變量均為有序分類變量,可以用Spearman相關係數來衡量兩個變量之間的關聯性;
3. 如果一個變量為有序分類變量,另一個變量為連續型變量,可以用Spearman相關係數來衡量兩個變量之間的關聯性。
-
統計師考試《初級基礎》備考鞏固模擬題及答案
要想獲得高分,那就要從基礎抓起。下面是小編分享的統計師考試《初級基礎》備考鞏固模擬題,歡迎大家練習!l.統計的認識過程是()。A.從定量認識到定性認識B.從定量認識到定性認識,再到定量認識與定性認識相結合C.從定性認識到定量認識D.從定性認識到定量認識,再到定量...
-
2017年中級統計師《統計基礎理論及相關知識》練習
人生重要的不是所站的位置,而是所朝的方向。下面是小編為大家蒐集整理出來的有關於2017年中級統計師《統計基礎理論及相關知識》練習,希望可以幫助到大家!多項選擇題1、作為經濟資產,應該具備的條件是()。A.資產所有權為某個或某些機構單位所擁有B.資產所有者能夠...
-
統計師考試如何減少出錯率
很多同學,在做練習過程中,容易馬虎,每次都丟了很多不該丟的分,會做的題做錯。具體症狀如下:題目看錯,難題不會做,簡單送分題做錯,思路正確但計算出錯、抄錯導致丟分或算不下去。粗心馬虎丟分的原因大致歸為兩條,並給出相應的解決方法,來防止考場上碰到會做的題出錯。你有...
-
2016初級統計師《統計專業》考試模擬題及答案
一、單項選擇題1.當可靠度大於0.6827時,抽樣極限誤差()。A.大於抽樣平均誤差B.小於抽樣平均誤差C.等於抽樣平均誤差D.與抽樣平均誤差的大小關係依樣本容量而定2.對某行業職工收入情況進行抽樣調查,得知其中80%的職工收入在800元以下,抽樣平均誤差為2%,當概率為95.4...