糯米文學吧

位置:首頁 > 範文 > 工作方案

如何選擇數據分析方法

數據分析技術層面須把握三大關鍵:變量、數據分析方法、變量和方法的關聯

如何選擇數據分析方法

認識數據分析方法:對數據進行統計分析時,選擇正確的分析方法是非常重要的。選擇統計分析方法時,必須考慮許多因素,主要有:

(1)統計分析的目的,

(2)所用變量的特徵,

(3)對變量所作的假定,

(4)數據的收集方法(即抽樣過程)。

選擇統計分析方法時一般考慮前兩個因素就足夠了。

小樣本並且兩個變量服從雙正態分佈,則用pearson相關係數做統計分析

大樣本或兩個變量不服從雙正態分佈,則用spearman相關係數進行統計分析

2、兩個變量均為有序分類變量,可以用spearman相關係數進行統計分析

3、一個變量為有序分類變量,另一個變量為連續型變量,可以用spearman相關係數進行統計分析

【2】迴歸分析

1、直線迴歸:

如果迴歸分析中的殘差服從正態分佈(大樣本時無需正態性),殘差與自變量無趨勢變化,則直線迴歸(單個自變量的線性迴歸,稱為簡單迴歸),否則應作適當的變換,使其滿足上述條件。

2、多重線性迴歸:

應變量(y)為連續型變量(即計量資料),自變量(x1,x2,…,xp)可以為連續型變量、有序分類變量或二分類變量。如果迴歸分析中的殘差服從正態分佈(大樣本時無需正態性),殘差與自變量無趨勢變化,可以作多重線性迴歸。

觀察性研究:可以用逐步線性迴歸尋找(擬)主要的影響因素

實驗性研究:在保持主要研究因素變量(干預變量)外,可以適當地引入一些其它可能的混雜因素變量,以校正這些混雜因素對結果的混雜作用

3、二分類的logistic迴歸:

應變量為二分類變量,自變量(x1,x2,…,xp)可以為連續型變量、有序分類變量或二分類變量。

非配對的情況:用非條件logistic迴歸

(1)觀察性研究:可以用逐步線性迴歸尋找(擬)主要的影響因素

(2)實驗性研究:在保持主要研究因素變量(干預變量)外,可以適當地引入一些其它可能的混雜因素變量,以校正這些混雜因素對結果的混雜作用

配對的情況:用條件logistic迴歸

(1)觀察性研究:可以用逐步線性迴歸尋找(擬)主要的`影響因素

(2)實驗性研究:在保持主要研究因素變量(干預變量)外,可以適當地引入一些其它可能的混雜因素變量,以校正這些混雜因素對結果的混雜作用

4、有序多分類有序的logistic迴歸:

應變量為有序多分類變量,自變量(x1,x2,…,xp)可以為連續型變量、有序分類變量或二分類變量。

觀察性研究:可以用逐步線性迴歸尋找(擬)主要的影響因素

實驗性研究:在保持主要研究因素變量(干預變量)外,可以適當地引入一些其它可能的混雜因素變量,以校正這些混雜因素對結果的混雜作用

5、無序多分類有序的logistic迴歸:

應變量為無序多分類變量,自變量(x1,x2,…,xp)可以為連續型變量、有序分類變量或二分類變量。

觀察性研究:可以用逐步線性迴歸尋找(擬)主要的影響因素

實驗性研究:在保持主要研究因素變量(干預變量)外,可以適當地引入一些其它可能的混雜因素變量,以校正這些混雜因素對結果的混雜作用

如何選擇數據分析方法 [篇2]

把握兩個關鍵

1、抓住業務問題不放鬆。您費大力氣收集數據的動機是什麼?你想解決什麼問題?這是核心,是方向,這是業務把握層面。

2、全面理解數據。哪些變量,什麼類型?適合或者可以用什麼統計方法,這是數據分析技術層面。須把握三大關鍵:變量、數據分析方法、變量和方法的關聯。

認識變量認識數據分析方法

選擇合適的數據分析方法是非常重要的。選擇數據分析(統計分析)方法時,必須考慮許多因素,主要有:

1、數據分析的目的,

2、所用變量的特徵,

3、對變量所作的假定,

4、數據的收集方法。選擇統計分析方法時一般考慮前兩個因素就足夠了。

將變量與分析方法關聯、對應起來

標籤:數據分析