糯米文學吧

位置:首頁 > 職務 > 統計師

統計學常見概念及解析

統計師2.63W

統計學常見概念有哪些你知道嗎?下面是yjbys小編為大家帶來的統計學常見概念及解析。歡迎閲讀

統計學常見概念及解析

  (1)自由度 d.f.

統計學上的自由度是指當以樣本的統計量來估計總體的參數時, 樣本中獨立或能自由變化的自變量的個數,稱為該統計量的自由度。 統計學上的自由度包括兩方面的內容:

首先,在估計總體的平均數時,由於樣本中的 n 個數都是相互獨立的,從其中抽出任何一個數都不影響其他數據,所以其自由度為n。

在估計總體的方差時,使用的是離差平方和。只要n-1個數的離差平方和確定了,方差也就確定了;因為在均值確定後,如果知道了其中n-1個數的值,第n個數的值也就確定了。這裏,均值就相當於一個限制條件,由於加了這個限制條件,估計總體方差的自由度為n-1。

例如,有一個有4個數據(n=4)的樣本,其平均值m等於5,即受到m=5的條件限制,在自由確定4、2、5三個數據後, 第四個數據只能是9,否則m≠5。因而這裏的自由度υ=n-1=4-1=3。推而廣之,任何統計量的自由度υ=n-k(k為限制條件的個數)。

其次,統計模型的自由度等於可自由取值的自變量的個數。如在迴歸方程中,如果共有p個參數需要估計,則其中包括了p-1個自變量(與截距對應的自變量是常量1)。因此該回歸方程的自由度為p-1。

  (2)偏相關

Partial correlation coefficient

在多元迴歸分析中,在消除其他變量影響的條件下,所計算的某兩變量之間的相關係數。

在多元相關分析中,簡單相關係數可能不能夠真實的反映出變量X和Y之間的相關性,因為變量之間的關係很複雜,它們可能受到不止一個變量的影響。這個時候偏相關係數是一個更好的'選擇。

假設我們需要計算X和Y之間的相關性,Z代表其他所有的變量,X和Y的偏相關係數可以認為是X和Z線性迴歸得到的殘差Rx與Y和Z線性迴歸得到的殘差Ry之間的簡單相關係數,即pearson相關係數。

  (3)標準迴歸係數

標準迴歸係數,是指消除了因變量y和自變量x1,x2,…xn所取單位的影響之後的迴歸係數,其絕對值的大小直接反映了xi對y的影響程度。

  (4)Wald 檢驗

Wald 統計量我們先對無約束模型得到參數的估計值,再代入約束條件檢查約束條件是否成立;

wald 檢驗一般適用於檢驗非線性的約束條件(當然也可以檢驗線性的約束條件),通過對原方程(無約束模型)進行估計,構造出檢驗統計量,該統計量在大樣本下服從卡方分佈,自由度為約束條件。

wald檢驗的思想是:如果約束是有效的,那麼在沒有約束情況下估計出來的估計量應該漸進地滿足約束條件,因為MLE(極大似然估計)是一致的。

  (5)顯著水平

顯著性水平是估計總體參數落在某一區間內,可能犯錯誤的概率為顯著性水平,用α表示。顯著性是對差異的程度而言的,程度不同説明引起變動的原因也有不同:一類是條件差異,一類是隨機差異。它是在進行假設檢驗時事先確定一個可允許的作為判斷界限的小概率標準。

標籤:統計學 解析