糯米文學吧

2017中級統計師統計基礎考點:抽樣分佈

導語:總體分佈是總體中所有觀測值所形成的分佈,這是在中級統計師中關於統計基礎的抽樣分佈的相關內容,大家一起來看看吧。

2017中級統計師統計基礎考點:抽樣分佈

  一.總體分佈與總體參數

總體分佈是總體中所有觀測值所形成的分佈。

總體參數是對總體特徵的某個概括性的度量。通常有總體平均數()、總體方差()、總體比例(π)等。

  二.統計量和抽樣分佈

總體參數是未知的,但可以利用樣本信息來推斷。

統計量是根據樣本數據計算的用於推斷總體的某些量,是對樣本特徵的某個概括性度量。

統計量是樣本的函數,如樣本均值()、樣本方差(s2 )、樣本比例(p)等。

構成統計量的函數中不能包括未知因素。

由於樣本是從總體中隨機抽取的,樣本具有隨機性,由樣本數據計算出的統計量也就是隨機的。抽樣分佈是樣本統計量所形成的概率分佈,如樣本均值的分佈、樣本比例的分佈等。

在現實中,一個樣本的統計量我們可以觀察到,但不能觀察到所有可能的統計量值,抽樣分佈是一種理論分佈。

統計量的取值是依據樣本而變化的,不同的樣本可以計算出不同的統計量值。那麼,根據統計量來推斷總體參數就必然具有某種不確定性。但我們可以給出這種推斷的可靠性,而度量這種可靠性的依據是統計量的概率分佈,並且我們確知這種分佈的某些性質。因此,統計量的概率分佈提供了該統計量長遠而穩定的信息,它構成了推斷總體參數的理論基礎。

  (一)樣本均值的抽樣分佈

設總體共有N個元素,從中隨機抽取一個容量為n的樣本,在重置抽樣時,共有Nn 種抽法,即可以組成Nn不同的樣本,在不重複抽樣時,共有個可能的樣本。每一個樣本都可以計算出一個均值,這些所有可能的抽樣均值形成的分佈就是樣本均值的分佈。但現實中不可能將所有的樣本都抽取出來,因此,樣本均值的概率分佈實際上是一種理論分佈。數理統計學的相關定理已經證明

即樣本均值的均值就是總體均值。

在重置抽樣時,樣本均值的`方差為總體方的1/n,即

在不重置抽樣時,樣本均值的方差為

其中,為修正係數,對於無限總體進行不重置抽樣時,可以按照重置抽樣計算,當總體為有限總體,N比較大而n/N≥5% 時,修正係數可以簡化為1-n/N,當N比較大,而n/N<5%時,修正係數可以近似為1,即可以按重置抽樣計算。

當總體服從正態分佈時,樣本均值一定服從正態分佈,即有X~N(,)時,

若總體為未知的非正態分佈時,只要樣本容量 n足夠大(通常要求n ≥30),樣本均值仍會接近正態分佈。樣本分佈的期望值為總體均值,樣本方差為總體方差的1/n 。這就是統計上著名的中心極限定理。該定理可以表述為:從均值為,方差為的總體中,抽取樣本量為n的隨機樣本,當n充分大時(通常要求n ≥30),樣本均值的分佈近似服從均值為,方差為的正態分佈。

如果總體不是正態分佈,當n為小樣本時(通常n<30),樣本均值的分佈則不服從正態分佈。

  (二)樣本比例的抽樣分佈

比例是指具有某種屬性的單位佔全部單位數的比重。

總體比例(通常用表示)是總體中具有某種屬性的單位數佔全部總體單位數的比例,是一個參數,通常是未知的,也是我們想通過抽樣得到的説明總體特徵的數據。

樣本比例(通常用p表示)是隨機抽取的樣本中具有某種屬性的單位數佔樣本全部單位數的比例,是一個樣本統計量,是隨機變量,對於一個已經抽取出來的樣本來講,是可以觀察到的。描述所有可能樣本比例的概率分佈就是樣本比例的抽樣分佈。

當樣本容量比較大時,樣本比例p近似服從正態分佈,且有p的數學期望就是總體比率π,即

而P的方差與抽樣方法有關,在重置抽樣下為,在不重置抽樣下為

即在重置抽樣時, p的分佈為p~N

在不重置抽樣時, p的分佈為p~N

一般講,當 np≥5,並n(1-p)≥5時,就可以認為樣本容量足夠大。對於無限總體進行不重置抽樣時,可以按照重置抽樣計算,當總體為有限總體,當N比較大,而n/N 5%時,修正係數可以近似為1,這時也可以按重置抽樣計算。

從上述分析可以看出,隨着樣本容量的增大,樣本比例的方差愈來愈小,説明樣本比例隨樣本容量增大,圍繞總體比例分佈的峯度愈來愈高。

  三.統計量的標準誤差

統計量的標準誤差也稱為標準誤,是指樣本統計量分佈的標準差。可用於衡量樣本統計量的離散程度。在參數估計中,它是用於衡量樣本統計量與總體參數之間差距的一個重要尺度。

樣本均值的標準誤差計算公式為:

當總體標準差未知時,可用樣本標準差s代替計算,這時計算的標準誤差稱為估計標準誤差。

相應地,樣本比例的標準誤計算公式為

同樣,當總體比例的方差 π(1-π)未知時,可用樣本比例的方差p(1-p)代替。