糯米文學吧

位置:首頁 > 職務 > 統計師

概率論與統計學的關係是什麼

統計師2.5W

統計學合稱為“概率統計”,但顯然這兩者是有關係,但不是同一的,那麼二者的關係究竟是什麼呢?簡單來説,概率論研究的是“是什麼”的問題,統計學研究的是‘怎麼辦“的問題。下面是yjbys小編為大家帶來的概率論與統計學的關係的知識,歡迎閲讀

概率論與統計學的關係是什麼

  概率論與統計學的關係

統計學不必然用到概率論,比如用樣本均值來表徵總體某種特徵的大致水平,這個和概率就沒有關係。

但是因為概率論研究的對象是隨機現象,而統計學恰恰充滿了無處不在的隨機現象:因為要隨機抽樣。因此概率論就成為了精確刻畫統計工具的不二法門

Lry Wssermn 在 ll of Sttistics 的序言裏有説過概率論和統計推斷的區別,相對於上面的圖,更加透徹:

The bsic problem tht we study in probbility is:

Given dt generting process, wht re the properities of the outcomes?

...

The bsic problem of sttisticl inference is the inverse of probbility:

Given the outcomes, wht cn we sy bout the process tht generted the dt?

概率論是統計推斷的基礎,在給定數據生成過程下觀測、研究數據的性質;而統計推斷則根據觀測的數據,反向思考其數據生成過程。預測、分類、聚類、估計等,都是統計推斷的特殊形式,強調對於數據生成過程的研究。

統計和概率是方法論上的區別,一個是推理,一個是歸納。

打個比方,概率論研究的是一個白箱子,你知道這個箱子的構造(裏面有幾個紅球、幾個白球,也就是所謂的分佈函數),然後計算下一個摸出來的球是紅球的概率。而統計學面對的是一個黑箱子,你只看得到每次摸出來的是紅球還是白球,然後需要猜測這個黑箱子的內部結構,例如紅球和白球的比例是多少?(參數估計)能不能認為紅球40%,白球60%?(假設檢驗)

而概率論中的許多定理與結論,如大數定理、中心極限定理等保證了統計推斷的合理性。做統計推斷一般都需要對那個黑箱子做各種各樣的假設,這些假設都是概率模型,統計推斷實際上就是在估計這些模型的參數。

  概率論是統計學的基石。

統計學是從舊時的賭博來的.。當時的賭徒們通過歷史數據的記錄,逐漸總結出了描述性統計。利用這些描述性統計的數據,使得他們勝率直線上升。哪個有賺哪個穩賠,哪個波動大沒規律,這些經驗逐漸成為了知識,並在之後的各個領域裏體現了這種智慧。

賭博中的統計,就是要用以往的勝敗估計下一次成功的大小。為什麼能夠這樣做,為什麼以往的數據能對下一次數據有較為準確的估計,這是概率論要説清楚的。大數定律的三個定理就是要説明為什麼樣本均值可以估計總體均值。這個估計的準確性卻是要由統計學説的,對於各種分佈的參數估計,之後的模擬估測,雖然與概率論看似完全無關,實際上卻是由他們在支撐着統計學這個科目。這個情況對於參數統計,非參數統計,半參數統計,都是一樣的。

  總結起來,一個是對原理的討論,一個是對方法的討論。

1.概率論是數學分支,統計不是。

2.學概率要有很好的數學基礎(測度論,實變函數論),統計不然。

3.在學統計的人眼中,研究概率和研究純數學一樣。在學概率的人眼中,統計和數學沒太大關係和工科一樣。

概率論是由概率分佈推斷樣本性質,如大數定律、中心極限定理。

統計是由樣本信息反推概率分佈,如概率分佈參數的點估計、區間估計,以及線性迴歸。

在現實中二者結合很緊密。通過樣本訓練出概率分佈,相當於老師不斷教學生知識(樣本),讓學生大腦形成當前對象的模型;在學生學會了之後,就相當於這個模型(概率分佈)成型了,就可以自己去推導、產生知識(樣本)。

概率論就好比是給你一個模型,你可以知道這個模型會產生什麼樣的數據;而統計則是給你一些數據,你來判斷是由什麼樣的模型產生的。

再從小概率事件看看兩者的關係:概率論會説小概率事件必然發生。因為隨着試驗次數的增多,該事件會發生的期望np終會大於1。統計則傾向於忽略小概率事件或者認為小概率事件不會發生。例如MLE提供了最大似然估計,估計是一個以假設值代替真實值的過程,這個過程一個自然的思想便是認為小概率不會發生,所以我們有充足的理由認為估計是可接受的。

  從源頭談一談吧:

  統計學有兩個源頭,概率論和國情學。

16世紀,概率論的體系漸漸發展起來,而這要從一種和擲骰子有關的賭博活動説起。雖然這個起源並不是很光彩,而且有待考證,但是在歐洲興起並興盛的骰子賭博活動,引起了一批好奇的學者的關注。擲骰子得到的點數直接決定賭局的輸贏,於是開始研究各種點數出現的機遇的大小,勝率的大小,最早開始數量研究並且給概率下定義的學者已經無從考證了,可是有一些著作的問世和問題的討論對概率統計的發展產生了重大的影響,比如卡丹諾的《機遇博弈》、惠更斯的《機遇的規律》 、伯努利的《推測數》 、著名的分賭本問題、帕斯卡和費馬之間的通信,在這期間,古典概型得到了極大的發展,概率、期望、二項分佈、中心極限定理等概念被相繼提出。

統計學的英文是“sttistic”,其實它是源於意大利文的“stto”,意思是“國家”、“情況”,也就是後來英語裏的stte(國家),在十七、十八世紀,統計學很多時候都是以國情學的姿態出現的。而且很長一段時間,都是在研究人口統計,尤其是生男生女的比例問題。概率論和國情學的融合,統計學漸漸發展也是從這開始。在這期間時,一些重要的理論被發現,二項分佈和大數定律。根據二項分佈建立了統計推斷的最早的模型而且,而且對此分佈中未知概率的研究也成為貝葉斯學派的思想起源。而之後的幾百年裏,中心極限定理的漸漸完善的過程中,一系列的統計量相繼被提出,這也構成了大樣本方法的基礎。

概率論是統計學的基礎,統計學是概率論的發展,二者密不可分。

標籤:概率論 統計學