版權(quán)歸原作者所有,如有侵權(quán),請(qǐng)聯(lián)系我們

[科普中國(guó)]-條件概率

科學(xué)百科
原創(chuàng)
科學(xué)百科為用戶提供權(quán)威科普內(nèi)容,打造知識(shí)科普陣地
收藏

基本概念

條件概率

條件概率是指事件A在另外一個(gè)事件B已經(jīng)發(fā)生條件下的發(fā)生概率。條件概率表示為:P(A|B),讀作“在B條件下A的概率”。若只有兩個(gè)事件A,B,那么,

概率測(cè)度

如果事件 B 的概率 P(B) > 0,那么 Q(A) = P(A | B) 在所有事件 A 上所定義的函數(shù) Q 就是概率測(cè)度。 如果 P(B) = 0,P(A | B) 沒(méi)有定義。 條件概率可以用決策樹進(jìn)行計(jì)算。1

聯(lián)合概率

表示兩個(gè)事件共同發(fā)生的概率。A與B的聯(lián)合概率表示為 P(AB) 或者P(A,B),或者P(A∩B)。2

邊緣概率

是某個(gè)事件發(fā)生的概率,而與其它事件無(wú)關(guān)。邊緣概率是這樣得到的:在聯(lián)合概率中,把最終結(jié)果中不需要的那些事件合并成其事件的全概率而消失(對(duì)離散隨機(jī)變量用求和得全概率,對(duì)連續(xù)隨機(jī)變量用積分得全概率)。這稱為邊緣化marginalization)。A的邊緣概率表示為P(A),B的邊緣概率表示為P(B)。

需要注意的是,在這些定義中A與B之間不一定有因果或者時(shí)間順序關(guān)系。A可能會(huì)先于B發(fā)生,也可能相反,也可能二者同時(shí)發(fā)生。A可能會(huì)導(dǎo)致B的發(fā)生,也可能相反,也可能二者之間根本就沒(méi)有因果關(guān)系。例如考慮一些可能是新的信息的概率條件性可以通過(guò)貝葉斯定理實(shí)現(xiàn)。3

基本定理定理1

設(shè)A,B 是兩個(gè)事件,且A不是不可能事件,則稱為在事件A發(fā)生的條件下,事件B發(fā)生的條件概率。一般地,,且它滿足以下三條件:

(1)非負(fù)性;(2)規(guī)范性;(3)可列可加性。

定理2

設(shè)E 為隨機(jī)試驗(yàn),Ω 為樣本空間,A,B 為任意兩個(gè)事件,設(shè)P(A)>0,稱為在“事件A 發(fā)生”的條件下事件B 的條件概率。

上述乘法公式可推廣到任意有窮多個(gè)事件時(shí)的情況。

設(shè),,…為任意n 個(gè)事件(n≥2)且,則

定理3(全概率公式)

定義:(完備事件組/樣本空間的劃分)

設(shè)B1,B2,…Bn是一組事件,若

(1)

(2)B1∪B2∪…∪Bn=Ω

則稱B1,B2,…Bn樣本空間Ω的一個(gè)劃分,或稱為樣本空間Ω 的一個(gè)完備事件組。

定理(全概率公式):

設(shè)事件組 是樣本空間Ω 的一個(gè)劃分,且P(Bi)>0(i=1,2,…n)

則對(duì)任一事件B,有

定理4(貝葉斯公式)

設(shè)B1,B2,…Bn…是一完備事件組,則對(duì)任一事件A,P(A)>0,有

統(tǒng)計(jì)獨(dú)立性當(dāng)且僅當(dāng)兩個(gè)隨機(jī)事件A與B滿足

P(A∩B)=P(A)P(B)

的時(shí)候,它們才是統(tǒng)計(jì)獨(dú)立的,這樣聯(lián)合概率可以表示為各自概率的簡(jiǎn)單乘積。

同樣,對(duì)于兩個(gè)獨(dú)立事件A與B有

P(A|B)=P(A)

以及

P(B|A)=P(B)

換句話說(shuō),如果A與B是相互獨(dú)立的,那么A在B這個(gè)前提下的條件概率就是A自身的概率;同樣,B在A的前提下的條件概率就是B自身的概率。

互斥性當(dāng)且僅當(dāng)A與B滿足

P(A|B)=0

且P(A)≠0,P(B)≠0

的時(shí)候,A與B是互斥的。

因此,

P(A|B)=0

P(B|A)=0

換句話說(shuō),如果B已經(jīng)發(fā)生,由于A不能和B在同一場(chǎng)合下發(fā)生,那么A發(fā)生的概率為零;同樣,如果A已經(jīng)發(fā)生,那么B發(fā)生的概率為零。

其它如果事件B的概率,P(B)>0

那么Q(A)=P(A|B)在所有事件A上所定義的函數(shù)Q就是概率測(cè)度。

如果P(B)=0,P(A|B)沒(méi)有定義。

著名謬論條件概率的謬論是假設(shè) P(A|B) 大致等于 P(B|A)。數(shù)學(xué)家John Allen Paulos 在他的《數(shù)學(xué)盲》一書中指出醫(yī)生、律師以及其他受過(guò)很好教育的非統(tǒng)計(jì)學(xué)家經(jīng)常會(huì)犯這樣的錯(cuò)誤。這種錯(cuò)誤可以通過(guò)用實(shí)數(shù)而不是概率來(lái)描述數(shù)據(jù)的方法來(lái)避免。

P(A|B) 與 P(B|A)的關(guān)系如下所示:

P(B|A)=P(A|B)P(B)/P(A)

下面是一個(gè)虛構(gòu)但寫實(shí)的例子,P(A|B) 與 P(B|A)的差距可能令人驚訝,同時(shí)也相當(dāng)明顯。

若想分辨某些個(gè)體是否有重大疾病,以便早期治療,我們可能會(huì)對(duì)一大群人進(jìn)行檢驗(yàn)。雖然其益處明顯可見,但同時(shí),檢驗(yàn)行為有一個(gè)地方引起爭(zhēng)議,就是有檢出假陽(yáng)性的結(jié)果的可能:若有個(gè)未得疾病的人,卻在初檢時(shí)被誤檢為得病,他可能會(huì)感到苦惱煩悶,一直持續(xù)到更詳細(xì)的檢測(cè)顯示他并未得病為止。而且就算在告知他其實(shí)是健康的人后,也可能因此對(duì)他的人生有負(fù)面影響。

這個(gè)問(wèn)題的重要性,最適合用條件機(jī)率的觀點(diǎn)來(lái)解釋。

假設(shè)人群中有1%的人罹患此疾病,而其他人是健康的。我們隨機(jī)選出任一個(gè)體,并將患病以disease、健康以well表示:

P(disease) = 1% = 0.01 and P(well) = 99% = 0.99. 假設(shè)檢驗(yàn)動(dòng)作實(shí)施在未患病的人身上時(shí),有1%的機(jī)率其結(jié)果為假陽(yáng)性(陽(yáng)性以positive表示)。意即:

P(positive | well) = 1%,而且P(negative | well) = 99%. 最后,假設(shè)檢驗(yàn)動(dòng)作實(shí)施在患病的人身上時(shí),有1%的機(jī)率其結(jié)果為假陰性(陰性以negative表示)。意即:

P(negative | disease) = 1%且P(positive | disease) = 99%。現(xiàn)在,由計(jì)算可知:

是整群人中健康、且測(cè)定為陰性者的比率。

P(positive|disease) = 99% 是整群人中得病、且測(cè)定為陽(yáng)性者的比率。

是整群人中被測(cè)定為假陽(yáng)性者的比率。

是整群人中被測(cè)定為假陰性者的比率。

進(jìn)一步得出:

是整群人中被測(cè)出為陽(yáng)性者的比率。

P(disease|positive) = 50% 是某人被測(cè)出為陽(yáng)性時(shí),實(shí)際上真的得了病的機(jī)率。

這個(gè)例子里面,我們很輕易可以看出 P(positive|disease)=99% 與 P(disease|positive)=50% 的差距:前者是你得了病,而被檢出為陽(yáng)性的條件機(jī)率;后者是你被檢出為陽(yáng)性,而你實(shí)際上真得了病的條件機(jī)率。由我們?cè)诒纠兴x的數(shù)字,最終結(jié)果可能令人難以接受:被測(cè)定為陽(yáng)性者,其中的半數(shù)實(shí)際上是假陽(yáng)性。4