版權(quán)歸原作者所有,如有侵權(quán),請聯(lián)系我們

[科普中國]-隨機序列

科學百科
原創(chuàng)
科學百科為用戶提供權(quán)威科普內(nèi)容,打造知識科普陣地
收藏

隨機序列(random sequence),也稱隨機數(shù)列,全稱隨機變量序列,是由隨機變量組成的數(shù)列。它在概率論和統(tǒng)計學中都十分重要。

簡介隨機數(shù)列的概念在概率論和統(tǒng)計學中都十分重要。整個概念主要構(gòu)建在由隨機變量組成的數(shù)列的基礎(chǔ)之上,因此每每提及到隨機數(shù)列,人們常常會這樣開場:“設(shè) 為隨機變量……”但是也如同美國數(shù)學家得瑞克·亨利·雷莫在1951年時說的那樣:“隨機數(shù)列是一個很模糊的概念……它每一項都是無法預(yù)測中的無法預(yù)測,但是這些數(shù)字卻能夠通過傳統(tǒng)的統(tǒng)計學上的考驗。”

概率公理有意繞過了對隨機數(shù)列的定義。傳統(tǒng)的統(tǒng)計學理論并沒有直接闡明某個數(shù)列是否隨機,而是直接跳過這部分,在假設(shè)某種隨機性存在的前提之下討論隨機變量的性質(zhì)。比如布爾巴基學派就認為,‘假設(shè)一個隨機數(shù)列’這句話是對術(shù)語的濫用。

歷史發(fā)展法國數(shù)學家埃米爾·博雷爾是1909年第一批給出隨機性的正式定義的數(shù)學家之一。在1919年,受大數(shù)定理的啟發(fā),奧地利數(shù)學家理查德·馮·米澤斯給出了第一個算法隨機性的定義。但是,他使用了“集合”這個詞,而不是“隨機數(shù)列”。利用賭博系統(tǒng)的不可能性,馮·米澤斯定義道:若由0和1構(gòu)成的無窮數(shù)列具有“頻率穩(wěn)定性的特點”,也就是說,0的頻率趨進于1/2,且該數(shù)列的每個“以適當方式選取的”子數(shù)列也都沒有偏差,那么我們說,這個數(shù)列是“隨機的”。

馮·米澤斯的這個方法中,“適當選取子數(shù)列”的標準非常重要,因為雖然說“01010101……”本身沒有偏差(0出現(xiàn)的概率為1/2),但是若我們只選奇數(shù)位置上的數(shù)字,得到的子數(shù)列便成了完全不隨機的“000000……”。馮·米澤斯未曾就這個問題正式給出一個選取規(guī)則上的解釋。1940年,美國數(shù)學家阿隆佐·邱奇將這個規(guī)則定義為“任何已經(jīng)讀取該無窮數(shù)列的前N項,并決定是否讀取其第N+1項的遞歸函數(shù)。”邱其是可計算函數(shù)方面的先驅(qū),他給出的這個定義的可計算性基于邱奇-圖靈猜想。這個定義經(jīng)常被稱作“米澤斯-邱其隨機性”(英文:Mises-Church randomness)1。

定義隨機序列的產(chǎn)生為了形容隨機變量形成的序列。

一般的,如果用 (表示 下標于 )代表隨機變量,這些隨機變量如果按照順序出現(xiàn),就形成了隨機序列,記做 (表示n上標于x)。這種隨機序列具備兩種關(guān)鍵的特點:其一,序列中的每個變量都是隨機的;其二,序列本身就是隨機的。

舉例說明為了說明什么是隨機序列,這里來舉兩個例子。

假設(shè)持續(xù)扔一個骰子,會得到一系列隨機數(shù),即1到6的整數(shù),將連續(xù)擲骰子作為一個事件,那么這個事件應(yīng)該包括扔第一次骰子得到的點數(shù),扔第二次得到的點數(shù),直到扔第次得到的點數(shù)。把每次扔的的點數(shù)按順序分別記做 。這里每個X的取值可能為。那么我們可以寫出隨機序列:

更實際的,可以用高速路收費站來說明。假設(shè)一個收費站有10個出口。那么,把收費站出口出去的車數(shù)記做隨機變量 ,這里 就是集合 ,集合中每個元素的取值為。那么如果按照時間順序觀察,不難得出一個隨機序列,這個序列表示出口出去車數(shù)的一個變化情況,是一個序列,記做: 。

處理隨機數(shù)列的方式現(xiàn)如今,有三個處理隨機序列的方式2:

1.頻率-測量理論法

這個方法建立在前文的米澤斯和邱其的方法的基礎(chǔ)之上。 在1960年代,佩爾·馬丁-洛夫注意到,人們能夠?qū)懴禄陬l率生成隨機數(shù)列的代碼,而這些代碼的集合是一種特殊的零測度集。在此基礎(chǔ)之上,通過利用所有的零測度集,人們能夠得到一個更加放之四海而皆準的隨機序列定義。

2.復(fù)雜度-可壓縮度法

柯爾莫哥洛夫本人對這個方法貢獻巨大,其次還有列文和阿根廷裔美國數(shù)學家格里高列·蔡廷等也作出了一定的貢獻。對于有限項的隨機數(shù)列,柯爾莫哥洛夫?qū)⑺碾S機性定義為“熵”,也就是后來的柯氏復(fù)雜性。這個定義下,一個包含了0與1組成的、長度為的字符串(或者數(shù)列,二者并無本質(zhì)上的區(qū)別),其“熵”的大小為這個數(shù)列的最短描述的長度和的接近程度。字符串的復(fù)雜度越接近于,它也會越隨機;而字符串的復(fù)雜性越低于,它也就越不隨機。

3.可預(yù)測性法

這個方法由德國數(shù)學家克勞斯·施諾提出。他用了一個和傳統(tǒng)概率論稍有不同的鞅的定義。他證明了“若人們擁有一個下注策略,可以從多種可能中選擇出最優(yōu)的方案,那么人們也可以用類似的策略選出一個有偏差的子集。”如果人們只需要一個遞歸性的鞅(而不是構(gòu)造的方式)便能夠成功選出數(shù)列的話,那么人們就該使用遞歸隨機性的概念中。美國數(shù)學家Yongge Wang則證明出,遞歸隨機性和施諾的隨機性并不是同一個概念。

這三個方式在大多數(shù)情況下被證實是等價的。

需要注意的是,按照以上任意一個關(guān)于無限數(shù)列的隨機性定義,由于都是著眼于隨機性趨勢,因此對數(shù)據(jù)開頭部分的隨機性不敏感。如果在隨機數(shù)列的第一項前插入哪怕一百萬個0,得出的仍然會是隨機數(shù)列。因此,應(yīng)用這幾個定義時應(yīng)該小心謹慎。

本詞條內(nèi)容貢獻者為:

胡啟洲 - 副教授 - 南京理工大學