版權(quán)歸原作者所有,如有侵權(quán),請(qǐng)聯(lián)系我們

[科普中國(guó)]-判定程序

科學(xué)百科
原創(chuàng)
科學(xué)百科為用戶提供權(quán)威科普內(nèi)容,打造知識(shí)科普陣地
收藏

簡(jiǎn)介

判定程序是指對(duì)研究對(duì)象作出屬于哪個(gè)域(屬性)或?qū)ρ芯繉?duì)象的是否好壞作出明確回答的程序。判定程序有很多種,一般與具體應(yīng)用有關(guān)。例如測(cè)試計(jì)算機(jī)性能的基準(zhǔn)程序就是一個(gè)判定程序;又如機(jī)器學(xué)習(xí)或深度學(xué)習(xí)中,分類器就是一個(gè)判定程序。

判定對(duì)于邏輯或數(shù)學(xué)中的問題,依據(jù)一種能行的方法,作出“是”或“否”的明確回答,這一過程,稱為判定。所謂能行方法,包括兩個(gè)要點(diǎn):第一,有限,即一個(gè)判定,必須在有限步內(nèi)完成;第二,機(jī)械,即判定程序的每一步,都有明確的規(guī)則作為依據(jù)。這個(gè)術(shù)語(yǔ)特別用于這樣的求解步驟,在一個(gè)特定的形式系統(tǒng)中,某個(gè)特定的公式能否證明為該系統(tǒng)的一個(gè)定理。

基準(zhǔn)程序基準(zhǔn)程序是用來測(cè)量計(jì)算機(jī)處理速度的一種實(shí)用程序,以便于被測(cè)量的計(jì)算機(jī)性能可以與運(yùn)行相同程序的其它計(jì)算機(jī)性能進(jìn)行比較。具有快速處理器的計(jì)算機(jī)在基準(zhǔn)程序上性能極佳,但如果計(jì)算機(jī)配備的是慢速硬盤及缺少大量存儲(chǔ)器,其性能會(huì)令用戶失望。按基準(zhǔn)程序的構(gòu)造特點(diǎn)可以把它劃分成四類,即:核心程序、小基準(zhǔn)程序、合成基準(zhǔn)程序以及基準(zhǔn)測(cè)試程序組。

核心程序核心程序是從真實(shí)程序中抽取的具有代表性的最耗時(shí)的程序段匯集而成的,它們的代碼很短,但是非常關(guān)鍵。Livermore Loops及LINPACK是兩種最常見的核心程序。LINACK用FORTRAN語(yǔ)言編寫,主要是進(jìn)行浮點(diǎn)加法和浮點(diǎn)乘法的操作。這些代碼的執(zhí)行時(shí)間直接影響到程序總的響應(yīng)時(shí)間。用戶不會(huì)直接使用核心程序,因?yàn)樗墓δ軆H僅是用來測(cè)試計(jì)算機(jī)性能。核心程序可以根據(jù)需要來評(píng)價(jià)機(jī)器的各種性能,從而解釋在運(yùn)行真實(shí)程序時(shí)機(jī)器性能不同的原因。

小基準(zhǔn)程序小基準(zhǔn)程序代碼一般在100行以內(nèi)。用戶可以隨時(shí)縮寫一些這樣的程序來測(cè)試系統(tǒng)的各種功能,并產(chǎn)生用戶已預(yù)知的輸出結(jié)果。通常選取實(shí)際應(yīng)用中具有代表性的求解算法構(gòu)成這一類基準(zhǔn)程序,如皇后問題、迷宮問題、快速排序、求素?cái)?shù)等,這類流行的測(cè)試程序都具有短小、易輸入、通用等特點(diǎn),最適于作一些基本測(cè)試。

合成基準(zhǔn)程序合成基準(zhǔn)程序是人為合成的測(cè)試程序。首先要對(duì)大量應(yīng)用程序中的操作進(jìn)行統(tǒng)計(jì),得到各種操作所占的比例,再按這個(gè)比例人為地寫出測(cè)試程序。Whetstone與Dhrystone是最流行的合成基準(zhǔn)程序。在操作類型和操作數(shù)類型這兩個(gè)方面,合成基準(zhǔn)程序試圖保持與大量程序中的比例一致。用戶不會(huì)自己產(chǎn)生合成基準(zhǔn)程序,因?yàn)槠渲袥]有任何用戶能夠使用的代碼。合成基準(zhǔn)程序完全是人為制造出來的,與實(shí)際應(yīng)用相差更遠(yuǎn)。其中整數(shù)測(cè)試程序是Dhrystone用C語(yǔ)言編寫的,共有100條語(yǔ)句,它包括:各種賦值語(yǔ)句、數(shù)據(jù)類型和數(shù)據(jù)區(qū)、控制語(yǔ)句,過程調(diào)用和參數(shù)傳送、整數(shù)運(yùn)算和邏輯操作。Whetstone基準(zhǔn)測(cè)試程序是用FORTRAN語(yǔ)言編寫的綜合性測(cè)試程序,主要包括:浮點(diǎn)運(yùn)算、整數(shù)算術(shù)運(yùn)算、功能調(diào)用、數(shù)組變址、條件轉(zhuǎn)移、超越函數(shù)。

基準(zhǔn)測(cè)試程序組基準(zhǔn)測(cè)試程序組就是一組各個(gè)方面有代表性的基準(zhǔn)程序組成的一個(gè)通用基準(zhǔn)程序集合。這個(gè)基準(zhǔn)程序的集合稱為基準(zhǔn)程序組(benchmark suites),它的最大優(yōu)點(diǎn)是避免了獨(dú)立基準(zhǔn)程序存在的片面性,盡可能全面地測(cè)試了一個(gè)計(jì)算機(jī)系統(tǒng)的性能,因此對(duì)計(jì)算機(jī)系統(tǒng)設(shè)計(jì)有比較大的指導(dǎo)意義1。

分類器分類是數(shù)據(jù)挖掘的一種非常重要的方法。分類的概念是在已有數(shù)據(jù)的基礎(chǔ)上學(xué)會(huì)一個(gè)分類函數(shù)或構(gòu)造出一個(gè)分類模型(即我們通常所說的分類器(Classifier))。該函數(shù)或模型能夠把數(shù)據(jù)庫(kù)中的數(shù)據(jù)紀(jì)錄映射到給定類別中的某一個(gè),從而可以應(yīng)用于數(shù)據(jù)預(yù)測(cè)。總之,分類器是數(shù)據(jù)挖掘中對(duì)樣本進(jìn)行分類的方法的統(tǒng)稱,包含決策樹、邏輯回歸、樸素貝葉斯、神經(jīng)網(wǎng)絡(luò)等算法。

決策樹分類器提供一個(gè)屬性集合,決策樹通過在屬性集的基礎(chǔ)上作出一系列的決策,將數(shù)據(jù)分類。這個(gè)過程類似于通過一個(gè)植物的特征來辨認(rèn)植物??梢詰?yīng)用這樣的分類器來判定某人的信用程度,比如,一個(gè)決策樹可能會(huì)斷定“一個(gè)有家、擁有一輛價(jià)值在1.5 萬(wàn)到2.3 萬(wàn)美元之間的轎車、有兩個(gè)孩子的人”擁有良好的信用。決策樹生成器從一個(gè)“訓(xùn)練集”中生成決策樹。SGI 公司的數(shù)據(jù)挖掘工具M(jìn)ineSet 所提供的可視化工具使用樹圖來顯示決策樹分類器的結(jié)構(gòu),在圖中,每一個(gè)決策用樹的一個(gè)節(jié)點(diǎn)來表示。圖形化的表示方法可以幫助用戶理解分類算法,提供對(duì)數(shù)據(jù)的有價(jià)值的觀察視角。生成的分類器可用于對(duì)數(shù)據(jù)的分類。

選擇樹分類器選擇樹分類器使用與決策樹分類器相似的技術(shù)對(duì)數(shù)據(jù)進(jìn)行分類。與決策樹不同的是,選擇樹中包含特殊的選擇節(jié)點(diǎn),選擇節(jié)點(diǎn)有多個(gè)分支。比如,在一棵用于區(qū)分汽車產(chǎn)地的選擇樹中的一個(gè)選擇節(jié)點(diǎn)可以選擇馬力、汽缸數(shù)目或汽車重量等作為信息屬性。在決策樹中,一個(gè)節(jié)點(diǎn)一次最多可以選取一個(gè)屬性作為考慮對(duì)象。在選擇樹中進(jìn)行分類時(shí),可以綜合考慮多種情況。選擇樹通常比決策樹更準(zhǔn)確,但是也大得多。選擇樹生成器使用與決策樹生成器生成決策樹同樣的算法從訓(xùn)練集中生成選擇樹。MineSet 的可視化工具使用選擇樹圖來顯示選擇樹。樹圖可以幫助用戶理解分類器,發(fā)現(xiàn)哪個(gè)屬性在決定標(biāo)簽屬性值時(shí)更重要。同樣可以用于對(duì)數(shù)據(jù)進(jìn)行分類。

證據(jù)分類器證據(jù)分類器通過檢查在給定一個(gè)屬性的基礎(chǔ)上某個(gè)特定的結(jié)果發(fā)生的可能性來對(duì)數(shù)據(jù)進(jìn)行分類。比如,它可能作出判斷,一個(gè)擁有一輛價(jià)值在1.5 萬(wàn)到2.3 萬(wàn)美元之間的轎車的人有70 %的可能是信用良好的,而有30 %的可能是信用很差。分類器在一個(gè)簡(jiǎn)單的概率模型的基礎(chǔ)上,使用最大的概率值來對(duì)數(shù)據(jù)進(jìn)行分類預(yù)測(cè)。與決策樹分類器類似,生成器從訓(xùn)練集中生成證據(jù)分類器。MineSet 的可視化工具使用證據(jù)圖來顯示分類器,證據(jù)圖由一系列描述不同的概率值的餅圖組成。證據(jù)圖可以幫助用戶理解分類算法,提供對(duì)數(shù)據(jù)的深入洞察,幫助用戶回答像“如果... 怎么樣" 一類的問題。同樣可以用于對(duì)數(shù)據(jù)進(jìn)行分類。