中誤差是衡量觀測(cè)精度的一種數(shù)字標(biāo)準(zhǔn),亦稱“標(biāo)準(zhǔn)差”或“均方根差”。在相同觀測(cè)條件下的一組真誤差平方中數(shù)的平方根。因真誤差不易求得,所以通常用最小二乘法求得的觀測(cè)值改正數(shù)來(lái)代替真誤差。它是觀測(cè)值與真值偏差的平方和觀測(cè)次數(shù)n比值的平方根。
中誤差不等于真誤差,它僅是一組真誤差的代表值。中誤差的大小反映了該組觀測(cè)值精度的高低,因此,通常稱中誤差為觀測(cè)值的中誤差。
采用原因代替值在實(shí)際測(cè)量中,觀測(cè)次數(shù)n總是有限的,真值只能用最或然值(常用多次觀測(cè)的平均值)來(lái)代替。
標(biāo)準(zhǔn)差標(biāo)準(zhǔn)差(Standard Error)是方差(Variance)的平方根,對(duì)一組測(cè)量中的特大或特小誤差反映非常敏感,能夠很好地反映出測(cè)量結(jié)果波動(dòng)大小。這正是標(biāo)準(zhǔn)差在工程測(cè)量中廣泛被采用的原因。1
產(chǎn)生原因由某種固定的原因造成的,使測(cè)定結(jié)果偏高或偏低,重復(fù)測(cè)定時(shí)會(huì)重復(fù)出現(xiàn),系統(tǒng)誤差的大小幾乎是一個(gè)恒定值,因而又被稱之為恒定誤差或可測(cè)誤差。它產(chǎn)生的原因有以下幾點(diǎn):
系統(tǒng)誤差由某種固定的原因造成的,使測(cè)定結(jié)果偏高或偏低,重復(fù)測(cè)定時(shí)會(huì)重復(fù)出現(xiàn),系統(tǒng)誤差的大小幾乎是一個(gè)恒定值,因而又被稱之為恒定誤差或可測(cè)誤差。它產(chǎn)生的原因有以下幾點(diǎn):
**儀器誤差:**儀器本身不夠精度或未經(jīng)校正所引起的,如天平、砝碼和量器刻度不夠準(zhǔn)確。為避免引起儀器誤差,我們應(yīng)對(duì)所使用的量器及天平進(jìn)行校正。
**試劑誤差:**由于試劑不純或蒸餾水中含有微量雜質(zhì)所引起的誤差。消除方法可進(jìn)行空白實(shí)驗(yàn),在不加試樣的情況下,按照被測(cè)試樣的分析步驟和條件進(jìn)行分析,得到的結(jié)果為空白值,從試樣的分析結(jié)果中減去“空白值”就可以得到更接近真實(shí)含量的分析結(jié)果。
**方法誤差:**這種誤差是由于分析方法本身所造成的。如重量分析時(shí),由于沉淀的溶解造成損失或因吸附某些雜質(zhì)而產(chǎn)生誤差;或滴定分析中,因?yàn)榉磻?yīng)不完全或干擾離子的影響,以及滴定終點(diǎn)和等當(dāng)點(diǎn)不符合等。
**操作誤差:**正常操作條件下,由于分析人員掌握操作規(guī)程與正確控制條件稍有出入而引起的誤差。如滴定管讀數(shù)時(shí)偏高或偏低,對(duì)某種顏色的變化辨別不夠敏銳等所造成的誤差。
偶然誤差偶然誤差也稱不定誤差,它是由某些偶然因素:測(cè)定時(shí)環(huán)境的溫度、濕度氣壓的微小波動(dòng),或由于外界條件的影響而使安放在操作臺(tái)上的天平受到微小的震動(dòng)所引起的。其影響有時(shí)大、有時(shí)小。因而偶然誤差難以察覺(jué),也難以控制。
隨著測(cè)定次數(shù)的增加偶然誤差的算術(shù)平均值將逐漸接近于零。因而有必要時(shí),應(yīng)多次測(cè)定 ,但并非實(shí)驗(yàn)次數(shù)越多越好,這樣只浪費(fèi)更多的人力、物力。一般測(cè)定中,做2~3次平行測(cè)定可達(dá)到不超過(guò)規(guī)定誤差的目的。
粗差粗差即粗大誤差,是指比在正常觀測(cè)條件下所可能出現(xiàn)的最大誤差還要大的誤差,通俗地說(shuō),粗差要比偶然誤差大上好幾倍。例如觀測(cè)時(shí)大數(shù)讀錯(cuò),計(jì)算機(jī)輸入數(shù)據(jù)錯(cuò)誤,航測(cè)像片判讀錯(cuò)誤,控制網(wǎng)起始數(shù)據(jù)錯(cuò)誤等。這種錯(cuò)誤或誤差,在一定程度上可以避免。但在使用現(xiàn)今的測(cè)量技術(shù)如全球定位系統(tǒng)(GPS)、地理信息系統(tǒng)(GIS)、遙感(RS)以及其他高精度的自動(dòng)化數(shù)據(jù)采集中,經(jīng)常是粗差混入信息之中,識(shí)別粗差源并不是簡(jiǎn)單方法可以達(dá)到目的的,需要通過(guò)數(shù)據(jù)處理方法進(jìn)行識(shí)別和消除其影響。2
計(jì)算公式測(cè)量誤差按其對(duì)測(cè)量結(jié)果影響的性質(zhì),可分為:
一.系統(tǒng)誤差(system error)
1.定義:在相同觀測(cè)條件下,對(duì)某量進(jìn)行一系列觀測(cè),如誤差出現(xiàn)符號(hào)和大小均相同或按一定的規(guī)律變化,這種誤差稱為系統(tǒng)誤差。
2.特點(diǎn):具有積累性,對(duì)測(cè)量結(jié)果的影響大,但可通過(guò)一般的改正或用一定的觀測(cè)方法加以消除。
二.偶然誤差(accident error)
1.定義:在相同觀測(cè)條件下,對(duì)某量進(jìn)行一系列觀測(cè),如誤差出現(xiàn)符號(hào)和大小均不一定,這種誤差稱為偶然誤差。但具有一定的統(tǒng)計(jì)規(guī)律。
2.特點(diǎn):
(1) 具有一定的范圍。
(2) 絕對(duì)值小的誤差出現(xiàn)概率大。
(3) 絕對(duì)值相等的正、負(fù)誤差出現(xiàn)的概率相同。
(4) 數(shù)學(xué)期限望等于零。即:
誤差概率分布曲線呈正態(tài)分布,偶然誤差要通過(guò)的一定的數(shù)學(xué)方法(測(cè)量平差)來(lái)處理。此外,在測(cè)量工作中還要注意避免粗差(gross error)(即:錯(cuò)誤)的出現(xiàn)。3
衡量精度的指標(biāo)測(cè)量上常見的精度指標(biāo)有:中誤差、相對(duì)誤差、極限誤差。
一.中誤差
方差
——某量的真誤差,∑——求和符號(hào)。
規(guī)律:標(biāo)準(zhǔn)差估值(中誤差m)絕對(duì)值愈小,觀測(cè)精度愈高。
在測(cè)量中,n為有限值,計(jì)算中誤差m的方法,有:
1.用真誤差(true error)來(lái)確定中誤差——適用于觀測(cè)量真值已知時(shí)。
真誤差Δ——觀測(cè)值與其真值之差,有:
標(biāo)準(zhǔn)差
中誤差(標(biāo)準(zhǔn)差估值), n為觀測(cè)值個(gè)數(shù)。
2.用改正數(shù)來(lái)確定中誤差(白塞爾公式)——適用于觀測(cè)量真值未知時(shí)。
V——最或是值與觀測(cè)值之差。一般為算術(shù)平均值與觀測(cè)值之差,即有:
二.相對(duì)誤差
1.相對(duì)中誤差
2.往返測(cè)較差率K
中誤差和鄰近關(guān)系的多尺度面算法研究研究背景整合和更新來(lái)自不同來(lái)源、不同比例尺、不同時(shí)間段的表示同一地圖目標(biāo)的地理數(shù)據(jù)越來(lái)越引起人們的關(guān)注??臻g面狀地物和自然要素在很多地圖表示中都占有很大的比例,可以用來(lái)表示房屋、土地利用、面狀水體和植被等,它是地圖表達(dá)和地圖使用者關(guān)心的主要內(nèi)容,本文主要討論多尺度空間面實(shí)體的匹配??臻g面實(shí)體數(shù)據(jù)主要有空間特征和屬性特征,空間特征主要包括幾何特征和拓?fù)涮卣?,幾何特征主要包括重心位置、中心位置、面積大小和邊界,拓?fù)涮卣髦饕娣e重疊度、屬性成分關(guān)聯(lián)度;屬性特征主要是使用實(shí)體的屬性信息。
空間面匹配,國(guó)外學(xué)者作過(guò)大量的研究。在幾何匹配方面,文獻(xiàn)提出面質(zhì)心結(jié)合多種匹配檢驗(yàn)規(guī)則的幾何匹配方法,通過(guò)面實(shí)體柵格化后收縮來(lái)確定質(zhì)心,然后將其矢量化,用點(diǎn)在面內(nèi)的規(guī)則進(jìn)行粗匹配,再結(jié)合多邊形的面積A和面密度C進(jìn)行匹配檢驗(yàn),最終判斷匹配情況。文獻(xiàn)通過(guò)匹配面的邊界來(lái)計(jì)算邊界的距離來(lái)檢測(cè)不同時(shí)間點(diǎn)的空間面的明顯不同,該方法適合于明確的邊界的面數(shù)據(jù),不適合于大量變化的地形數(shù)據(jù)。文獻(xiàn)提出一種基于鄰近關(guān)系確定面與面大致的關(guān)系,輔助Hausdorff距離來(lái)區(qū)分面之間的匹配關(guān)系,來(lái)確定面之間的共軛點(diǎn),可以用來(lái)匹配面數(shù)據(jù)。語(yǔ)義信息主要取決于空間數(shù)據(jù)模型和屬性數(shù)據(jù)模型,語(yǔ)義信息可以用來(lái)輔助匹配關(guān)系。文獻(xiàn)提出一種基于知識(shí)的非空間屬性數(shù)據(jù)匹配策略,通過(guò)計(jì)算屬性項(xiàng)的相似度值以確定匹配實(shí)體。文獻(xiàn)提出一種基于語(yǔ)義和結(jié)構(gòu)的相似性的屬性數(shù)據(jù)匹配方法,來(lái)匹配正式和非正式的地理數(shù)據(jù)。
國(guó)內(nèi)學(xué)者也作了大量的工作,文獻(xiàn)提出基于模糊拓?fù)潢P(guān)系分類的匹配方法,該方法計(jì)算形態(tài)距離比較麻煩,只適合于房屋等人工地物。文獻(xiàn)在擴(kuò)展文獻(xiàn)的概率論匹配算法的基礎(chǔ)上提出一種多準(zhǔn)則融合算法,對(duì)于面數(shù)據(jù),主要采用重心S和面的重疊度A指標(biāo),指標(biāo)的權(quán)重是由專家經(jīng)驗(yàn)來(lái)獲取的。文獻(xiàn)提出基于相似性的面實(shí)體匹配方法,該方法適合于相似比例尺的地圖數(shù)據(jù)的匹配。文獻(xiàn)提出了基于成分關(guān)聯(lián)區(qū)域相似度的面實(shí)體模糊匹配算法,但模糊分類比較困難,不適合多比例尺數(shù)據(jù)。文獻(xiàn)也提出一種基于幾何特征的多尺度的面實(shí)體匹配方法,這也是一種基于相似性的匹配方法,需要確定各個(gè)指標(biāo)的權(quán)重。面匹配的算法還存在一些問(wèn)題。首先,如何確定每個(gè)指標(biāo)的閾值或者權(quán)重。需要確定的閾值主要有:緩沖區(qū)半徑、Hausdorff距離、形態(tài)距離、屬性相似性。指標(biāo)的閾值
都與比例尺密切相關(guān)。概率匹配、相似性匹配雖然都不需要閾值,但是每個(gè)指標(biāo)的權(quán)重在不同的比例尺下是不相同的,如何確定權(quán)重也是一個(gè)難點(diǎn)。面數(shù)據(jù)由點(diǎn)組成,利用點(diǎn)的精度信息來(lái)匹配空間數(shù)據(jù),文獻(xiàn)等首先使用點(diǎn)距離信息確定匹配,緩沖區(qū)大小根據(jù)地圖的點(diǎn)位精度而定。文獻(xiàn)也利用地圖中點(diǎn)的誤差來(lái)實(shí)現(xiàn)點(diǎn)的匹配,但是點(diǎn)位誤差很難確定。其次,如何確定面的M∶N關(guān)系。大多都匹配算法都是基于文獻(xiàn)提出的雙向匹配策略,但是其方法只適合于點(diǎn)匹配。文獻(xiàn)提出用面數(shù)據(jù)的鄰近關(guān)系,利用聚集算法可以確定面與面數(shù)據(jù)之間的多對(duì)多的關(guān)系的大致關(guān)系,再根據(jù)Hausdorff距離確定數(shù)據(jù)之間的精確關(guān)系,該距離沒(méi)有考慮多尺度情況下的匹配,需要統(tǒng)計(jì)數(shù)據(jù)才能確定范圍。最后,很難確定數(shù)據(jù)匹配不確定性的范圍,錯(cuò)誤信息的范圍對(duì)人工交互的過(guò)程有重要的影響。文獻(xiàn)提出一種基于證據(jù)理論來(lái)匹配點(diǎn)目標(biāo),但是計(jì)算每個(gè)指標(biāo)的信任度仍然是一個(gè)經(jīng)驗(yàn)的過(guò)程。根據(jù)制圖誤差理論,中誤差作為數(shù)據(jù)質(zhì)量和地圖綜合的指標(biāo),而且其大小范圍隨著比例尺的變化而變化,可以有效地應(yīng)用于多尺度空間數(shù)據(jù)的匹配,并可以確定數(shù)據(jù)不確定性的范圍。本文在文獻(xiàn)提出的鄰近關(guān)系匹配的基礎(chǔ)上,提出一種基于中誤差和鄰近關(guān)系的多尺度空間面實(shí)體匹配算法,不僅可以確定準(zhǔn)確的數(shù)據(jù)范圍,同時(shí)可以確定不確定性的匹配范圍,同時(shí)考慮了不同比例尺下制圖綜合的影響,可以有效應(yīng)用于多尺度面實(shí)體匹配。
基于中誤差和鄰近關(guān)系的算法原理(1)中誤差
中誤差是衡量觀測(cè)精度的一種數(shù)字標(biāo)準(zhǔn),亦稱“標(biāo)準(zhǔn)差”或“均方根差”。它是觀測(cè)值與真值偏差的平方和與觀測(cè)次數(shù)n比值的平方根。點(diǎn)位誤差表示點(diǎn)位的觀測(cè)值與真值之差,制圖規(guī)范中的點(diǎn)位誤差用地物點(diǎn)和控制點(diǎn)的位置中誤差來(lái)衡量。點(diǎn)位誤差概率分布曲線呈正態(tài)分布或類正態(tài)分布。
點(diǎn)誤差的大小通過(guò)中誤差來(lái)衡量,其概率分布滿足正態(tài)分布的點(diǎn)位誤差表示99%以上的點(diǎn)都分布2倍中誤差以內(nèi),中誤差的大小隨著數(shù)據(jù)源的不同而變化,但是傳統(tǒng)的規(guī)范制圖中規(guī)定同比例尺中誤差的范圍是固定的,該范圍隨著比例尺的變大而變大,中誤差σ必須滿足-σmax≤σ≤σmax。
(2)鄰近關(guān)系
對(duì)于多對(duì)多匹配關(guān)系也是一個(gè)匹配的難點(diǎn)問(wèn)題,引入鄰近關(guān)系來(lái)完成面與面之間最終的匹配。M:N匹配實(shí)際上是一個(gè)聚類問(wèn)題,表示分別用M面和N面來(lái)表示同一個(gè)地物目標(biāo)。文獻(xiàn)提出利用鄰近關(guān)系來(lái)合并分散的面片,文獻(xiàn)在此工作的基礎(chǔ)上用面與面之間的疊置關(guān)系來(lái)確定面之間關(guān)系。前面可以通過(guò)計(jì)算中誤差距離可以初步確定要素的對(duì)應(yīng)關(guān)系,可以充分利用上一步匹配過(guò)濾之后的匹配成果來(lái)完成M:N匹配。對(duì)于原始要素S對(duì)應(yīng)的候選集合的每個(gè)要素,可以反向搜索每個(gè)候選要素的對(duì)應(yīng)的疊置的集合,并將該要素添加到“源要素”集中,構(gòu)建M要素集合和N要素集合,最終完成M:N匹配。
研究結(jié)論本文根據(jù)制圖誤差理論,利用空間數(shù)據(jù)的中誤差范圍信息和數(shù)據(jù)鄰近關(guān)系來(lái)匹配多尺度空間面實(shí)體數(shù)據(jù)。利用中誤差信息可以有效地提高初始搜索到準(zhǔn)確率,首先確定1:0以及1:M關(guān)系,通過(guò)建立鄰近關(guān)系矩陣來(lái)確定數(shù)據(jù)的多對(duì)多關(guān)系,并通過(guò)擴(kuò)大范圍確定相對(duì)低一些的信任度的匹配關(guān)系,接著將這些關(guān)系進(jìn)行人工交互處理,最終完成整個(gè)匹配的過(guò)程。和已有的方法比較,本算法具有良好的準(zhǔn)確度和效率,試驗(yàn)結(jié)果表明該方法具有有效性和實(shí)用性。
本算法有以下幾個(gè)方面的特點(diǎn):首先,不需要專家經(jīng)驗(yàn)或統(tǒng)計(jì)學(xué)習(xí)的方法確定每個(gè)指標(biāo)的閾值。中誤差范圍只是由匹配的目標(biāo)尺度決定,不受地圖綜合和制圖方法的影響。其次,依據(jù)制圖誤差理論,可以適用于各種來(lái)源不同比例尺的地理數(shù)據(jù)。再次,算法從高信任度的匹配數(shù)據(jù)來(lái)推理相對(duì)信任度的數(shù)據(jù),同時(shí)將低信任度交給用戶交互,進(jìn)一步提高了匹配的效率,更符合數(shù)據(jù)生產(chǎn)的過(guò)程。最后,本文的方法適用于嚴(yán)格的制圖規(guī)范下的多尺度地理數(shù)據(jù)的匹配,不一定適用于沒(méi)有按照制圖規(guī)范制作的志愿者地理數(shù)據(jù)。志愿者地理信息作為空間數(shù)據(jù)的一個(gè)新的重要的來(lái)源,如何有效地整合志愿地理數(shù)據(jù)和傳統(tǒng)的數(shù)據(jù),是下一步研究的方向。4
本詞條內(nèi)容貢獻(xiàn)者為:
陳紅 - 副教授 - 西南大學(xué)