版權(quán)歸原作者所有,如有侵權(quán),請(qǐng)聯(lián)系我們

[科普中國]-等距特征映射

科學(xué)百科
原創(chuàng)
科學(xué)百科為用戶提供權(quán)威科普內(nèi)容,打造知識(shí)科普陣地
收藏

等距特征映射(Laplacian Eigenmaps)使用頻譜技術(shù)來執(zhí)行降維。該技術(shù)依賴于基本假設(shè),即數(shù)據(jù)位于高維空間中的低維流形中。該算法不能嵌入樣本點(diǎn),但是存在基于再生核Hilbert空間正則化的技術(shù)來增加這種能力。這些技術(shù)也可以應(yīng)用于其他非線性降維算法。

介紹主成分分析等傳統(tǒng)技術(shù)不考慮數(shù)據(jù)的內(nèi)在幾何。拉普拉斯算子特征映射根據(jù)數(shù)據(jù)集的鄰域信息構(gòu)建圖形。每個(gè)數(shù)據(jù)點(diǎn)用作圖上的節(jié)點(diǎn),并且節(jié)點(diǎn)之間的連接由相鄰點(diǎn)的接近度控制(使用例如k-最近鄰居算法)。由此生成的圖可以被認(rèn)為是高維空間中的低維流形的離散近似?;谠搱D最小化成本函數(shù)確保在歧管上彼此接近的點(diǎn)在低維空間中彼此靠近地映射,從而保持局部距離。拉普拉斯 - 貝爾特拉米算子在流形上的本征函數(shù)用作嵌入維數(shù),因?yàn)樵跍睾蜅l件下,該算子具有可計(jì)數(shù)的譜,該譜是流形上的平方可積函數(shù)的基礎(chǔ)(與單位圓流形上的傅里葉級(jí)數(shù)相比)。試圖將拉普拉斯特征映射置于堅(jiān)實(shí)的理論基礎(chǔ)上已經(jīng)取得了一些成功,因?yàn)樵谀承┓窍拗菩约僭O(shè)下,隨著點(diǎn)數(shù)變?yōu)闊o窮大,圖拉普拉斯矩陣已經(jīng)顯示收斂到拉普拉斯 - 貝爾特拉米算子。Laplacian Eigenmaps的Matlab代碼可以在算法中找到,Belkin的博士論文可以在俄亥俄州立大學(xué)找到。

應(yīng)用在分類應(yīng)用中,低維流形可用于建模數(shù)據(jù)類,這些數(shù)據(jù)類可以從觀察到的實(shí)例組中定義。每個(gè)觀察到的實(shí)例可以用兩個(gè)獨(dú)立因素來描述,稱為“內(nèi)容”和“風(fēng)格”,其中“內(nèi)容”是與類本質(zhì)相關(guān)的不變因子,“風(fēng)格”表示實(shí)例之間該類的變化。不幸的是,當(dāng)訓(xùn)練數(shù)據(jù)包括在風(fēng)格方面變化很大的實(shí)例時(shí),拉普拉斯特征圖可能無法產(chǎn)生感興趣類的連貫表示。在由多元序列表示的類的情況下,已經(jīng)提出結(jié)構(gòu)拉普拉斯特征映射來通過在拉普拉斯算子特征映射鄰域信息圖中添加附加約束來更好地反映該類的內(nèi)在結(jié)構(gòu)來克服該問題1。更具體地,該圖用于編碼多變量序列的順序結(jié)構(gòu),并且如果其包含重復(fù),則用于最小化風(fēng)格變化,不同序列的數(shù)據(jù)點(diǎn)之間或甚至在序列內(nèi)的接近度。使用動(dòng)態(tài)時(shí)間扭曲,通過找到表現(xiàn)出高相似性的多變量序列的部分之間和之內(nèi)的對(duì)應(yīng)關(guān)系來檢測接近度。在基于視覺的活動(dòng)識(shí)別,面向?qū)ο蠓诸惡腿梭w3D姿勢恢復(fù)應(yīng)用上進(jìn)行的實(shí)驗(yàn)已經(jīng)證明了在處理多變量序列數(shù)據(jù)時(shí)結(jié)構(gòu)拉普拉斯特征圖的附加值。結(jié)構(gòu)拉普拉斯特征圖的擴(kuò)展,廣義拉普拉斯特征圖導(dǎo)致了流形的產(chǎn)生,其中一個(gè)維度特別代表風(fēng)格的變化。事實(shí)證明,這在跟蹤人體關(guān)節(jié)體和輪廓提取等應(yīng)用中尤為重要。

本詞條內(nèi)容貢獻(xiàn)者為:

王沛 - 副教授、副研究員 - 中國科學(xué)院工程熱物理研究所