版權(quán)歸原作者所有,如有侵權(quán),請聯(lián)系我們

[科普中國]-卷積核

科學(xué)百科
原創(chuàng)
科學(xué)百科為用戶提供權(quán)威科普內(nèi)容,打造知識科普陣地
收藏

卷積核就是圖像處理時,給定輸入圖像,在輸出圖像中每一個像素是輸入圖像中一個小區(qū)域中像素的加權(quán)平均,其中權(quán)值由一個函數(shù)定義,這個函數(shù)稱為卷積核。

卷積核的意義卷積核其實在圖像處理中并不是新事物,Sobel 算子等一系列濾波算子,一直都在被用于邊緣檢測等工作中,只是以前被稱為 Filter。做圖像處理的同學(xué)應(yīng)該有印象。

卷積核具有的一個屬性就是局部性。即它只關(guān)注局部特征,局部的程度取決于卷積核的大小。比如用 Sobel 算子進行邊緣檢測,本質(zhì)就是比較圖像鄰近像素的相似性。

也可以從另外一個角度理解卷積核的意義。學(xué)過信號處理的同學(xué)應(yīng)該記得,時域卷積對應(yīng)頻域相乘。所以原圖像與卷積核的卷積,其實是對頻域信息進行選擇。比如,圖像中的邊緣和輪廓屬于是高頻信息,圖像中某區(qū)域強度的綜合考量屬于低頻信息。在傳統(tǒng)圖像處理里,這是指導(dǎo)設(shè)計卷積核的一個重要方面。

CNN中的卷積核CNN 中的卷積核跟傳統(tǒng)的卷積核本質(zhì)沒有什么不同。仍然以圖像為例,卷積核依次與輸入不同位置的圖像塊做卷積,得到輸出,如圖一。

同時,CNN 有一些它獨特的地方,比如各種定義:

CNN 可以看作是 DNN 的一種簡化形式,即這里卷積核中的每一個權(quán)值就可以看成是 DNN 中的 ,且與 DNN 一樣,會多一個參數(shù)偏置。

一個卷積核在與 Input 不同區(qū)域做卷積時,它的參數(shù)是固定不變的。放在 DNN 的框架中理解,就是對同一層 Layer 中的神經(jīng)元而言,它們的 和 是相同的,只是所連接的節(jié)點在改變。因此在 CNN 里,這叫做 共享權(quán)值偏置。

在 CNN 中,卷積核可能是高維的。假如輸入是 維的,那么一般 卷積核就會選擇為 維,也就是與輸入的 Depth 一致。

最重要的一點,在 CNN 中,卷積核的權(quán)值不需要提前設(shè)計,而是跟 DNN 一樣利用 GD 來優(yōu)化,我們只需要初始化。

如上面所說,其實卷積核卷積后得到的會是原圖的某些特征(如邊緣信息),所以在 CNN 中,卷積核卷積得到的 Layer 稱作特征圖。

一般 CNN 中兩層之間會含有多個卷積核,目的是學(xué)習(xí)出 Input 的不同特征,對應(yīng)得到多個特征圖。又由于卷積核中的參數(shù)是通過 GD 優(yōu)化得到而非我們設(shè)定的,于是初始化就顯得格外重要了。1

本詞條內(nèi)容貢獻者為:

李嘉騫 - 博士 - 同濟大學(xué)