近日,中國科學(xué)院合肥物質(zhì)院智能所智慧農(nóng)業(yè)研究中心王儒敬研究員團(tuán)隊(duì)提出了一種可學(xué)習(xí)全頻變壓器雙生成對(duì)抗網(wǎng)絡(luò)方法,可顯著提升水下成像質(zhì)量。相關(guān)研究成果發(fā)表在海洋科學(xué)領(lǐng)域TOP期刊Frontiers in marine science上。
水下成像面臨著一系列嚴(yán)峻的挑戰(zhàn),如顏色失真、噪聲干擾和低對(duì)比度問題,這些問題極大地削弱了圖像的視覺質(zhì)量。為了攻克這些難題,科研團(tuán)隊(duì)提出了一種創(chuàng)新的方法——可學(xué)習(xí)全頻變壓器雙生成對(duì)抗網(wǎng)絡(luò)(LFT-DGAN)。該方法首先引入了一種基于可逆卷積的圖像分解技術(shù),能夠?qū)⑺聢D像的信息精準(zhǔn)地分解為低頻、中頻和高頻域,有助于更全面地提取圖像特征;然后,利用圖像通道和空間之間的相似性,構(gòu)建了一個(gè)可學(xué)習(xí)的全頻域變壓器,促進(jìn)不同信息分支之間的交流與融合;最后,開發(fā)了一種功能強(qiáng)大的雙域鑒別器,具備學(xué)習(xí)水下圖像空間特征的能力,能夠深入捕捉其頻域特征。
在UIEB數(shù)據(jù)集上,通過LFT-DGAN方法增強(qiáng)后的圖像質(zhì)量在PSNR、SSIM、UQIM、UCIQE指標(biāo)上比最先進(jìn)算法(CWR、Semi-UIR、RCT等)分別平均提高4.3%、9.4%、21.6%、24.7%。
LFT-DGAN網(wǎng)絡(luò)的整體架構(gòu)
生成器框架