版權(quán)歸原作者所有,如有侵權(quán),請聯(lián)系我們
神經(jīng)機(jī)器翻譯中的語義一致性數(shù)據(jù)增強(qiáng)方法
CCF計(jì)算機(jī)科普
由中國計(jì)算機(jī)學(xué)會(huì)主辦,提供優(yōu)質(zhì)的計(jì)算機(jī)科普內(nèi)容。
視頻簡介:
數(shù)據(jù)增強(qiáng)方法是一種有效擴(kuò)充數(shù)據(jù)規(guī)模的技術(shù),并且在視覺等領(lǐng)域取得了顯著的效果,但是在自然語言處理領(lǐng)域,這項(xiàng)技術(shù)還沒有得到很好的應(yīng)用。我們通過引入條件掩碼語言模型和軟增強(qiáng)改進(jìn)了機(jī)器翻譯訓(xùn)練中的詞替換數(shù)據(jù)增強(qiáng)技術(shù),使得在增強(qiáng)的過程中,可以保留源句和目標(biāo)句的語義以及它們之間的跨語言互譯關(guān)系。