介紹
隨著計(jì)算機(jī)技術(shù)和人工智能技術(shù)及其相關(guān)學(xué)科的迅猛發(fā)展,整個(gè)社會(huì)的自動(dòng)化程度不斷提高,人們對(duì)類(lèi)似于人和人交流方式的人機(jī)交互的需求日益強(qiáng)烈。計(jì)算機(jī)和機(jī)器人如果能夠像人類(lèi)那樣具有理解和表達(dá)情感的能力,將從根本上改變?nèi)伺c計(jì)算機(jī)之間的關(guān)系,使計(jì)算機(jī)能夠更好地為人類(lèi)服務(wù)。表情識(shí)別是情感理解的基礎(chǔ),是計(jì)算機(jī)理解人們情感的前提,也是人們探索和理解智能的有效途徑。
人臉表情識(shí)別是指從給定的靜態(tài)圖像或動(dòng)態(tài)視頻序列中分離出特定的表情狀態(tài) ,從而確定被識(shí)別對(duì)象的心理情緒,實(shí)現(xiàn)計(jì)算機(jī)對(duì)人臉表情的理解與識(shí)別 ,從根本上改變?nèi)伺c計(jì)算機(jī)的關(guān)系,從而達(dá)到更好的人機(jī)交互。 因此人臉表情識(shí)別在心理學(xué)、智能機(jī)器人、智能監(jiān)控、虛擬現(xiàn)實(shí)及合成動(dòng)畫(huà)等領(lǐng)域有很大的潛在應(yīng)用價(jià)值。
研究現(xiàn)狀面部表情識(shí)別技術(shù)是近幾十年來(lái)才逐漸發(fā)展起來(lái)的,由于面部表情的多樣性和復(fù)雜性,并且涉及生理學(xué)及心理學(xué),表情識(shí)別具有較大的難度,因此,與其它生物識(shí)別技術(shù)如指紋識(shí)別、虹膜識(shí)別、人臉識(shí)別等相比,發(fā)展相對(duì)較慢,應(yīng)用還不廣泛。但是表情識(shí)別對(duì)于人機(jī)交互卻有重要的價(jià)值,因此國(guó)內(nèi)外很多研究機(jī)構(gòu)及學(xué)者致力于這方面的研究,并己經(jīng)取得了一定的成果。
20世紀(jì)70年代美國(guó)心理學(xué)家Ekman 和 Friesen對(duì)現(xiàn)代人臉表情識(shí)別做出了開(kāi)創(chuàng)性的工作。Ekman定義了人類(lèi)的6種 基本 表 情:高興 (Happy)、生 氣 (Angry)、吃 驚 (Surprise)、恐懼(Fear)、厭惡(Disgust)和悲傷(Sad),確定了識(shí)別對(duì)象的類(lèi)別;其次是建立了面部動(dòng)作編碼系統(tǒng)(Facial Action Coding System,F(xiàn)ACS),使研究者按照系統(tǒng)劃分的一系列人臉動(dòng)作單元(Action Unit,AU)來(lái)描述人臉面部動(dòng)作,通過(guò)人臉運(yùn)動(dòng)和表情的關(guān)系,進(jìn)而檢測(cè)人臉面部細(xì)微表情。1978年,Suwa等人對(duì)一段人臉視頻動(dòng)畫(huà)進(jìn)行了人臉表情識(shí)別的最初嘗試,一系列的研究在人臉表情視頻序列上展開(kāi)。到上世紀(jì)90年代,隨著圖像處理與模式識(shí)別技術(shù)的發(fā)展,使得人臉表情識(shí)別的計(jì)算機(jī)自動(dòng)化處理成為可能,K Mase和 A Pentland是其中的先驅(qū)者。二人首先使用光流來(lái)判斷肌肉運(yùn)動(dòng)的主要方向,然后提取局部空間中的光流值,組成表情特征向量,最后利用表情特征向量構(gòu)建人臉表情識(shí)別系統(tǒng)。該系統(tǒng)可以識(shí)別高興、生氣、厭惡和驚奇4種表情,識(shí)別率接近80%。1997年,哈爾濱工業(yè)大學(xué)的高文教授領(lǐng)導(dǎo)的團(tuán)隊(duì)將人臉表情識(shí)別的研究成果引入我國(guó)。2003年,北京科技大學(xué)的王志良教授領(lǐng)導(dǎo)的團(tuán)隊(duì),將人臉表情識(shí)別算法應(yīng)用于機(jī)器人的情感控制研究中,并發(fā)表了2002年以來(lái)人臉表情識(shí)別發(fā)展情況的綜述。2004年,東南大學(xué)的鄭文明博士在面部表情識(shí)別方面,提出了基于核典型相關(guān)分析、偏最小二乘回歸等多種識(shí)別方 法,并負(fù)責(zé)開(kāi)發(fā)了 自動(dòng)面部表情識(shí)別系統(tǒng)。2006年,國(guó)家自然科學(xué)基金對(duì)人臉表情識(shí)別的相關(guān)研究正式立項(xiàng)。直至今年,項(xiàng)目數(shù)有總體增長(zhǎng)的趨勢(shì)。國(guó)內(nèi)的清華大學(xué)、中國(guó)科學(xué)院、北京航空航天大學(xué)、北京交通大學(xué)、北京科技大學(xué)、哈爾濱工業(yè)大學(xué)、東南大學(xué)、上海交通大學(xué)、西北工業(yè)大學(xué)、華中師范大學(xué)等多所高校和科研機(jī)構(gòu)參與了人臉表情識(shí)別相關(guān)課題的研究。雖然人臉表情識(shí)別的商業(yè)應(yīng)用還處于起步階段,但是國(guó)內(nèi)外研究機(jī)構(gòu)和企業(yè)都在不同的領(lǐng)域進(jìn)行嘗試和研究,部分成果已經(jīng)取得了專(zhuān)利。因此表情識(shí)別的研究具有很大的開(kāi)發(fā)潛力。
過(guò)程表情識(shí)別可分為三部分:人臉圖像的獲取與預(yù)處理、表情特征提取和表情分類(lèi)。
人臉圖像檢測(cè)與定位就是在輸入圖像中找到人臉確切的位置,它是人臉表情識(shí)別的第一步。人臉檢測(cè)的基本思想是用知識(shí)或統(tǒng)計(jì)的方法對(duì)人臉建模,比較待檢測(cè)區(qū)域與人臉模型的匹配程度,從而得到可能存在人臉的區(qū)域。其方法大致可分為以下兩類(lèi):(1)基于統(tǒng)計(jì)的人臉檢測(cè)是將人臉圖像視為一個(gè)高維向量,將人臉檢測(cè)問(wèn)題轉(zhuǎn)化為高維空間中分布信號(hào)的檢測(cè)問(wèn)題。(2)基于知識(shí)的人臉檢測(cè)是利用人的知識(shí)建立若干規(guī)則,從而將人臉檢測(cè)問(wèn)題轉(zhuǎn)化為假設(shè)、驗(yàn)證問(wèn)題。
表情特征的提取根據(jù)圖像性質(zhì)的不同可分為:靜態(tài)圖像特征提取和序列圖像特征提取。靜態(tài)圖像中提取的是表情的形變特征,即表情的暫態(tài)特征。而對(duì)于序列圖像不僅要提取每一幀的表情形變特征還要提取連續(xù)序列的運(yùn)動(dòng)特征。形變特征提取必須依賴(lài)中性表情或模型,把產(chǎn)生的表情與中性表情做比較從而提取特征,而運(yùn)動(dòng)特征的提取則直接依賴(lài)于表情產(chǎn)生的面部變化。特征選擇的依據(jù)是:①盡可能多的攜帶人臉面部表情的特征,即信息量豐富;②盡可能容易提??;③信息相對(duì)穩(wěn)定,受光照變化等外界的影響小。
表情識(shí)別方法分類(lèi)大致分為4種情況:
(1)基于模板的匹配方法。
(2)基于神經(jīng)網(wǎng)絡(luò)的方法。
(3)基于概率模型的方法。
(4)基于支持向量機(jī)的方法。1