模式識別(Pattern Recognition)是人類的一項基本智能,在日常生活中,人們經(jīng)常在進行“模式識別”。隨著20世紀40年代計算機的出現(xiàn)以及50年代人工智能的興起,人們當然也希望能用計算機來代替或擴展人類的部分腦力勞動。(計算機)模式識別在20世紀60年代初迅速發(fā)展并成為一門新學科。
模式識別(Pattern Recognition)是指對表征事物或現(xiàn)象的各種形式的(數(shù)值的、文字的和邏輯關(guān)系的)信息進行處理和分析,以對事物或現(xiàn)象進行描述、辨認、分類和解釋的過程,是信息科學和人工智能的重要組成部分。
什么是模式呢?廣義地說,存在于時間和空間中可觀察的事物,如果我們可以區(qū)別它們是否相同或是否相似,都可以稱之為模式。但模式所指的不是事物本身,而是我們從事物獲得的信息。因此,模式往往表現(xiàn)為具有時間或空間分布的信息。
模式還可分成抽象的和具體的兩種形式。前者如意識、思想、議論等,屬于概念識別研究的范疇,是人工智能的另一研究分支。我們所指的模式識別主要是對語音波形、地震波、心電圖、腦電圖、圖片、照片、文字、符號、生物的傳感器等對象進行測量的具體模式進行分類和辨識。
模式識別研究主要集中在兩方面,一是研究生物體(包括人)是如何感知對象的,屬于認識科學的范疇,二是在給定的任務下,如何用計算機實現(xiàn)模式識別的理論和方法。前者是生理學家、心理學家、生物學家和神經(jīng)生理學家的研究內(nèi)容,后者通過數(shù)學家、信息學專家和計算機科學工作者近幾十年來的努力,已經(jīng)取得了系統(tǒng)的研究成果。
應用計算機對一組事件或過程進行鑒別和分類。所識別的事件或過程可以是文字、聲音、圖像等具體對象,也可以是狀態(tài)、程度等抽象對象。這些對象與數(shù)字形式的信息相區(qū)別,稱為模式信息。
模式識別所分類的類別數(shù)目由特定的識別問題決定。有時,開始時無法得知實際的類別數(shù),需要識別系統(tǒng)反復觀測被識別對象以后確定。
模式識別與統(tǒng)計學、心理學、語言學、 計算機科學 、生物學、控制論等都有關(guān)系。它與 人工智能 、 圖像處理 的研究有交叉關(guān)系。例如自適應或自組織的模式識別系統(tǒng)包含了人工智能的學習機制;人工智能研究的景物理解、自然語言理解也包含模式識別問題。又如模式識別中的預處理和特征抽取環(huán)節(jié)應用圖像處理的技術(shù);圖像處理中的圖像分析也應用模式識別的技術(shù)。
1、決策理論方法
又稱統(tǒng)計方法,是發(fā)展較早也比較成熟的一種方法。被識別對象首先數(shù)字化,變換為適于計算機處理的數(shù)字信息。一個模式常常要用很大的信息量來表示。許多模式識別系統(tǒng)在數(shù)字化環(huán)節(jié)之后還進行預處理,用于除去混入的干擾信息并減少某些變形和失真。隨后是進行特征抽取,即從數(shù)字化后或預處理后的輸入模式中抽取一組特征。所謂特征是選定的一種度量,它對于一般的變形和失真保持不變或幾乎不變,并且只含盡可能少的冗余信息。特征抽取過程將輸入模式從對象空間映射到特征空間。這時,模式可用特征空間中的一個點或一個特征矢量表示。這種映射不僅壓縮了信息量,而且易于分類。在決策理論方法中,特征抽取占有重要的地位,但尚無通用的理論指導,只能通過分析具體識別對象決定選取何種特征。特征抽取后可進行分類,即從特征空間再映射到?jīng)Q策空間。為此而引入鑒別函數(shù),由特征矢量計算出相應于各類別的鑒別函數(shù)值,通過鑒別函數(shù)值的比較實行分類。
2、句法方法
又稱結(jié)構(gòu)方法或語言學方法。其基本思想是把一個模式描述為較簡單的子模式的組合,子模式又可描述為更簡單的子模式的組合,最終得到一個樹形的結(jié)構(gòu)描述,在底層的最簡單的子模式稱為模式基元。在句法方法中選取基元的問題相當于在決策理論方法中選取特征的問題。通常要求所選的基元能對模式提供一個緊湊的反映其結(jié)構(gòu)關(guān)系的描述,又要易于用非句法方法加以抽取。顯然,基元本身不應該含有重要的結(jié)構(gòu)信息。模式以一組基元和它們的組合關(guān)系來描述,稱為模式描述語句,這相當于在語言中,句子和短語用詞組合,詞用字符組合一樣;M合成模式的規(guī)則,由所謂語法來指定。一旦基元被鑒別,識別過程可通過句法分析進行,即分析給定的模式語句是否符合指定的語ont face="Verdana"> 模式識別方法的選擇取決于問題的性質(zhì)。如果被識別的對象極為復雜,而且包含豐富的結(jié)構(gòu)信息,一般采用句法方法;被識別對象不很復雜或不含明顯的結(jié)構(gòu)信息,一般采用決策理論方法。這兩種方法不能截然分開,在句法方法中,基元本身就是用決策理論方法抽取的。在應用中,將這兩種方法結(jié)合起來分別施加于不同的層次,常能收到較好的效果。
模式識別可用于文字和語音識別、遙感和醫(yī)學診斷等方面。
1、文字識別
漢字已有數(shù)千年的歷史,也是世界上使用人數(shù)最多的文字,對于中華民族燦爛文化的形成和發(fā)展有著不可磨滅的功勛。所以在信息技術(shù)及計算機技術(shù)日益普及的今天,如何將文字方便、快速地輸入到計算機中已成為影響人機接口效率的一個重要瓶頸,也關(guān)系到計算機能否真正在我過得到普及的應用。目前,漢字輸入主要分為人工鍵盤輸入和機器自動識別輸入兩種。其中人工鍵入速度慢而且勞動強度大;自動輸入又分為漢字識別輸入及語音識別輸入。從識別技術(shù)的難度來說,手寫體識別的難度高于印刷體識別,而在手寫體識別中,脫機手寫體的難度又遠遠超過了連機手寫體識別。到目前為止,除了脫機手寫體數(shù)字的識別已有實際應用外,漢字等文字的脫機手寫體識別還處在實驗室階段。
2、語音識別
語音識別技術(shù)技術(shù)所涉及的領域包括:信號處理、模式識別、概率論和信息論、發(fā)聲機理和聽覺機理、人工智能等等。近年來,在生物識別技術(shù)領域中,聲紋識別技術(shù)以其獨特的方便性、經(jīng)濟性和準確性等優(yōu)勢受到世人矚目,并日益成為人們?nèi)粘I詈凸ぷ髦兄匾移占暗陌豺炞C方式。而且利用基因算法訓練連續(xù)隱馬爾柯夫模型的語音識別方法現(xiàn)已成為語音識別的主流技術(shù),該方法在語音識別時識別速度較快,也有較高的識別率。 2.3 指紋識別
我們手掌及其手指、腳、腳趾內(nèi)側(cè)表面的皮膚凹凸不平產(chǎn)生的紋路會形成各種各樣的圖案。而這些皮膚的紋路在圖案、斷點和交叉點上各不相同,是唯一的。依靠這種唯一性,就可以將一個人同他的指紋對應起來,通過比較他的指紋和預先保存的指紋進行比較,便可以驗證他的真實身份。一般的指紋分成有以下幾個大的類別:left loop,right loop,twin loop,whorl,arch和tented arch,這樣就可以將每個人的指紋分別歸類,進行檢索。指紋識別基本上可分成:預處理、特征選擇和模式分類幾個大的步驟。
3、遙感
遙感圖像識別已廣泛用于農(nóng)作物估產(chǎn)、資源勘察、氣象預報和軍事偵察等。
4、醫(yī)學診斷
在癌細胞檢測、X射線照片分析、血液化驗、染色體分析、心電圖診斷和腦電圖診斷等方面,模式識別已取得了成效。
統(tǒng)計模式識別的基本原理是:有相似性的樣本在模式空間中互相接近,并形成“集團”,即“物以類聚”。其分析方法是根據(jù)模式所測得的特征向量Xi=(xi1,xi2,…,xid)T(i=1,2,…,N),將一個給定的模式歸入C個類ω1,ω2,…, ωc中,然后根據(jù)模式之間的距離函數(shù)來判別分類。其中,T表示轉(zhuǎn)置;N為樣本點數(shù);d為樣本特征數(shù)。
統(tǒng)計模式識別的主要方法有:判別函數(shù)法, k近鄰分類法,非線性映射法,特征分析法,主因子分析法等。
在統(tǒng)計模式識別中,貝葉斯決策規(guī)則從理論上解決了最優(yōu)分類器的設計問題,但其實施卻必須首先解決更困難的概率密度估計問題。BP神經(jīng)網(wǎng)絡直接從觀測數(shù)據(jù)(訓練樣本)學習,是更簡便有效的方法,因而獲得了廣泛的應用,但它是一種啟發(fā)式技術(shù),缺乏指定工程實踐的堅實理論基礎。統(tǒng)計推斷理論研究所取得的突破性成果導致現(xiàn)代統(tǒng)計學習理論