《模式識別原理及工程應用》一1.3 模式識別係統
1.3 模式識別係統
模式識別係統由兩個過程組成,即設計和實現。設計是指用一定數量的樣本進行分類器的設計,實現是指用所設計的分類器對要識別的樣本進行分類決策。本書隻討論決策理論方法,基於決策理論的模式識別係統主要由4個部分組成:數據獲取,預處理,特征提取和選擇,分類決策,如圖1-3-1所示。
下麵我們對這幾個部分作簡單的說明。
1.數據獲取
為了使計算機能夠對各種現象進行分類識別,要用計算機可以運算的符號來表示所研究的對象,通常輸入對象的信息有以下3種類型:
1)二維圖像:如文字、指紋、地圖、照片這類對象。
2)一維波形:如腦電圖、心電圖、機械振動波形等。
3)物理參量和邏輯值:前者如在疾病診斷中病人的體溫及各種化驗數據等;後者如對某參量正常與否的判斷或對症狀有無的描述。
通過測量、采集和量化,可以用矩陣或向量表示二維圖像或一維波形。這就是數據獲取的過程。
2.預處理
預處理的目的是去除噪聲,加強有用的信息,並對輸入測量儀器或其他因素所造成的退化線性進行複原。
3.特征提取和選擇
由圖像或波形所獲得的數據量是相當大的。例如,一個文字圖像可以有幾千個數據,一個心電圖波形也可能有幾千個數據,一個衛星遙感圖像的數據量就更大。為了有效地實現分類識別,就要對原始數據進行變換,得到最能反映分類本質的特征。這就是特征提取和選擇的過程。一般我們把原始數據組成的空間叫做測量空間,把分類識別賴以進行的空間叫做特征空間,通過變換,可把在維數較高的測量空間中表示的模式變為在維數較低的特征空間中表示的模式。特征空間中的一個模式通常也叫做一個樣本,它往往可以表示為一個向量,也就是特征空間中的一個點。
4.分類決策
分類決策就是在特征空間中用統計方法把被識別對象歸為某一類別。基本做法是在樣本訓練集的基礎上確定某個判別規則,使按這種判別規則對被識別對象進行分類所造成的錯誤識別率最小或引起的損失最小。
最後更新:2017-08-22 11:32:52