701 阿裏雲技術社區[雲棲]

機器學習_基於adaboost和haar like特征的人臉識別

基於adaboost做人臉識別的一篇論文

PAUL VIOLA 的 Robust Real-Time Face Detection Rapid object detection using a boosted cascade of simple features

其中談到使用haar like特征，參考這篇論文

Rainer Lienhart and Jochen Maydt 的 An Extended Set of Haar-like Features for Rapid Object Detection

在整個讀論文的過程中，通過如下資源，理清了論文中的很多知識點：

1.haar like原型特征與特征矩陣

在使用haar like特征做人臉識別時，介紹了3類的haar 原型特征：

在論文中提到，將feature放到圖像上，黑色矩形像素值的和減去白色矩形像素值的和得到一個特征值，該特征值就是haar特征，使用該特征值計算弱分類器的

的閾值。但是需要注意的是此處的feature，並非簡單的指上邊的幾個原型特征，而是通過在檢測子窗口(一般為24x24像素)左右、上下平移，伸縮變換這些原型

特征得到的子窗口。一個特征原型在子窗口中伸縮大小不同，或者位置不同，就得到一個不同的feature，如下圖：

論文作者在一個檢測子窗口中畫了兩個變換後的原型矩陣，他這樣做是為了節省論文版麵同時展示0°、45°兩種原型特征在子窗口中的擺放，實際上每個子窗

口隻放一個原型特征形成一個feature。

一個0°型原型特征可以得到的feature個數：

一個45°型原型特征可以得到的feature個數：

其中：

關於公式怎麼來的，可能要細心推導一下，不過中心思想就是，

1、對於某特定大小的特征，在窗口內滑動計算。
也就是1(a)特征大小為2*1，對於24*24的圖像。水平可滑動23步，垂直滑動24步，所以共有23*24個特征。
2、對於一個特征，特征本身沿水平、豎直方向分別縮放。
還看特征1（a），特征大小為2*1，則延水平方向可放大為：4*1，6*1，8*1，…，24*1；豎直方向可放大為：2*1，2*2，2*3，…，2*24。

即每個特征有XY種放大方式。（！放大的矩形特征並限製保持2:1的比例！）

這部分我是參考【OpenCV】計算Haar特征個數這篇博客弄懂的，其中它寫了個程序來計算feature個數。

最終的得到的feature總數(在24x24窗口中)為：