1.使用积分图像完成图像卷积(相关)操作;
2,使用Hessian矩阵检测特征值;
3,使用基于分布的描述符(局部信息)。
兴趣点检测相关研究:
1998 Lindberg介绍自动尺度选择的概念,允许检测图像中的兴趣点在它们的特征尺度上。他实验了Hessian矩阵的行列式和Laplacian(和矩阵的迹一致)检测团状结构。
1998 Lowe提出用DOG近似LOG。
2001 Mikolajczyk 和Schmid 重新定义了这个方法,名为Harris-Laplace和Hessian-Laplace。使用Harris或Hessian矩阵的行列式来选择特征点的闻之,使用Laplacian选择尺度。
此外Mikolajczyk(2005,2006)还做了一些算子的比较工作。从中可知:基于Hessian检测器比基于Harris检测器更稳定,重复检测性更好。此外,使用Hessian矩阵的行列式比使用它的迹更有优势。同时也发现使用类似于DOG的近似方法可以提高速度但只损失很小的精度。
描述符的相关研究:
图像特征点的描述符一个共同点是表达了兴趣点邻域内小尺度的特征分布。使得描述符的描述性更好,识别性更高。SIFT的特点正是掌握了空间域亮度模式的大量信息(基于直方图方法:8个方向的箱格,4*4像素)。描述了特征点邻域内点的梯度方向信息,共128维。
PCA-SIFT:36维,匹配速度更快,但区分度下降,并且延长了特征的计算时间。
GLOH:区分度更高但是数据压缩花销时间太长。
2006 Grabner使用积分图像近似SIFT。可以达到和我们同样的速度。但是相比SIFT质量有所下降。(为SURF提供了重要信息积分图像)。
匹配算法:BBF(k-d tree),balltrees, vocabulary trees, locality sensitine hashing.本文补充提出了,使用Hessian矩阵的迹来显著提高匹配速度。在低维描述符下,任何算法的匹配速度都很快。
二.兴趣点检测。
使用HESSIAN矩阵的近似检测兴趣点。使用积分图像加快计算。
2001 Viola and Jones 提出积分图像的概念。
1998 Simard 提出的盒形计算框架使用积分图像。
本文的创新点:
使用近似的Hessian矩阵来求特征点。DOG近似LOG,盒形滤波近似不同的二次微分。
在3*3*3的邻域范围内寻找Hessian矩阵的行列式最大值。9*9盒形滤波器相当于方差1.2的高斯函数。
图像尺度的改变是通过改变盒形滤波器尺寸实现的。尺度空间的分组时,相邻组首尺度滤波器大小之差相差2倍。如第一二组差6,则二三组差12.为了减少计算时间,第一组采样间隔1像素,第二组2像素,以此倍增。
特征点的精确定位即实现亚像素描述,通过LOWE文章中提出的泰勒级数展开,可求得。
三.特征点描述与匹配
本文提出的是,建立一阶Haar小波在x和y上的响应的分布(局部信息整合),使用积分图像提高计算速度,并且只有64维。使用Laplacian(迹)的符号来索引特征点,方便匹配。
小波变换的重要用途是图像压缩。在图像识别等应用中主要应用于人脸识别和行人识别。
2002 haar-like features
2001 矩形特征与Adaboost(一种级联滤波器,识别)VIOL
1998 a general frame work for object detection
1997 pedestrian detction using wavelet template
3.1方向赋值
选定一个6S(尺度)的圆,对每个像素计算边长为4S的Haar小波。使用原点在特征点,方差2s的高斯函数为权重函数。计算60度滑动窗内的像素在x和y方向的小波模的和。滑动窗以5度为一步转动,选择出圆内模值最大的向量,它的方向即为主方向。
基于Haar小波响应总和的描述符。选取以特征点为中心边长为20S的正方形区域,其中正方形的边和特征点的主方向向量垂直。(不同尺度的图像特征点选取的正方形边长不同)。将5*5的局部正方形投影到4*4的的子图中。每个描述符有4*4个子图组成。用方差为3.3S的高斯函数产生权重系数,减小离特征点远的像素的比重。
匹配时可使用Hessian矩阵的迹的符号,提供额外匹配信息,加快匹配速度。结合Kd-tree.
程序实现:
在opencv实现的函数里,圆形区域用方形区域替代。在计算描述符的方形中边长是20*20,实际选取时是21*21,以特征点为中心。另外由于矩形特征计算的缘故,边缘部分的几个像素不计算。如果起始盒形滤波器的边长为9,则距离边界四个像素以内的点才可以计算。