2010年11月17日星期三

SURF综述[转]

SURF特点:

1.使用积分图像完成图像卷积(相关)操作;

2,使用Hessian矩阵检测特征值;

3,使用基于分布的描述符(局部信息)。

 

兴趣点检测相关研究:

1998 Lindberg介绍自动尺度选择的概念,允许检测图像中的兴趣点在它们的特征尺度上。他实验了Hessian矩阵的行列式和Laplacian(和矩阵的迹一致)检测团状结构。

1998 Lowe提出用DOG近似LOG。

2001 Mikolajczyk 和Schmid 重新定义了这个方法,名为Harris-Laplace和Hessian-Laplace。使用Harris或Hessian矩阵的行列式来选择特征点的闻之,使用Laplacian选择尺度。

此外Mikolajczyk(2005,2006)还做了一些算子的比较工作。从中可知:基于Hessian检测器比基于Harris检测器更稳定,重复检测性更好。此外,使用Hessian矩阵的行列式比使用它的迹更有优势。同时也发现使用类似于DOG的近似方法可以提高速度但只损失很小的精度。

描述符的相关研究:

图像特征点的描述符一个共同点是表达了兴趣点邻域内小尺度的特征分布。使得描述符的描述性更好,识别性更高。SIFT的特点正是掌握了空间域亮度模式的大量信息(基于直方图方法:8个方向的箱格,4*4像素)。描述了特征点邻域内点的梯度方向信息,共128维。

PCA-SIFT:36维,匹配速度更快,但区分度下降,并且延长了特征的计算时间。

GLOH:区分度更高但是数据压缩花销时间太长。

2006 Grabner使用积分图像近似SIFT。可以达到和我们同样的速度。但是相比SIFT质量有所下降。(为SURF提供了重要信息积分图像)。

  匹配算法:BBF(k-d tree),balltrees, vocabulary trees, locality sensitine hashing.本文补充提出了,使用Hessian矩阵的迹来显著提高匹配速度。在低维描述符下,任何算法的匹配速度都很快。

二.兴趣点检测。

使用HESSIAN矩阵的近似检测兴趣点。使用积分图像加快计算。

2001 Viola and Jones 提出积分图像的概念。

1998 Simard 提出的盒形计算框架使用积分图像。

本文的创新点:

   使用近似的Hessian矩阵来求特征点。DOG近似LOG,盒形滤波近似不同的二次微分。

在3*3*3的邻域范围内寻找Hessian矩阵的行列式最大值。9*9盒形滤波器相当于方差1.2的高斯函数。

   图像尺度的改变是通过改变盒形滤波器尺寸实现的。尺度空间的分组时,相邻组首尺度滤波器大小之差相差2倍。如第一二组差6,则二三组差12.为了减少计算时间,第一组采样间隔1像素,第二组2像素,以此倍增。

   特征点的精确定位即实现亚像素描述,通过LOWE文章中提出的泰勒级数展开,可求得。

三.特征点描述与匹配

本文提出的是,建立一阶Haar小波在x和y上的响应的分布(局部信息整合),使用积分图像提高计算速度,并且只有64维。使用Laplacian(迹)的符号来索引特征点,方便匹配。

小波变换的重要用途是图像压缩。在图像识别等应用中主要应用于人脸识别和行人识别。

2002 haar-like features

2001 矩形特征与Adaboost(一种级联滤波器,识别)VIOL

1998 a general frame work for object detection

1997 pedestrian detction using wavelet template

3.1方向赋值

   选定一个6S(尺度)的圆,对每个像素计算边长为4S的Haar小波。使用原点在特征点,方差2s的高斯函数为权重函数。计算60度滑动窗内的像素在x和y方向的小波模的和。滑动窗以5度为一步转动,选择出圆内模值最大的向量,它的方向即为主方向。

基于Haar小波响应总和的描述符。选取以特征点为中心边长为20S的正方形区域,其中正方形的边和特征点的主方向向量垂直。(不同尺度的图像特征点选取的正方形边长不同)。将5*5的局部正方形投影到4*4的的子图中。每个描述符有4*4个子图组成。用方差为3.3S的高斯函数产生权重系数,减小离特征点远的像素的比重。


匹配时可使用Hessian矩阵的迹的符号,提供额外匹配信息,加快匹配速度。结合Kd-tree.

程序实现:

    在opencv实现的函数里,圆形区域用方形区域替代。在计算描述符的方形中边长是20*20,实际选取时是21*21,以特征点为中心。另外由于矩形特征计算的缘故,边缘部分的几个像素不计算。如果起始盒形滤波器的边长为9,则距离边界四个像素以内的点才可以计算。

没有评论:

发表评论

欢迎访问、交流!对本博客有何建议,请
来信告知!
本博内容来源于网络,如有不当或侵犯权益,请来信告知,将及时撤除!
如引用博客内容、论文,请注明原作者!

Google一下本博客

  • 《Getting Things Done》读书笔记 - 本文来自 inertial 原创投稿。 我第一次听说《Getting Things Done》这本书的时候误以为它和世面上的那些成功学书籍没什么区别,后来在不少书中看到了这个名字,也看见了很多人的推荐,由此产生了很大的兴趣。上个月正好有不少空闲,就抽时间把这本书读完了。 本来打算读英文原版,但是原版的生...
    5 年前
  • [原]Linux下编译使用boost库 - Boost库是一个可移植、提供源代码的C++库,作为标准库的后备,是C++标准化进程的开发引擎之一。 Boost库由C++标准委员会库工作组成员发起,其中有些内容有望成为下一代C++标准库内容。在C++社区中影响甚大,是不折不扣的“准”标准库。Boost由于其对跨平台的强调,对标准C++的强调,与...
    6 年前
  • [原]猎头、培训与咨询的价值(2)【补1】——北漂18年(93) - 【上期用手机写的,同时用语音输入转化成文字,错字较多,经好友霍师傅提醒本期重写,并增加一部分新内容】 简单谈下我对猎头、培训与咨询的看法。三样都干过,算是有些浅见。 猎头 简单的说就是人才中介。虽然在公司看来是可以直接解决现有企业问题的一个直接方法,但很多时候都不太管用。 猎头费一般是人才的一个月月...
    6 年前
  • OpenCV統計應用-Mahalanobis距離 - Mahalanobis距離是一個可以準確找出資料分布上面極端值(Outliers)的統計方法,使用線性迴歸的概念,也就是說他使用的是共變數矩陣以及該資料分布的平均數來找尋極端值的產生,而可以讓一群資料系統具有穩健性(Robust),去除不必要的雜訊訊息,這邊拿前面共變數矩陣的資料為例,並且新增了兩個點座標向量來做...
    15 年前
  • 努力推进模式识别实际产品的开发与应用 - Salu 无论是手写体识别、文档处理、人脸识别、基于内容的图片搜索、嵌入人工智能的搜索技术、虚拟网络社区、还是其它相关新科技下的信息整合领域,现在都在努力实用化。 前两年、即使现在还有很多人在抱怨说人脸的方法都不能用,但是就今年出现的和正在做的有关人脸识别实际应用的各种形式的产品可以说如雨后春笋。这是一个趋...
    16 年前