http://blog.csdn.net/chenyusiyuan/article/details/8710462

OpenCV学习笔记（27）KAZE 算法原理与源码分析（一）非线性扩散 滤波

2013-03-23 17:44 16963人阅读评论(28) 收藏举报

分类：

机器视觉（34）

目录(?)[+]

KAZE系列笔记：

KAZE算法资源：

我在Ievgen的项目库中提取出KAZE，封装成继承cv::Feature2D的类，无需重新编译OpenCV，实现了参数调整和Mask过滤的功能

2013-03-28更新，对KAZE代码进行了优化

简介

ECCV2012中出现了一种比SIFT更稳定的特征检测算法KAZE （[1]）。KAZE的取名是为了纪念尺度空间分析的开创者—日本学者Iijima。KAZE是日语‘风’的谐音，寓意是就像风的形成是空气在空间中非线性的流动过程一样，KAZE特征检测是在图像域中进行非线性扩散处理的过程。

传统的SIFT、SURF等特征检测算法都是基于线性的高斯金字塔进行多尺度分解来消除噪声和提取显著特征点。但高斯分解是牺牲了局部精度为代价的，容易造成边界模糊和细节丢失。非线性的尺度分解有望解决这种问题，但传统方法基于正向欧拉法（forward Euler scheme）求解非线性扩散（Non-linear diffusion）方程时迭代收敛的步长太短，耗时长、计算复杂度高。由此，KAZE算法的作者提出采用加性算子分裂算法(Additive Operator Splitting, AOS)来进行非线性扩散滤波，可以采用任意步长来构造稳定的非线性尺度空间。

注：KAZE算法的原理与SIFT和SURF有很多相似之处，在深入了解KAZE之前，可以参考以下的博客文章对SIFT和SURF的介绍：

1.1 非线性扩散滤波

1.1.1 Perona-Malik扩散方程

具体地，非线性扩散滤波方法是将图像亮度（L）在不同尺度上的变化视为某种形式的流动函数（flow function）的散度（divergence），可以通过非线性偏微分方程来描述：

通过设置合适的传导函数 c(x,y,t) ，可以使得扩散自适应于图像的局部结构。传导函数可以是标量、也可以是张量。时间t作为尺度参数，其值越大、则图像的表示形式越简单。Perona和Malik提出了传导函数的构造方式：

其中的▽L_σ是高斯平滑后的图像L_σ的梯度（gradient）。函数 g() 的形式有如下几种：

其中函数g₁优先保留高对比度的边缘，g₂优先保留宽度较大的区域，g₃能够有效平滑区域内部而保留边界信息（KAZE代码中默认采用函数g₂）。

函数g₁、g₂、g₃的实现代码如下（在文件 kaze_nldiffusion_functions.cpp 中）：

参数k是控制扩散级别的对比度因子（contrast factor），能够决定保留多少边缘信息，其值越大，保留的边缘信息越少。在KAZE算法中，参数k的取值是梯度图像▽L_σ的直方图70% 百分位上的值：

计算参数k的实现源码如下（在文件 kaze_nldiffusion_functions.cpp 中）：

注：有关非线性扩散滤波的应用，参见[2]。

1.1.2 AOS算法

由于非线性偏微分方程并没有解析解，一般通过数值分析的方法进行迭代求解。传统上采用显式差分格式的求解方法只能采用小步长，收敛缓慢。为此，将方程离散化为以下的隐式差分格式：

其中A_l是表示图像在各维度（l）上传导性的矩阵。该方程的解如下：

这种求解方法对任意时间步长（τ）都有效。上式中矩阵A_l是三对角矩阵并且对角占优（tridiagonal and diagonally dominant matrix），这样的线性系统可以通过Thomas算法快速求解。（有关AOS的应用，参见[3]）

该算法的实现源码如下（在文件 kaze.cpp 中）：

上面介绍了非线性扩散滤波和AOS求解隐性差分方程的原理，是KAZE算法求解非线性尺度空间的基础，下一节我们将介绍KAZE算法的非线性尺度空间构建、特征检测与描述等内容。

待续...

Ref：

[1] http://www.robesafe.com/personal/pablo.alcantarilla/papers/Alcantarilla12eccv.pdf

[2] http://manu16.magtech.com.cn/geoprog/CN/article/downloadArticleFile.do?attachType=PDF&id=3146

[3] http://file.lw23.com/8/8e/8ec/8ecd21e4-b030-4e05-9333-40cc2d97bde4.pdf