转载请注明出处:
图像金字塔
图像金字塔是通过将原始图像经过平滑、下采样所生成一系列具有不同分辨率的图像的集合。金字塔结构(Pyramid)适于多分辨率处理的一种图像存储数据结构。
最常用的生成图像金字塔的方法是采用高斯函数平滑图像,每次将分辨率降低为原来的一半,,由此得到一个图像序列{ML,ML-1,……,M0},图像金字塔的存储量为N^2*(1+1/4+1/16+…)=(4*N^2)/3。
如上图:最右边为原始图像,从右到左依次为使用高斯平滑1次、2次和3次后的图像,这些图像共同组成了图像金字塔。
图像金字塔这种结构在图像处理中有广泛的用途。最著名的特征匹配算子SIFT就是通过构造图像金字塔来完成的。有关图像金字塔在SIFT特征提取算法中的应用可参见Rachel Zhang的博文"SIFT特征提取分析"。
程序分析/* * FileName : pyramids.cpp * Author : xiahouzuoxin @163.com * Version : v1.0 * Date: Sat 20 Sep 2014 07:04:29 PM CST * Brief : * * Copyright (C) MICL,USTB */;using namespace cv;const char *wn = "Pyramids Demo";int main(int argc, char *argv[]){if (argc < 2) {cout<<"Usage: ./pyramids [file name]"<<endl;return -1;}Mat src = imread(argv[1]);if (!src.data) {cout<<"Error: read image error."<<endl;return -1;}<<"Error: input image’s column must be 2^n"<<endl;return -1;}if ( src.rows & (src.rows-1) ) { // src.cols > 0 firstcout<<"Error: input image’s row must be 2^n"<<endl;return -1;}cout<<"User Guide:"<<endl;cout<<"———————"<<endl;cout<<"u -> Zoom out"<<endl;cout<<"d -> Zoom in"<<endl;cout<<"ESC -> Exit program"<<endl;namedWindow(wn, WINDOW_AUTOSIZE);imshow(wn, src);Mat cur = src;Mat dst = cur;int end_while = 0;while(!end_while) {char c;c = waitKey(10);switch (c) {case 27: /* ESC */end_while = 1;break;case ‘u’:pyrUp(cur, dst, Size(cur.cols*2, cur.rows*2));imshow(wn, dst);cur = dst;break;case ‘d’:pyrDown(cur, dst, Size(cur.cols/2, cur.rows/2));imshow(wn, dst);cur = dst;break;default:break;}}}
使用高斯图像金字塔进行降采样和插值的函数分别是pyrDown和pyrUp,参数依次为原图像、采样结果图像、采样后的图像尺寸。
上述程序中的降采样操作因为都是按2为倍数进行的,因此要求输入图像的长宽都必须是2^n。if ( src.cols & (src.cols-1) )是用来判断原图像的列是否为2^n的语句。请仔细体会这种判断某个数是否是2^n的方法——x*(x-1)返回0表示x是2^n,否则不是。
结果显示
下面一系列图片展现的是先将原图像通过图像金字塔降采样(会存在数据丢失),再通过金字塔插值恢复图像过程中图像的变化过程。由于降采样过程中存在数据丢失,所以可以看到恢复到原图像大小后的图像比原图像模糊。
图注原图像
图注1次降采样后的图像
图注2次降采样后的图像
图注2次降采样后,再经过1次图像金字塔插值操作后的图像,大小与1次降采样后图像相同,但变得模糊
图注2次降采样后,再经过2次图像金字塔插值操作后的图像,大小与原图相同,但变得模糊
命运如同手中的掌纹,无论多曲折,终掌握在自己手中。