Opencv for Android 图像算法优化

参考博文

我已经与Android和优化(我写了一个视频处理的应用程序,处理在4ms的一帧)的工作相当多,所以我希望我会给你一些中肯的答案.

首先,有没有在OpenCV中的C和C + +接口之间没有太大的区别.其实,有些代码是用C语言编写,并且有一个C + +封装接口,和一些反之亦然.两个(由Shervin EMAMI测量)之间的任何显著的差异通常是错误的库中.此外,库版本之间的差异是由改进质量或通过引入一些错误造成的.但最新的版本是相当稳定的,所以我建议您下载最新的(基于OpenCV 2.4.2)

为什么不重写?

因为你会花很多时间,你可以用非常非常好.此外,C接口较为繁琐,并有机会引入错误或内存泄漏或任何高.所以,没有C,在我看来.

建议优化

简介您的应用程序.首先做您的计算机上,因为它是非常容易.使用Visual Studio探查器,看看有什么功能,采取最.对其进行优化.从来没有优化,因为你觉得很慢,而是因为你衡量它.从最慢的函数,优化它尽可能地,然后采取第二速度较慢.

首先,专注于算法.更快的算法可以提高性能与数量级(100倍)的订单.一个C + +的技巧会给你也许2倍的性能提升.

经典的技术:

调整你的视频帧要小.很多时候,你可以从一个200x300px图像中提取,而不是1024×768的信息.第1的面积为10倍以下.

用更简单的操作,而不是复杂的.使用整数而不是浮点数.而从来不使用

double

矩阵或一个

for

循环,执行数千次.

做尽可能少的计算成为可能.你可以只在图像的特定区域跟踪处理,而不是它的所有对所有帧的物体,?你可以做一个粗略/近似检测在一个非常小的图像,然后改进它的全画幅投资回报率?

在for循环,它可能是有意义的使用,而不是C C风格+ +.一个指向数据矩阵或一个float数组比mat.at或std :: vector的<>快得多.但改变只有当它的需要.通常情况下,很多处理(90%)的部分为双循环完成.重点关注一下.它没有任何意义,以取代向量<>所有的地方,广告使你的代码看起来就像意大利面条.

一些OpenCV函数转换数据将翻一番,处理它,,然后再转换回输入格式.提防他们,他们kill在移动设备上的表现.例如:变形,缩放,类型转换.此外,色彩空间转换被称为是懒惰的.更愿意直接从本地获得的YUV灰度.

ARM处理器具有NEON.学习和使用它.据 强大 !

一个小例子:

float* a, *b, *c;// init a and b to 1000001 elementsfor(int i=0;i<1000001;i++)c[i] = a[i]*b[i];

可以如下重写.这是更详细的,但我相信它的速度更快.

float* a, *b, *c;// init a and b to 1000001 elementsfloat32x4_t _a, _b, _c;int i;for(i=0;i<1000001;i+=4){ a_ = vld1q_f32( &a[i] ); // load 4 floats from a in a NEON registerb_ = vld1q_f32( &b[i] );c_ = vmulq_f32(a_, b_); // perform 4 float multiplies in parrallelvst1q_f32( &c[i], c_); // store the four results in c}// the vector size is not always multiple of 4 or 8 or 16. // Process the remaining elementsfor(;i<1000001;i++)c[i] = a[i]*b[i];

纯粹主义者 say 您必须在汇编写的,但对于普通程序员的家伙,这是一个有点令人生畏.我找到了不错的成绩书面 intrinsics ,就像上面的例子.

同时检查 this blog post 和有关NEON以下职位.

以及最后但并非最不重要,我要提一提,我有很好的成功转换的SSE优化指令(这是NEON对口的x86-64处理器)在OpenCV的霓虹灯,像 here .这是UCHAR矩阵(常规图像格式)的图像滤波代码.你should’t盲目地转换指令一个接一个,因为有更好的方法来做到这一点,但把它作为一个例子开始.

微风吹过,海面上金光闪闪,泛起一道道美丽的浪花,

Opencv for Android 图像算法优化

相关文章:

你感兴趣的文章:

标签云: