Opencv for Android 图像算法优化

参考博文

我已经与Android和优化（我写了一个视频处理的应用程序，处理在4ms的一帧）的工作相当多，所以我希望我会给你一些中肯的答案.

首先，有没有在OpenCV中的C和C + +接口之间没有太大的区别.其实，有些代码是用C语言编写，并且有一个C + +封装接口，和一些反之亦然.两个（由Shervin EMAMI测量）之间的任何显著的差异通常是错误的库中.此外，库版本之间的差异是由改进质量或通过引入一些错误造成的.但最新的版本是相当稳定的，所以我建议您下载最新的（基于OpenCV 2.4.2）

为什么不重写？

因为你会花很多时间，你可以用非常非常好.此外，C接口较为繁琐，并有机会引入错误或内存泄漏或任何高.所以，没有C，在我看来.

建议优化

简介您的应用程序.首先做您的计算机上，因为它是非常容易.使用Visual Studio探查器，看看有什么功能，采取最.对其进行优化.从来没有优化，因为你觉得很慢，而是因为你衡量它.从最慢的函数，优化它尽可能地，然后采取第二速度较慢.

首先，专注于算法.更快的算法可以提高性能与数量级（100倍）的订单.一个C + +的技巧会给你也许2倍的性能提升.

经典的技术：

调整你的视频帧要小.很多时候，你可以从一个200x300px图像中提取，而不是1024×768的信息.第1的面积为10倍以下.

用更简单的操作，而不是复杂的.使用整数而不是浮点数.而从来不使用

double

矩阵或一个

for

循环，执行数千次.

做尽可能少的计算成为可能.你可以只在图像的特定区域跟踪处理，而不是它的所有对所有帧的物体，？你可以做一个粗略/近似检测在一个非常小的图像，然后改进它的全画幅投资回报率？

在for循环，它可能是有意义的使用，而不是C C风格+ +.一个指向数据矩阵或一个float数组比mat.at或std :: vector的<>快得多.但改变只有当它的需要.通常情况下，很多处理（90％）的部分为双循环完成.重点关注一下.它没有任何意义，以取代向量<>所有的地方，广告使你的代码看起来就像意大利面条.

一些OpenCV函数转换数据将翻一番，处理它，，然后再转换回输入格式.提防他们，他们kill在移动设备上的表现.例如：变形，缩放，类型转换.此外，色彩空间转换被称为是懒惰的.更愿意直接从本地获得的YUV灰度.

ARM处理器具有NEON.学习和使用它.据强大！

一个小例子：

float* a, *b, *c;// init a and b to 1000001 elementsfor(int i=0;i<1000001;i++)c[i] = a[i]*b[i];

可以如下重写.这是更详细的，但我相信它的速度更快.

float* a, *b, *c;// init a and b to 1000001 elementsfloat32x4_t _a, _b, _c;int i;for(i=0;i<1000001;i+=4){ a_ = vld1q_f32( &a[i] ); // load 4 floats from a in a NEON registerb_ = vld1q_f32( &b[i] );c_ = vmulq_f32(a_, b_); // perform 4 float multiplies in parrallelvst1q_f32( &c[i], c_); // store the four results in c}// the vector size is not always multiple of 4 or 8 or 16. // Process the remaining elementsfor(;i<1000001;i++)c[i] = a[i]*b[i];

纯粹主义者 say 您必须在汇编写的，但对于普通程序员的家伙，这是一个有点令人生畏.我找到了不错的成绩书面 intrinsics ，就像上面的例子.

同时检查 this blog post 和有关NEON以下职位.

以及最后但并非最不重要，我要提一提，我有很好的成功转换的SSE优化指令（这是NEON对口的x86-64处理器）在OpenCV的霓虹灯，像 here .这是UCHAR矩阵（常规图像格式）的图像滤波代码.你should’t盲目地转换指令一个接一个，因为有更好的方法来做到这一点，但把它作为一个例子开始.

微风吹过，海面上金光闪闪，泛起一道道美丽的浪花，

相关文章：

你感兴趣的文章：

标签云：