有关可变形部件模型(Deformable Part Model)的一些说明

(1)可变形部件模型

可变形部件模型(DeformablePart Model)由三部分组成:

(1) 一个较为粗糙的,覆盖整个目标的全局根模版(或叫做根滤波器)。

(2) 几个高分辨率的部件模版(或叫做部件滤波器)。

(3) 部件模版相对于根模版的空间位置。

首先要计算一个HOG金字塔:通过计算标准图像金字塔中每层图像的HOG特征得到HOG特征金字塔,HOG金字塔中每一层的的最小单位是细胞单元(cell)。

滤波器(模版)就是一个权重向量,一个w * h大小的滤波器F是一个含w * h * 9 * 4个权重的向量(9*4是一个HOG细胞单元的特征向量的维数)。所谓滤波器的得分就是此权重向量与HOG金字塔中w * h大小子窗口的HOG特征向量的点积(DotProduct)。

而检测窗口的得分是根滤波器的分数加上各个部件的分数的总和,每个部件的分数是此部件的各个空间位置得分的最大值,每个部件的空间位置得分是部件在该子窗口上滤波器的得分减去变形花费。

假设H是HOG金字塔,p = (x, y, l) 表示金字塔第l层 (x, y) 位置的一个细胞单元。φ(H, p, w, h)是将金字塔H中以p为左上角点的w * h大小子窗口的HOG特征串接起来得到的向量。所以,滤波器F在此检测窗口上的得分为:F·φ(H, p, w, h)。此后,在不引起歧义的情况下,我们使用φ(H,p)代表φ(H, p, w, h)。

所以,含n个部件的模型可以通过根滤波器F0和一系列部件模型(P1,…, Pn)来定义,其中Pi = (Fi, vi, si, ai, bi)。Fi是第i个部件的滤波器;vi和si都是二维向量,都以细胞单元为单位,vi指明第i个部件位置的矩形中心点相对于根位置的坐标,si是此矩形的大小;ai和bi也都是二维向量,指明一个二次函数的参数,此二次函数用来对第i个部件的每个可能位置进行评分。

模型在HOG金字塔中的位置可以用z = (p0, ….. , pn)来表示,当i=0时,pi = (xi, yi,li )表示根滤波器的位置;i>0时,pi = (xi, yi,li )表示第i个部件滤波器的位置。我们假设每个部件所在层的HOG细胞单元的尺寸是根所在的层的细胞单元尺寸的一半。空间位置的得分等于每个部件滤波器的得分(从数据来看)加上(?加上减去都一样,通过正负号控制就行)每个部件的位置相对于根的得分(从空间来看)。

即:

(1)式中左边表示所有滤波器(i从0开始,包括根滤波器和部件滤波器)的得分(即滤波器的权重向量与对应的HOG特征向量的点积),右边表示所有部件滤波器(i从1开始)的形变花费。

其中:

表示部件i的变形程度,

在-1到1之间。

(x0,y0)是根滤波器在其所在层的坐标,为了统一到部件滤波器所在层需乘以2。

vi是部件i相对于根的坐标偏移,,所以2(x0, y0)+vi表示未发生形变时部件i的坐标,

所以(xi,yi) – [2(x0,y0) + vi]是部件i的形变位移量,再除以部件的矩形框大小si可保证在-1到1之间。

计算过程如下图:

图中每个格子表示部件所在HOG金字塔层的细胞单元,红框表示某部件未发生位移时的位置,w=7,h=3.黑框表示部件的实际位置,因此

同理,绿框所在位置对应:

(2)在不完全标注(partially labeled)数据集上的学习

模型训练使用的数据集中只标注了整个目标的位置,没有标注出每个部件的位置,所以叫做部分标注或不完全标注,并不是说图片中有指定类别的目标没有标注出来,这里容易理解错误。

这种训练方法可以看做弱监督训练,正因为不知道目标中部件的位置,所以将部件的位置看做隐藏变量,使用LSVM进行训练,训练时同时估计部件位置和学习模型参数。

(3)半凸

LSVM最终是一个非凸规划(non-convex)问题。然而,在下面所讨论的情况下LSVM是半凸规划(semi-convexity)问题,一旦将隐藏信息指定给正样本则训练问题变为凸规划问题。

几个凸函数的最大值问题是凸规划问题。在线性SVM中,有

是β的线性函数,此时铰链损失函数对于每个样本都是凸的,因为它是两个凸函数的最大值。

注意到公式(13)中定义的

是一系列函数的最大值,而这些函数都是β的线性函数,因此

是β的凸函数。所以当yi = -1时,两个函数f(x) = 0和

都是β的凸函数,所以铰链损失函数

是β的凸函数。也就是说,只有当样本为负样本时,损失函数是β的凸函数。我们将损失函数的这一性质叫做半凸(semi-convexity)。

勇气执着的背负起那厚重的行囊,奔向远方。

有关可变形部件模型(Deformable Part Model)的一些说明

相关文章:

你感兴趣的文章:

标签云: