用python给图像自动裁边

因为最近入了一只kpw的缘故,开始关心以前不大关心的东西了,譬如epub,譬如标题。

现成的裁边软件是有的,而且还有不少。不过秉着热衷于瞎造轮子的优良传统,我还是打算冲动地自己用PIL玩一下。从某些方面讲不去找文献就动手也是很有问题的,但这里不是都说了是玩么……

样本

如图:

难点

    本身扫描质量偏低,不是很干净; 右上角的大片黑色阴影; 右边的书缝线; 左边的一列空白不应被裁去; 最上方的漫画名可选裁去。

思路

    找出背景色。

    收集最边缘的一圈宽度为edge(默认为5)个像素的点的颜色,找出最常出现的颜色。

    考虑到漫画的特殊性,直接将颜色转化为灰度,提高重复的次数。

    尝试过将灰度值都近似为5的倍数以进一步提高重复率以及方便之后的处理,但提升不明显就取消了。

    消除背景色。

    使用ImageChops.difference比较灰度图和纯背景色之间的差别,如下图所示:

    好处是现在背景色已经是黑色了,但直接使用.getbbox取图像边界还是取不出来,因为右上角的大污点还在……

    取边缘。

    污点是一大团不好处理,想到取边缘使一大团变成一条边,这样消除容易些。

    简单地高斯模糊,然后用PIL自带的边缘检测,最后用中值滤一下噪点,效果如图:

    嗯,污点直接不见了,很赞。虽然右边那条书缝还是很坚持……

    发现PIL里想用canny边缘检测还要自己实现,嫌麻烦外加现在的实验效果还好就懒得弄了, 不清楚会不会效果更好些。

    取边界。

    现在开始简单粗暴地取边界。现以上边界为例。

    自上而下逐行扫描像素点,参数有四个:

    threshold: 颜色阈值,当当前点灰度值大于此值时不认为它是背景。这本扫的比较模糊,设在了15上。

    max_error: 当一行中不是背景的点的比例大于此数值时认为这一行应该不是背景,视为error.因为已经取过边缘,所以这个值应该很小,这里取了0.01.值太大会把如页码等细节视为背景吃掉。

    suppress: 当连续如此多行都error时认为达到正文区域。扫右边缘时超过类似书缝这样的宽度就足够了。

    max_edge_per: 最大边缘百分比,当扫描行数超过此比例时直接停止。

    每次找到一个方向的边界后就把确定是边界的点涂黑,比如右侧的一列如果先检测到并涂黑的话,就不会影响到上下方向的检测了。 原则上应该每个方向都这样涂黑迭代下去直到稳定的,至少应该来两圈,但是我懒所以只走了一圈,估计两圈的话效果会好些。

    裁!

    咔嚓!

    最终效果如图(max_error=0.01, threshold=15, suppress=5, max_edge_per=0.1):

    还不错?

代码

源码已放在github上。如果碰巧有人有兴趣请随意。

实验

自玩性质,没可能也没兴趣与其他实现比较了……

下面是几个测试图(原图在上):





黑边太大,把suppress提高到了10:

用python给图像自动裁边

相关文章:

你感兴趣的文章:

标签云: