图片相似搜索，其实原理挺简单（二）

之前的《图片相似搜索，其实原理挺简单（一）》中介绍了通过“感知哈希算法”实现图片相似搜索。在isnowfy的网站看到，还有其他两种方法也很简单，颜色分布法和内容特征法，今天再详细了解下这两种方法。

一、颜色分布法

每张图片都可以生成颜色分布的直方图（color histogram）。如果两张图片的直方图很接近，就可以认为它们很相似。

任何一种颜色都是由红绿蓝三原色（RGB）构成的，所以上图共有4张直方图（三原色直方图 + 最后合成的直方图）。

如果每种原色都可以取256个值，那么整个颜色空间共有1600万种颜色（256的三次方）。针对这1600万种颜色比较直方图，计算量实在太大了，因此需要采用简化方法。可以将0～255分成四个区：0～63为第0区、64～127为第1区、128～191为第2区、192～255为第3区。这意味着红绿蓝分别有4个区，总共可以构成64种组合（4的3次方）。

任何一种颜色必然属于这64种组合中的一种，这样就可以统计每一种组合包含的像素数量。

上图是某张图片的颜色分布表，将表中最后一栏提取出来，组成一个64维向量(7414, 230, 0, 0, 8, …, 109, 0, 0, 3415, 53929)，这个向量就是这张图片的特征值或者叫“指纹”。

于是，寻找相似图片就变成了找出与其最相似的向量。这可以用皮尔逊相关系数或者余弦相似度算出。

二、内容特征法

除了颜色构成，还可以从比较图片内容的相似性入手。

首先，将原图转成一张较小的灰度图片，假定为50×50像素；然后，确定一个阈值，将灰度图片转成黑白图片。

如果两张图片很相似，它们的黑白轮廓应该是相近的。于是，问题就变成了，第一步如何确定一个合理的阈值，正确呈现照片中的轮廓？

显然，前景色与背景色反差越大，轮廓就越明显。这意味着，如果我们找到一个值，可以使得前景色和背景色各自的“类内差异最小”（minimizing the intra-class variance），或者“类间差异最大”（maximizing the inter-class variance），那么这个值就是理想的阈值。

1979年，日本学者大津展之证明了，“类内差异最小”与“类间差异最大”是同一件事，即对应同一个阈值。他提出一种简单的算法，可以求出这个阈值，这被称为“大津法”（Otsu’s method）。下面就是他的计算方法。

假定一张图片共有n个像素，其中灰度值小于阈值的像素为 n1 个，大于等于阈值的像素为 n2 个（ n1 + n2 = n ），w1 和 w2 表示这两种像素各自的比重。

w1 = n1 / n
w2 = n2 / n

再假定，所有灰度值小于阈值的像素的平均值和方差分别为 μ1 和 σ1，所有灰度值大于等于阈值的像素的平均值和方差分别为 μ2 和 σ2。于是，可以得到：

类内差异 = w1(σ1的平方) + w2(σ2的平方)
类间差异 = w1w2(μ1-μ2)^2

可以证明，这两个式子是等价的：得到“类内差异”的最小值，等同于得到“类间差异”的最大值。不过，从计算难度看，后者的计算要容易一些。

下一步用“穷举法”，将阈值从灰度的最低值到最高值，依次取一遍，分别代入上面的算式。使得“类内差异最小”或“类间差异最大”的那个值，就是最终的阈值。具体的实例和Java算法，请看这里。

有了50×50像素的黑白缩略图，就等于有了一个50×50的0-1矩阵，矩阵的每个值对应原图的一个像素，0表示黑色，1表示白色。这个矩阵就是一张图片的特征矩阵。

两个特征矩阵的不同之处越少，就代表两张图片越相似。这可以用“异或运算”实现（即两个值之中只有一个为1，则运算结果为1，否则运算结果为0），对不同图片的特征矩阵进行“异或运算”，结果中的1越少，就是越相似的图片。

文章转载自：阮一峰的网络日志

Comments

Louis Han says
2013 年 5 月 17 日 at 23:10
一幅图两幅图简单如果是海量图片，最重要的就不止是算法了
回复
- 张衡Henry says
  2013 年 5 月 17 日 at 23:30
  海量数据就另当别论了
  回复
Louis Han says
2013 年 5 月 17 日 at 23:10
一幅图两幅图简单如果是海量图片，最重要的就不止是算法了
回复
- 张衡Henry says
  2013 年 5 月 17 日 at 23:30
  海量数据就另当别论了
  回复
柴怀山博客 says
2013 年 5 月 18 日 at 20:03
计算机要是能看懂图片就牛B了
回复
- 张衡Henry says
  2013 年 5 月 18 日 at 20:25
  图片是有信息的啊，要是看懂图片内容得需要大数据计算，还不一定猜准确
  回复
柴怀山博客 says
2013 年 5 月 18 日 at 20:03
计算机要是能看懂图片就牛B了
回复
- 张衡Henry says
  2013 年 5 月 18 日 at 20:25
  图片是有信息的啊，要是看懂图片内容得需要大数据计算，还不一定猜准确
  回复
联署营销 says
2016 年 3 月 1 日 at 23:52
[ali偷看] 内容好多，看起来很高级的样子
回复

图片相似搜索，其实原理挺简单（二）

一、颜色分布法

二、内容特征法

相关

Comments

Speak Your Mind 取消回复

关于我

猜您喜欢

聚合阅读

稻香村－京东商城特供月饼

推荐高智商悬疑犯罪影片

我们要走的路

近期评论

近期文章

热文排行

关于我

朋友圈

功能

图片相似搜索，其实原理挺简单（二）

一、颜色分布法

二、内容特征法

分享

相关

Comments

Speak Your Mind 取消回复

关于我

猜您喜欢

聚合阅读

稻香村－京东商城特供月饼

推荐高智商悬疑犯罪影片

我们要走的路

近期评论

近期文章

热文排行

标签云

关于我

朋友圈

功能