相似图像的检测方法|电子爱好者

admin管理员组
文章数量:1622986

2024年7月12日发(作者：)

相似图像的检测方法

一、哈希算法

哈希算法可对每张图像生成一个“指纹”(fingerprint)字符串，然后比较不同图像的

指纹。结果越接近，就说明图像越相似。

常用的哈希算法有三种：

1．均值哈希算法(ahash)

均值哈希算法就是利用图片的低频信息。将图片缩小至8*8，总共64个像素。这一步

的作用是去除图片的细节，只保留结构、明暗等基本信息，摒弃不同尺寸、比例带来的图

片差异。将缩小后的图片，转为64级灰度。计算所有64个像素的灰度平均值，将每个像

素的灰度，与平均值进行比较。大于或等于平均值，记为1；小于平均值，记为0。将上一

步的比较结果，组合在一起，就构成了一个64位的整数，这就是这张图片的指纹。

均值哈希算法计算速度快，不受图片尺寸大小的影响，但是缺点就是对均值敏感，例

如对图像进行伽马校正或直方图均衡就会影响均值，从而影响最终的hash值。

2．感知哈希算法(phash)

感知哈希算法是一种比均值哈希算法更为健壮的算法，与均值哈希算法的区别在于感

知哈希算法是通过DCT（离散余弦变换）来获取图片的低频信息。先将图像缩小至32*32，

并转化成灰度图像来简化DCT的计算量。通过DCT变换，得到32*32的DCT系数矩阵，

保留左上角的8*8的低频矩阵（这部分呈现了图片中的最低频率）。再计算8*8矩阵的DCT

的均值，然后将低频矩阵中大于等于DCT均值的设为”1”，小于DCT均值的设为“0”，

组合在一起，就构成了一个64位的整数，组成了图像的指纹。

感知哈希算法能够避免伽马校正或颜色直方图被调整带来的影响。对于变形程度在25%

以内的图片也能精准识别。

3．差异值哈希算法(dhash)

差异值哈希算法将图像收缩小至8*9，共72的像素点，然后把缩放后的图片转化为

256阶的灰度图。通过计算每行中相邻像素之间的差异，若左边的像素比右边的更亮，则

记录为1，否则为0，共形成64个差异值，组成了图像的指纹。

相对于pHash，dHash的速度要快的多，相比aHash，dHash在效率几乎相同的情

况下的效果要更好，它是基于渐变实现的。

二、单通道直方图和三直方图

单通道图，俗称灰度图，每个像素点只能有有一个值表示颜色，它的像素值在0到255

之间，0是黑色，255是白色，中间值是一些不同等级的灰色。三通道图，每个像素点都有

3个值表示（如RGB图），所以就是3通道。图像的直方图用来表征该图像像素值的分布

情况。用一定数目的小区间(bin)来指定表征像素值的范围,每个小区间会得到落入该小区间

表示范围的像素数目。可以通过计算图像直方图的重合度，来判断图像之间的相似度。

直方图能够很好的归一化，比如256个bin条，那么即使是不同分辨率的图像都可以

直接通过其直方图来计算相似度，计算量适中。比较适合描述难以自动分割的图像。

三、基于特征提取与匹配的方法

1．ORB特征

ORB特征是将FAST特征点的检测方法与BRIEF特征描述子结合起来，并在它们原来

的基础上做了改进与优化。ORB特征提取速度快,提取的特征直接是二元编码形式，无需使

用哈希学习方法就可以直接利用汉明距离快速计算相似度。在大多数情况下，去重效果能

够与 SIFT/SURF 持平。

2．SIFT/SURF特征

SIFT特征提取是在不同的尺度空间上查找关键点(特征点)，并计算出关键点的方向。

SIFT所查找到的关键点是一些十分突出、不会因光照、仿射变换和噪音等因素而变化的点，

如角点、边缘点、暗区的亮点及亮区的暗点等。

四、基于BOW+K-Means的相似图像检测

BOW模型被广泛用于计算机视觉中，相比于文本的BOW，图像的特征被视为单词

（word），视觉词汇的字典则由图片集中的所有视觉词汇构成,词袋模型的生成如下图。首

先，用sift算法生成图像库中每幅图的特征点及描述符。再用k-Means算法对图像库中的

特征点进行聚类，聚类中心有k个，聚类中心被称为视觉词汇，将这些聚类中心组合在一

起，形成一部字典。根据IDF原理，计算每个视觉单词TF-IDF权重来表示视觉单词对区分

图像的重要程度。对于图像库中的每一幅图像，统计字典中每个单词在在其特征集中出现

的次数，将每张图像表示为K 维数值向量（直方图）。得到每幅图的直方图向量后，构造特

征到图像的倒排表，通过倒排表快速索引相关候选的图像。对于待检测的图像，计算出sift

特征，并根据TF-IDF转化成特征向量（频率直方图），根据索引结果进行直方图向量的相

似性判断。

五、基于卷积网络的相似图像检测

在ImageNet中的卷积网络结构（vgg16）基础上，在第7层（4096个神经元）和

output层之间多加一个全连接层，并选用sigmoid激活函数使得输出值在0-1之间，设

定阈值0.5之后可以转成01二值向量作为二值检索向量。这样，对所有的图片做卷积网络

前向运算，得到第7层4096维特征向量和代表图像类别分桶的第8层output。对于待检

测的图片，同样得到4096维特征向量和128维01二值检索向量，在数据库中查找二值

检索向量对应的图片，比对4096维特征向量之间距离，重新排序即得到最终结果。

本文标签：图像图片直方图计算算法

版权声明：本文标题：相似图像的检测方法内容由热心网友自发贡献，该文观点仅代表作者本人，转载请联系作者并注明出处：https://www.elefans.com/dongtai/1720771749a842094.html，本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容，一经查实，本站将立刻删除。

1小时前

图像标注技巧 A picture is worth a thousand words. 一张图片胜过千言万语。Weve all heard that old chestnut a thousand times before, right

电子爱好者 - 最新技术资讯及电子产品介绍！

相似图像的检测方法

更多相关文章

调用微信内置浏览器实现微信打开的网页上的图片能点击打开的效果

Python爬虫采集英雄联盟皮肤图片

【Python爬虫】爬取英雄联盟所有皮肤图片实现千图成像～

用python网络爬虫爬取英雄联盟英雄图片

爬取英雄联盟所有皮肤图片实现千图成像～

千图成像python_爬取英雄联盟所有皮肤图片实现千图成像～

python爬取英雄联盟所有皮肤价格表_利用Python协程来爬取LOL所有英雄的皮肤高清图片...

Requests库应用实例4：网络图片的爬取与存储(以爬取英雄联盟皮肤图片为例)

贪心算法

hdoj 1052 Tian Ji -- The Horse Racing 贪心算法

TEB轨迹优化算法-代码解析与参数建议

SLAM-Visual Navigation学习之SIFT算法与代码详解

SIFT算法详解

图像分类的发展史

图像特征匹配方法——SIFT算法原理及实现

图像匹配 | 论文与方法整理

图像处理中经典的特征检测和提取算法

图像拼接 SIFT资料合集

AWNet: Attentive Wavelet Network for Image ISP AWNet：图像 ISP 的注意力小波网络（个人笔记，勿喷）

图像标注技巧_图像技巧使用户感觉比想像的要好

发表评论

推荐文章

2021.02.22（变量）

PAT乙级：题目七

傲梅轻松备份-备份rocky9，并还原备份

不再内卷！视觉字幕化新任务合集

图像处理计算机基本配置,图形图像工作的电脑配置推荐_DIY攒机硬件郎中-中关村在线...

热门文章

英雄联盟极速下载提取下载地址

手把手教你破解文件密码、wifi密码、网页密码

使用Kali Linux虚拟机破解WiFi密码的一波三折及详细操作步骤

解决删除谷歌浏览器chrome注册表残留问题

鸿蒙wifi Demo运行

Wi-Fi干扰仪导致所有终端设备无法连接Wi-Fi

51单片机红外通信及控制LED灯（LCD1602显示）

PyQt5 从零开始制作 PDF 阅读器(一)

如何在VMware16.0装win10

十大硬盘数据恢复软件

最新文章

2022蓝帽杯取证初赛——计算机取证

安卓手机卡顿基础优化教程

最佳的iPhone解锁软件和应用程序

C盘无损扩容教程（不用重新分区格式化）

EaseUS Partition Recovery v9.1.0 磁盘分区恢复工具

如何修复格式化后的SD卡的数据？有需要的可以参考下。

解锁三星bl锁有几种方法_如何判断三星Galaxy S7 (G9308)手机bootloader是否解锁_免费解锁BL的3个方法...

硬盘分区损坏后数据恢复方法[分区恢复，分区修复，分区丢失，数据恢复，数据丢失，数据修复]

十大硬盘数据恢复软件介绍

数据库大师成长日记：SQL Server如何防止开发人员获取敏感数据

rpg制作大师_在线RPG大师班

easyrecovery免费版2023最新电脑数据恢复软件

GitChat · 安全 | 揭秘我国的电子取证技术

免费的录屏软件，分享这5款

手机中geetest是什么文件_安卓手机里这些全英文件夹，到底是什么？删了它，手机瞬间多了5个G...

小米手机肿么还原时钟

15000流明是多少瓦

一般普通投影机功率多大?

苹果绿联转换器有些投影机不能用

坚果V9投影机具体参数?

有关九年级作文850字精选

80后90后_高一作文

中级卫生专业资格中医全科学主治医师中级模拟题2021年(9)案与解析

(精品)师范大学招考硕士研究生课程八六0试卷

ZXMVC8900(V3

【模拟人生4（The Sims 4）性感露背黑色亮片礼服MOD V20190313】模拟人生4（The Sims 4）性感露背黑色亮片礼服MOD V20190313 官方免费下载

【生化危机2：重制版（Resident Evil 2 Remake）克莱尔红头发深色服装MOD】生化危机2：重制版（Resident Evil 2 Remake）克莱尔红头发深色服装MOD 官方免费下载

【模拟人生4（The Sims 4）性感露背深V领吊带裙MOD V20190311】模拟人生4（The Sims 4）性感露背深V领吊带裙MOD V20190311 官方免费下载

【模拟人生4（The Sims 4）科幻风宇宙飞船家庭住宅MOD V20190311】模拟人生4（The Sims 4）科幻风宇宙飞船家庭住宅MOD V20190311 官方免费下载

【鬼泣5（Devil May Cry V）v1.0十四项修改】鬼泣5（Devil May Cry V）v1.0十四项修改 官方免费下载

如何实现高效的treenode搜索算法

treenode与链表有何本质区别

在哪些场景下应优先考虑使用treenode

treenode在树形结构中的角色是什么

如何通过treenode实现二叉树

【鬼泣5（Devil May Cry V）v1.0十四项修改】鬼泣5（Devil May Cry V）v1.0十四项修改官方免费下载