这是我参与更文挑战的第1天,活动详情查看: 更文挑战
往期文章
原理分析
刚开始接到这个需求的时候还是挺懵圈的,由此产生了以下几个问题
- 一张图片是否需要和整个相册除它之外的所有照片进行相似度判断 ?
- 一组图片进行一次相似度筛选还是多次筛选
- 怎么样去处理大量图片进行对比时,产生的临时变量
市面上产品分析
通过对市面上类似的相册清理产品进行分析,发现如下规律
-
同一张图片在同一时间段(3小时以内)内导入相册,进行相册相似度筛选,可以被发现是相似图片
-
同一张图片在不同时间段(相差3小时)导入相册,进行相册相似度筛选,不能被发现为相似图片
在一个集合内可以判断相似度。在不同的集合,即使是相似的两张图片也不能找出来。
作者推测这样做的目的是,因为产生相似图片的大多数情况都是,在同一时间段内生成的图片。比如在同一个时间段内对某个物体或者人物的拍照,很可能因为取景的角度,或拍摄的方向产生相似的图片。这些相似的图片大多数都是在相差不大的时间里产生的。
流程设计
根据以上分析,我们可以分析出程序大致流程。
喜欢就支持一下吧
相关推荐