Skip to content

Latest commit

 

History

History
executable file
·
35 lines (21 loc) · 1.93 KB

2021-01-31-masaike.recovers.md

File metadata and controls

executable file
·
35 lines (21 loc) · 1.93 KB
layout title tags
post
震惊,被马赛克的图片竟然还可以恢复
Python

大家好。

其实之前在我用马赛克对图片进行模糊处理的时候,我就思考过这个问题,这些被马赛克的地方能不能被恢复出来,万一能恢复,当时就觉得细思极恐。

你说巧不巧还真能恢复。在介绍今天的项目之前,我们先来看一下以下这张图片,相信你也会跟我一样震惊的。

被马赛克后的图片真的被还原了,不可思议。

当然大家也不要过度的恐慌哈,这个项目还是有挺多局限的。目前来看该项目关注的更多是文字项目的马赛克恢复,因为文字有更多的规则可寻,同时在马赛克不是很充分的情况下,可以根据大致的形状做近似的搜索。

更多算法相关的内容是有理论支撑的,详见:https://www.linkedin.com/pulse/recovering-passwords-from-pixelized-screenshots-sipke-mellema/

同时我们根据以上论文底部的评论也可以得知,因为本身文字上下文也是存在关联性的,可以利用马尔科夫链等 NLP 的算法来辅助增加文字的恢复效果。

目前作者将上述理论开发成一个可以直接命令行使用的脚本了,具体使用方法如下:

image-20210131163008432

大致用法分如下几部:

  • 将被马赛克的文字从图片中截取出来
  • 生成需要搜索的文字词典图片,方便后续做相似词的搜索
  • 运行命令:python depix.py -p [pixelated rectangle image] -s [search sequence image] -o output.png,其中 output.png 为最终恢复的图片效果

更多项目详情请查看如下链接。

开源项目地址:https://github.com/beurtschipper/Depix