说可怕的话。

早上我和同事在微信上闲聊,开始聊一位女同事最近的变化。

结果,他反手在文字上打了马赛克,把截图扔进了小组:

还差一刀:

没想到同事顺势接近,直接订购了“秘密文字”的内容。

当时的我是这样的:

看样子,这位老师补充道:

……

好奇心像我一样,很快就对这项技术进行了“调查”。

(PS:聊天原图在文末发表)

恢复镶嵌文字?另外,海外某公司的主任研究员Dan Petro(以下简称Dan)在这两天发表了这样的投稿。

他直接得分

为了验证他的说法,Dan自己退场写了一个叫Unredacter的工具。

然后,这个工具演示了一点点恢复镶嵌文字的方法。

从上述例子也可以看出,即使原文上挂着厚厚的马赛克,在这个工具前也会“裸奔”。

你可能会说这操作很复杂啊。

不,不。

非常简单,只有两个步骤。

使用npm install安装依赖项启动npm start,恢复镶嵌图像,但非常现实的问题是,Depix恢复的文字,视觉上不太好:

Depix恢复的字符仍有些模糊。

因此,国外Jumpsec Lab的研究人员指出了这个问题,并提出了有趣的挑战。

这种挑战引起了Dan极大的兴趣,这就是他开发Unredacter的原因。

因此,在Unredacter的帮助下,Dan顺利突破了这一挑战:

然后Dan联系了该研究员,在邮件回复中也确认Dan的结果是正确的:

不仅如此,Dan还介绍了GiMP、Photoshop、其他的编辑器,在涂法上马赛克的结果也是一样的。

因此,他的解读方法应该具备一定的通用性。

当然,生活中我们或多或少都需要“打码”,但既然马赛克不安全,还有更好的办法嘛。

Dan对此的回答是

也有复原镶嵌图像的“马赛克复原”,在AI界很早就有研究。

例如,杜克大学提出的PLUSE是其中之一,也登上了CVPR。

但是修复的不是文字,而是人像。例如

原则上,本质上是生成对抗网络(GAN)

PLUSE主要是根据模糊的马赛克像素,重新画出未发生的人脸,压缩成马赛克状态与原图进行比较,并推出相似的版本进行展示

当然,这项技术也不完美。也有颠覆的情况。

例如,网友使用马里奥进行了尝试,结果是……

Emmm……这个“味道”,不寻常。

One More Thing最后,发表开头故事的答案。

真是惨痛的教训……

项目地址:

https://github.com/bishopfox/unredacter

参考链接:

[1]https://bishopfox.com/blog/unredacter-tool-never-pixelation[2]https://labs.jumpsec.com/can-depix-deobfuscate-your-data/[3]https://arxiv.org/abs/2003.03808