本报告延续上一篇针对微信朋友圈图片过滤技术的研究,分析微信如何在聊天功能中实现实时图片过滤。微信是中国腾讯控股有限公司旗下的即时通讯应用,目前是中国最受欢迎的聊天软件之一,也是全球排名第四的最流行聊天软件。朋友圈是微信上最常用的功能之一,其中图片是用户最期望看到的内容分享形式。
根据中国相关法律法规,互联网公司往往需要对内容进行过滤。公民实验室此前的研究报告发现了微信的“一APP两制”关键词过滤机制,在新浪微博,Tom-Skype和新浪UC等即时通讯软件,以及直播平台上的审查机制。此前,我们留意到微信除了过滤关键词,部分与敏感事件相关的图片也会被审查。
主要发现
- 微信对用户对话中发送的图片进行实时自动检测和审查,审查是基于图片中包含的文字以及目标图片与系统数据库中的敏感图片的相似度匹配。
- 微信通过建立哈希索引(Hash Index)进行实现过滤,该哈希索引由微信用户在聊天对话中发送的图像的MD5值组成。
- 本报告对比了微信朋友圈,一对一聊天以及群组聊天的图片审查比例。我们发现这三项功能的敏感图片库并不相同,即朋友圈,一对一聊天及群组聊天所审查的图片不一样。其中,朋友圈和群组聊天所审查的范围要远大于一对一聊天。
- 微信主要审查政治敏感的图片,这些图片大多与政府和社会反抗有关。
- 与关键词审查一样,微信图片审查与新闻事件相关。我们进行了六个月的审查观察,发现微信过滤的图片内容范围很广,其中包括华为首席财务官孟晚舟一案,中美“贸易战”,2018年美国中期选举等。