Skip to content

WeChat内容审查研究

本篇是对Citizen Lab关于WeChat内容审查调查研究的学习[1],不具有任何政治相关评论,只做学习研究。

Previous Work

  • 对不同区域(国内、国外)的手机号注册的账号,进行不同程度的监视
  • 对图片实时的灵敏度计算耗时耗力,因此会首先对图片进行哈希计算,评估图片是否已经归为敏感图片,即比对黑图库
  • 先前测试发现,内容监视没有实时进行,并且第一次上传敏感图片时也未进行审查

Technical Assessment

  • 实验通过显性的结果进行衡量。例如消息是否已经传达成功(对方接收到消息并可进行查看)
  • 通过两个频道进行,一个是在国内注册的微信账号间通讯,一个是国外注册的微信账户间通讯。相当于设置对照组进行。还有在群组间的不同账号的控制,一个群组为3个国外账号(下文称:国外群聊);一个群组为两个国外账号,一个国内账号(下文称:国内群聊)
  • 基于假设:微信会对文档文件(.txt, .pdf, .docx)中文字进行敏感词哈希匹配

第一类技术实验

第一类实验,采用统计实验(Statistical Experiment)的方法,即使用统计学相关的知识进行分析 - 使用零假设下的卡方检验

  • Image side-channel test:先在国外群聊中发送n张敏感图片,再在国内群聊中发送同样数量的图片,并统计有多少张图片未收到
  • Image control test:在国内群聊中发送n张新颖的(哈希值不同)的图片,并统计中国账户未收到的数量
  • 实验结果

    • 实验结果表明:即使是完全在非中国注册帐户中发送的文件、图像也要进行内容监视,并且这些文件用于建立中国注册帐户所受的审查制度
  • 使用随机字符填充的方式生成新颖的敏感文件(即哈希值计算的结果不同,且先前未发送过)

    • 文档:在结尾添加随机生成的64位字符

    • 图片:在确认敏感的JPEG图片附加24KB的随机字节

第二类技术实验

第二类实验,针对哈希值碰撞情况下的内容审查研究

  • Collision side-channel test:生成20张新颖敏感图片,使用特殊方法生成与先前20张敏感图片哈希值相同的、一一对应的非敏感图片。首先在国外群聊中发送敏感图片,再在国内群组中发送非敏感图片。计算国内群聊中收到的图片数量。
  • Collision control test:控制组,生成20张新颖的敏感图片,并生成20张与前者具有相同哈希值的非敏感图片。将非敏感图片直接发送到国内群聊,计算未收到的数量
  • 实验结果

    • 实验结果表明,图片在完全的国外注册群聊中,也会收到内容审查。并且这些敏感图片会被用于建立国内群聊的审查体系(黑图库,哈希值记录)

第三类技术实验

第三类实验,研究微信是否保留被撤回文件的哈希值

  • Hash retention test:在国外群聊中发送新颖的敏感图片,立即撤回。一小时后,在国内群聊中发送相同的文档。如果文档发送后遭到实时审查无法成功发送并显示,那么就可以表明,微信不会删除被撤回文件的哈希值

  • 实验结果

    • 实验中,无法在国内账号收到被撤回的文件。实验结果表明,无论是欧盟内部(实验中使用比利时手机号和VPN注册国外账号并进行使用)还是外部的用户,在发送新颖敏感图片并撤回后,不会从微信的敏感哈希索引中删除该文件的哈希值

    • 🤔个人思考:该实验使用了VPN,如何确定微信是否会检测VPN使用情况,并且对判定为VPN使用的用户进行无差别或有差别的特殊审查?

Policy Assessment

内容比较多,先将此内容空着,先专注于技术评估方面的学习,该方向后面再学习

Data Access Request Assessment

同上

Conclusion

  • 技术实验表明:在非中国注册账户之间进行通信(本文主要是在群聊场景下,先前的研究表明,群聊和1对1通信的审查力度会有所不同)会收到内容监视。
  • 技术实验是通过分析在非中国注册账户中传输的文件和图像,这些图片具有对中国政治敏感性的影响。
  • 技术实验结果表明,这些具有政治敏感性的文件会被用于训练和建立微信的中国区政治审查制度。但该研究结果中,没有证据将腾讯对国际微信用户实施的监视行为归因于中国政府的指示
  • 该研究不仅提供技术黑盒实验,同时也分析了微信面向公众的隐私政策文件、数据访问请求,与腾讯数据保护代表也进行了沟通。

  • 社交媒体监督(social media surveillance)和内容审查(content moderations)并不是微信独有的,所有以盈利导向的互联网社交媒体产品都可能会有这种情况。

  • TODO:目前,基于微信会对聊天文本内容进行关键词匹配检验的假设,关于微信如何生成或维护关键字组合黑名单的问题尚待解决

Reference

[1] We Chat, They WatchHow International Users Unwittingly Build up WeChat’s Chinese Censorship Apparatus, Jeffrey Knockel, https://citizenlab.ca/2020/05/we-chat-they-watch/