数据安全技术前沿研究笔记(二)
数据安全技术前沿研究笔记(二)
1.前言
由于第二章没啥好总结的,大多都是一些合规下数据安全类的文字阐述,和第一章的中心思路基本不差,我们就直接开始第三章的“前沿技术赋能用户隐私数据安全合规”。在该文章中,企业的用户隐私数据安全合规场景主要是是三种典型也对应了三种前沿技术(差分隐私、知识图谱和流程自动化)
(以下是第三章的部分摘抄)
2.数据采集中隐私保护
在保护用户的个人隐私前提下,对大量用户的隐私数据进行采集,在服务器中完成数据的聚合和分析,挖掘大规模用户数据的整体趋势和统计信息。
GDPR:为了应对隐私问题带来的风险的挑战,GDPR 指出数据控制者与处理者“应当执行合适的技术措施和有组织性的措施来保证合理应对风险的安全水平”。
《网络安全法》:“网络运营者应当采取技术措施和其他必要措施,确保其收集的个人信息安全,防止信息泄露、毁损、丢失”。即要求企业采取一定的技术与管理措施,确保用户个人信息与隐私安全。
在传统的数据安全处理技术——去标识化(数据脱敏),在企业部分主要场景中一般可应对合规性,符合GDPR和《网络安全法》要求采取的必要措施。但是,在一些内部环境(如大部分内部用户可以访问和下载)或外部共享环境总,它处理后的数据仍然面临多种多样的隐私攻击,包括背景知识攻击、差分攻击和重标识攻击等。经过攻击后,个人隐私仍然有可能会被泄露,若对数据进行多度脱敏,虽然数据的隐私攻击风险降低,但数据的可用性也就大幅度降低。如何有效的防范隐私攻击又保留数据的可用性,也就是获取数据的聚合信息但无法获得单个记录的信息,这就是需要更高的技术。
差分隐私
3.个人信息治理与可视化
同一个企业的多个应用中,可能通过收集用户的多个 维度的个人信息与隐私数据。 此外,数据采集可能分布存储在多种多个数据库( 如Oracle、MySQL/ElasticSearch)以及各种大数据平台中(HDFS 和 Hbase)。企业需要摸清企业内部有多少个独立的数据实体(数据主体),每一个实体包括哪些数据与属性维度,这些数据分别存储在哪些系统中和业务应用,以及数据共享给哪些第三方企业。
GDPR:如 1.2.2 节所述,GDPR 赋予了用户知情权、访问权、修改权、限制处理权、 被遗忘权、可携带权、拒绝权等多项权利。相应地,企业必须履行和响应用户提出的权利请求。比如用户发起数据查看请求,那么企业必须完整呈现数据主体个人数据报告,包括收集了用户哪些结构化数据、哪些非结构化数据(包括网络浏览、点击等信息)、以及将数据共享给了哪些第三方企业。企业在实施用户权利请求响应的合规,个人信息治理与可视化是实现目标的关键。
《网络安全法》:如 1.2.2 节所述,法规赋予了用户一定程度的“删除权”和“修改权”,响应地,企业须履行和配合用户完成数据权利请求的流程。同样地,企业在具体实施合规落地时,个人信息治理与可视化是基础与前提。
多源异构数据源分布同一个使用主体的信息和维度,对于企业复杂多变的数据环境来说,不同数据源实体ID表示显示不同或者缺失,如何识别与关联同一个实体是一个不小的挑战。
知识图谱
4.用户数据权利全球响应
全球一些隐私法规赋予数据主体(用户)自由访问、修改和删除个人数据等权利,相应地,要求企业必须在规定的时间内对用户提出的请求进行响应,比如向用户提供收集个人数据明细及使用目的报告。
GDPR:规定企业“必须在一个月内对所有的请求进行响应和处理,若请求过于复杂,可延长至“两个月”。
《网络安全法》:法规赋予了用户一定程度的“删除权”和“修改权”,但未具体到响应时间的规定。但在国家标准《个人信息安全规范》(GB/T 35273-2020),明确规定从请求到响应的时间是 30 天内。
许多企业无法应对数据主体权利请求,约有三分之二企业对当个SSR的回复需要出国两周以上的时间,且这些流程通常是人工完成,平均成本很高。因此,对于拥有一定用户数量规模的企业,如何应对多个用户并发请求的随时响应。
流程自动化