用一个算法、一个框架,从技术角度保护数据安全

用一个算法、一个框架,从技术角度保护数据安全

https://www.zhihu.com/video/988417363250819072

大数据让我们的生活更加便利

也为商业发展带来了帮助

但近年频发的事件又让人不得不担心

我们的数据和信息

是否能得到充分的保护

在大数据已成为国家战略的今天

对数据的使用是必要且重要的

那么我们是不是有办法

在保护数据安全的同时

也能充分发挥数据的价值?

本期《数中生智》

邀请了美丽动人的法律人

与成熟稳重的技术人

来一起聊聊这个话题

一个典型应用场景


精准营销,是非常典型的大数据应用场景。

确定广告如何投放,通常的做法是,通过某项标签属性来判断某个设备用户是否属于广告的目标人群。例如,如果想投放《复联3》的广告,会用设备ID去DMP(数据管理平台)查询“电影”、“漫画”相关标签,再做定向投放。

但如果DMP由第三方提供,广告主要拿出自身的数据资产,又没有做好匿名化处理的话,就会存在一定风险。

一个保护数据安全的算法



从技术角度出发,TalkingData采用了布隆过滤器来解决上述问题。

布隆过滤器(Bloom Filter),是一个很长的二进制向量和一系列随机映射函数。它可以用于检索一个元素是否在一个集合中,优点是空间效率和查询时间远远超过一般算法。

当运用布隆过滤器,还是上述场景,广告主将投放标准提交给第三方DMP, DMP根据标准筛选人群形成设备列表,利用布隆过滤器将这些数据形成一个匿名化的数据包。广告主同样通过布隆过滤器来匿名化判断DMP方的数据包中是否有匹配的目标人群,如果有就可以投放。

这样一来,广告主不需要提供自有原始数据,DMP方也无从知道广告主定向投放了哪些人群,处理过的数据包都保持匿名,既最大限度保证了数据安全和合规,又满足了精准投放、人群画像等实际业务需求。

一个创新性技术框架



布隆过滤器并非适用于所有的业务场景。

为了应对不同业务场景的需求,目前TalkingData正在与MIT连接科学研究所进行合作,参与OPAL(Open Algorithms)的研发。

OPAL是“可穿戴设备之父”阿莱克斯·彭特兰提出的创新技术框架,其核心特性是“不流动数据,只流动算法”。 OPAL利用分布式技术进行数据存储和运算,并在流程中都保持数据的加密状态,将经过验证的算法前置到数据端,不移动数据而只提供安全的分析结果,实现在从数据中获得有价值的洞察的同时,有效保证数据安全与流程合规。

TalkingData已经在OPAL研发中取得一定进展,未来也会将这个技术集成到相关产品和服务中。

技术是钥匙,也是安全门。我们可以用技术来挖掘数据中的价值,也应该用技术来保护数据的安全。

现在,数据安全和个人信息保护是一个严峻又重要的课题。不仅需要对数据相关各方严格监管,所有相关企业也应该主动重视并采取恰当方式来保护数据安全,坚守合法合规的底线。

编辑于 2018-10-17