2022-06-17 11:24:27191人阅读
数据作为数字经济时代的重要生产要素,其安全性、开放流通、价值挖掘引发的关注与热度不断攀升。数据价值已经在信息化、数字化、移动化的当下得到验证,如果社会能够将更多维度、更大的数据量链接打通,并以此作为分析的基础,那么其中能够实现的价值将不可限量。但正是因为数据本身、或者联合起来蕴含过多的敏感信息,随之带来的破坏性的窃取滥用,隐私、安全等多类风险日益凸显。在安全为第一要务的业务实践中,数据的流通发展就受到了限制。同时,为应对企业对个人信息的滥用,保护数据所有者相关权益,相关合规要求日渐严格,也让数据的流通面临更严格的条件。IDC数据显示,2021年中国隐私计算市场整体规模已经达到8.6亿元人民币水平。随着隐私计算技术在效率、安全性上的进一步提升,技术提供商产业分工更加明确、数据运营更加体系化,隐私计算市场有望在未来实现超过110%的增长率。
如何在合法合规的前提下,实现数据的开放,形成新的数据所有权机制是数字经济时代发展的重要命题。隐私计算一定程度上为开放与保护这样看似不可调和的关系带来了解决方案。发展隐私计算成为不可或缺的一部分,数据相关保护政策的出台,成为隐私计算市场短期内发展的重要推力,而数据需要开放与流通形成价值体系,是市场长远持续发展的根本动力。围绕数据共享与流通市场,百度安全凭借丰富的数据应用经验,以AI能力驱动技术落地,推出"百度点石数据流通与隐私计算解决方案"入选《IDC PeerScape:隐私计算全景研究》推荐厂商。方案基于数据安全沙箱、多方安全计算、联邦学习、可信执行环境(TEE)、区块链等技术能力,在数据安全与隐私保护的前提下,满足多方数据安全共享、开放、融合及建模计算,赋能政务、金融、医疗、教育、汽车、互联网等领域客户,解决数据融合应用困境。
解决方案中,点石联邦学习平台基于MPC(Muti-Party Computation)、FL(Federated Learning)、DP(Differential Privacy)等技术,向上对接联合计算、联合风控、联合营销等丰富应用场景;点石机密计算平台,融合独创的混杂内存安全模型与超安全连接(MesaLink)等技术,借助芯片级硬件的保护方案,高性能的保障数据机密性与完整性;点石数据安全沙箱,通过数据脱敏、数据抽样等数据保护计算技术,通过调试环境和运行环境分离的核心理念,实现数据所有权和使用权的分离,实现"数据不动程序动",从而达到组织数据的安全共享与应用。整体而言,百度安全提供丰富的标准化产品,以及灵活的模型定制化开发服务和模型调用服务。生态实践方面,百度安全作为PaddleFL、Apache Teaclave(incubating)两大隐私计算与机密计算开源项目发起者,推动隐私计算开源工作。同时,解决方案已在联合营销、联合风控、金融反欺诈、政务数据开放、生物医疗数据融合等多类业务场景落地,通过联合行业内上下游合作伙伴提供端到端整体解决方案,解决数据安全合规及数据流通中的数据价值挖掘困境。
金融是当前隐私计算部署最前列的行业。金融行业拥有较为完善信息化建设与数字化水平,同时围绕业务发展,有迫切的需求引入外部数据。以银行在隐私计算市场的实践为例:一方面,银行往往从总行层面进行数据管控与对外联合,撬动运营商、互联网企业数据,共享建模,以此实现用户群细分、丰富客户属性标签,实现精准营销,驱动银行业务的获客营销增长。此外,丰富的模型在一定程度上可以形成输出,赋能中小银行业开展业务。与电商数据融合,进行广告投放。另一方面,迫于一定的竞争压力,银行同业间合作集中于联合风控、反欺诈场景。基于隐私计算技术,有效联动客户在不同银行间的行为数据,实现多方位的贷款主体画像,对其资金流动、欺诈概率、还款能力进行有效把控,降低业务风险。
百度点石此前也入选《IDC PeerScape:金融行业隐私保护计算探索与实践》成功案例,多方数据通过百度点石可信执行环境技术,将参与方加密特征安全部署于保险公司,并构建认证模块、计算模块、加密模块等,结合可信硬件组网、硬件加密技术和唯一标示识别,对数据重合度进行有效评估和联合建模训练,既能保证各方数据的可用不可见和数据安全,也能有效融合各方数据。同时,平台通过进行联合模型训练、模型评估、模型生成和模型预测,将模型结果应用于老客挖掘,从而实现不同的产品精准化推荐给不同的客户。在此过程中借助AI深度学习算法能力、可视化处理能力等,不仅提升了已有精准推荐模型准确率,同时也为公司产品个性化精准推荐提供辅助决策。此外,在数据的使用过程中,某保险公司也通过"事前授权-事中监控-事后审计"等机制进行严格的环节把控,从而保障数据安全。通过可信执行环境技术的应用,在保障数据安全性及隐私性的前提下,百度点石安全融合了多方数据。项目中通过老客精准推荐模型的优化,贷后表现良好,不良率低于业界水平均值10%,同时该项目日均调用量达到50W+级别,极大地节省了营销成本。