☆纵横论税☆07随着经济社会数字化转型的不断深入,大数据正逐渐成为各行各业核心竞争力和社会治理的关键要素。但是,大数据应用也面临着巨大的法律风险和道德隐忧。如何在开放数据促进发展的同时保护数据隐私,是当下亟待解决的难题。开放算法技术(OPAL)通过“不流动数据,只流动算法”的创新模式,为大数据时代的数据开放与保护提供了重要路径,在税收领域有广泛的应用前景。一、OPAL基本情况(一)OPAL的产生背景和原理OPAL的产生背景与大数据的进一步发展,以及对数据隐私和安全的重视有关。每一次公众数据的泄露都会引起媒体和公众的极大关注,例如Facebook的数据泄露事件。这给人工智能领域带来了前所未有的挑战,研究界和企业界目前的情况是收集数据的一方通常不是使用数据的一方,这种数据在实体间转移、交换和交易的形式违反了《通用数据保护条例》,并可能遭到法案严厉的惩罚。OPAL的主要原理是:将经过验证的算法前置到数据端,在对数据的使用、分析的过程中均不移动数据(数据需求方无法看到原始数据)而只提供安全的分析结果(数据需求方只能得到经过OPAL算法分析后的结果),实现从数据中获得有价值的分析结果的同时,有效保护数据隐私。基于上述原理,OPAL具有以下特点:一是将算法的执行放在数据侧。即原始数据不需要离开数据拥有方,数据需求方只能得到数据分析处理后的结果,而无法获得原始数据。各方数据都保留在本地,不泄露隐私也不违反相关法规。二是算法可审查。多个参与者联合用数据建立虚拟的共有模型,并且共同获益的体系,各个参与者的身份和地位相同。由于算法是对数据的操作,因此OPAL所使用的算法在正式运用前均需经过严格审核,避免因算法不合规而导致数据泄露。三是数据在传输和计算过程中一直处于加密状态。建模效果和将整个数据集中放在一处建模的效果相同,或相差不大(在各个数据的用户对齐或特征对齐的条件下);OPAL在全流程中始终保持数据的加密状态,除数据拥有方外,任何人均无法得到原始数据,进而有效保证数据安全。开放算法技术(OPAL)在税收领域的应用思路金方剑金方剑金方剑08★纵横论税★(二)OPAL的工作过程在OPAL架构下,数据使用者(查询者)在对数据请求过程中,会经过下图所示的a、b、c三个路径,并形成闭环。第一步(路径a),查询者先从算法库中查询数据提供方提供的被审查过的算法,查询者根据业务需求可以选择一个或者多个算法。第二步(路径b),查询者将验证算法的签名,确定算法是...