夏志强 闫星宇:作为漂流资源的个人数据权属分置设计

夏志强

    摘? 要:在大数据时代,为兼顾数据安全和数据利用,隐私计算成为助推个人信息匿名化的通行操作。个人信息匿名化剥离了个体可识别性,形成“个人数据”。隐私计算在破解“数据孤岛”的同时又形成了“数据群岛”困境,制约了数据开放共享和数据市场发展。从根本上化解这一困境需要明确个人数据权属。然而,个人数据权属问题在实践与立法中或与个人信息权属混同,或被留白处理,值得深入研究。在数据流动的链条上,个人数据表现出一种多向度、零许可流动和嵌套式增殖的漂流资源特性,蕴含着公共资源禀赋、集体人格利益和开放性财产利益,理应由全社会公有,其权属配置应采取“国家受托—社会用益”的二元分置思路。“国家受托”是国家基于公共利益要求、国家治理的必需和应急管理的必要而享有的飞行检查权、算法共享权、读取使用权等权能,“社会用益”应从建立两级用益权制度出发,通过在地化转换、共建式开放、强制性开放的途径实现。
    关键词:个人数据 个人信息 漂流资源 权属分置
    作者夏志强,四川大学公共管理学院教授;闫星宇,四川大学公共管理学院中国式现代化治理研究中心助理研究员。(成都610065)
    一、背景与问题:化解“数据群岛”困境的数据权利之维
    当前信息和通信(ICT)技术的发展日新月异,高端芯片、智慧算法、高速网络和海量数据正在塑造泛在的数字世界。数据的爆发式增长逐渐彰显出规模数据对经济社会发展的巨大反作用,大数据所蕴含的巨大经济和社会价值也使之成为经济社会发展的重要资源和必备要素。因此,数据开放共享就成为时代要求。不过,信息与数据安全和权益保护始终是数据共享与开发利用中需要首先直面的核心问题,尤其是对于源自个人的且富含个人信息的原始数据。由于个人是企业和公共部门的基本服务对象,个人数据自然成为企业数据和公共数据的基础组成部分,是影响大数据开发利用的关键要素。源自个人的且富含个人信息的原始数据,即“个人信息”,由于关系着社会公众十分敏感的人身、隐私等人格权益,其权益保障是技术发展和政府关注的重点。正缘于此,即便将个人信息做匿名化处理,“个人数据”也会沉淀于各个数据采集者手中而难以流动,“数据孤岛”问题突出,严重制约着大数据开发利用。 为破解“数据孤岛”问题,隐私计算技术得到大力发展。不同于针对数据本身的隐私保护技术,“隐私计算”力图搭建数据活动全程的加密隐私环境,进而开展数据处理活动,实现明文数据不出域、数据“可用不可见”,最大程度实现隐私保护前提下的数据开发。特别是随着《数据安全法》和《个人信息保护法》的施行,个人数据隐私保护和合规流动成为刚性要求,隐私计算成为可信人工智能发展和地方政府数据开放平台建设的热门技术。
    隐私计算的普及带来了两大重要影响:一是密文数据成为常态,助推个人信息匿名化成为数据活动的共识操作,由此推动了“个人信息”与“个人数据”的分野,使“个人信息”与“个人数据”成了两个不同的概念。2017年以来,《网络安全法》《民法典》和《个人信息保护法》先后明确了“个人信息”的概念,即“个人信息”是“以电子或者其他方式记录的与已识别或可识别的自然人有关的各种信息”,不包括匿名化处理后的信息。可以说“个人信息”是对象化的、可识别特定个体的原始数据,是富含着个人人身、隐私等人格和财产权益的数据。但是在法律条文中,“数据”与“信息”是不同的概念,《数据安全法》规定,“数据”只是“任何以电子或其他方式对信息的记录”。在个人信息受到法律严格保护的今天,对个人信息的任何电子化记录都不是明文信息的直接电子化采集、传输、存储,而是加密后的电子化处理,匿名化已成为个人信息电子记录方式的必需选择。因此,“个人数据”就是个人信息匿名化处理的结果,是匿名化的、剥离可识别性的个人信息,属于“蒙面”的个人信息,其特点与个人信息明显不同。当前实践中,“个人数据”与“个人信息”术语的混用情况还比较普遍,需要加以厘清。
    二是“数据孤岛”问题演化为“数据群岛”困境。隐私计算虽然在一定程度上解决了“数据孤岛”问题,但由于隐私计算的技术路线和模型算法各异,且多形成闭源技术平台,由此实现的数据共享仅局限于同一技术方案的参与机构之间,数据流动在集群间受到阻滞。可是,“数据群岛”困境的破解仅从隐私计算技术标准的互联互通入手是远远不够的,必须从 “个人数据”的权属确定入手,方能从正当性层面实现根本破解。因为与解决“数据孤岛”问题不同,破解“数据群岛”问题需要同时关注数据流动的“可以”和“愿意”两个问题。强调隐私计算技术互通只是为技术平台间的数据流动与利用提供了技术可行性,然而,“数据群岛”现象本就意味着数据持有者基于隐私计算联结而形成的技术平台主导的数据流动共享圈层,在市场机制作用下,隐私计算技术标准互通会促成“数据群岛”进一步集聚,形成“数据阵营”乃至“数据寡头”。此种局面一旦形成,具有优势技术的平台基于市场竞争态势和博弈心理作用,推动数据全域全量共享开放的意愿将大幅衰减。此时,只有通过“个人数据”确权,将法律逻辑和行政权力介入数据处理活动,破解“数据群岛”困境才有正当性。因此,打破“数据群岛”不仅需要隐私计算技术通约化,更需要关注“个人数据”的权属问题。
    然而,当前国内外的数据立法实践只是对“个人信息”的权属进行明确界定,对“个人数据”(即匿名化处理后的个人信息,下同)如何认识和确权鲜有涉及,常常作模糊化处理。欧盟的《一般数据保护条例》以及我国的《民法典》《个人信息保护法》等立法文件对“个人信息”的权属界定已经比较清晰了,但对“个人数据”的权属基本都进行了留白处理。后续数据开放流动的相关立法(如欧盟的《数据法案》《数据治理法案》和我国各地制定的相关数据条例),继承了这一处理方式,对“个人数据”的权属未予明确宣告,而是通过承认和规范数据处理机构在数据开放和数据市场中的开发利用行为,间接认可数据处理者对“个人数据”的开发使用权益。显然,立法对 “个人数据”权属的模糊态度,不利于破解“数据群岛”困境,也不利于数据开放和数据市场培育。
    中共中央全面深化改革委员会第26次会议强调了“建立数据产权制度,实现公共数据、企业数据、个人数据分类分级确权授权使用”的原则。在此背景下,“个人数据”的权属不清将会加剧大数据开放利用的马太效应,对化解“数据群岛”困境、防止“数据阵营”乃至“数据寡头”的形成以及对数据自由流动、开放共享构成产权障碍。因此,清晰界分“个人信息”和“个人数据”,探究“个人数据”的权益内容和权属配置,是当前亟待突破的重要问题。
    二、个人数据权属内容及权属配置的论争
    当前,个人数据权属问题是数据治理的热门议题,学界就个人数据权属内容分类、权属配置等问题进行了广泛讨论。其中,就个人信息与个人数据的关系、权属内容确定和配置等关键问题,研究者产生了明显分歧,甚至有激烈的论争。需要说明的是,既有研究大多没有区分“个人信息”与“个人数据”两个概念,“个人信息”与“个人数据”概念混用的情况十分普遍。为便于行文,本文在以下文献综述部分均以“个人数据”指代之。
    (一)个人数据权属的内容认知及其争论
    数据权属配置的前提是要明晰数据权属内容。当前,关于个人数据权属的研究形成了民法传统说、公法主权说和新型权利说三种观点。民法传统说是从民法传统中的人格权、财产权二分出发,将个人数据所附着权益定性为人格权益或财产权益。公法主权说关注大数据背景下公共数据的存在和数据的公共属性与安全需求,提出了大数据领域的主权回归。新型权利说认为数据是不同于传统的人身、物和知识成果等的民事权益客体,不同的数据活动环节及其参与主体的数据权益并不完全界限分明,后继环节参与主体的数据权益往往“向前兼容”,即数据产生之后数据处理诸环节的数据权益往往混融有前置环节参与主体的数据权益。有学者认为,个人数据是一种独特的新型权利,即人格权、财产权、数据主权及它们的细分权益所构成的“权利束”或者私人数据与公共数据的“权利块”。
    这三种认识并不标志着学界对个人数据权属内容的功能性划分,而是研究者在数据权属内容的不断争论中浮现出的竞争性解释。尤其是民法视角上个人数据的人格权益与财产权益之论争尤为突出,其中伴随着学界对个人信息和个人数据关系这一数据活动基础概念的认识分歧。
    首先,个人数据的人格权益是否存在是一项争议尖锐的议题。一些学者认同个人数据具有显著的人格权色彩,具有非客体性和非财产性,甚至一些学者力图论证个人数据权益是非财产性的人格权益。但也有一些学者的观点完全相反,他们基于数据与信息的区别,提出数据是对信息匿名化处理的结果,个人数据已然剥离了个人信息涉及的人格法益。
    其次,个人数据是否附着财产权益也是一个有争议的议题。一种观点认为个人数据被收集存储到数据控制者一方,是基于合同约定,其产生的财产价值是数据处理者的劳动和创造,个人数据没有财产权益,只有个人数据集合才具有财产权益,只不过需要保障在数据汇集利用开发中个人数据的人格利益不受侵犯。但是,也有观点指出,在厘清信息与数据关系的基础上,个人信息与个人数据分别关涉人格利益和财产利益,个人数据的财产价值与其人格权益密切相关,属于可市场化估值的人格标识使用性财产权,个人数据具有与人格权益密不可分的财产权益。
    这一争论的背后是学界对于“个人数据”和“个人信息”的基本关系存在认识分歧。当前,学界对个人数据与个人信息的关系认识有等同、相对、包含与被包含四种观点。也就是说,在数据与信息的关系认识上立场是离散的。有的学者认为数据关涉人格权益、具有非客体性和非财产性,而有的学者则认为信息指涉人格权益而数据属于财产权益,最终导致既有研究对个人数据与个人信息的关系及其中人格或财产权益定性的认识极为多样,数据权属的定性与内容难以达成共识。
    (二)个人数据权属配置及其论争
    数据权属配置是数据治理的基础工作。个人数据权属在数据活动相关方之间合理配置,是数据开放共享和市场化运行的产权前提。当前,此方面的研究主要围绕数据生成个体、数据处理机构和政府展开,并试图建立适切的个人数据权属格局。
    第一,关于个体与数据处理机构间的数据权属配置。总的来看,这类研究是从二者的联系中定位彼此,并形成了“个体—组织”二元化数据权利观。一方面赋予个体对数据的自主决定权益(知情、拒绝、更正、删除)、信息安全与人格权益、财产权益等;另一方面,在保护个体数据权益的同时,确立数据处理机构对数据的财产权益基准,确立兼顾客户数据权益、数据从业者使用权益和公共利益的使用、流通、收益、保密等数据权利。
    第二,关于国家在个人数据权属配置中的角色。个人数据权属配置研究的政府出场,主要通过数据权利赋予、主权正当运用两种途径。基于大数据时代个人数据生成和汇集的全域化个人数据集合的公共属性与安全诉求、数据权利的私法界定与市场逻辑之间张力的考虑,国家应当成为个人数据权属配置的必要主体。当前研究有三种观点:国家所有与市场经营、数据权力与数据权利、数据主权与数据权利。
    第三,为力避各主体间数据权属配置的龃龉,个人数据权属的体系或制度建设也成为受关注议题。此项研究主要是贯通个人数据生成、流动的全过程,形成分段配合、无缝衔接的权属体系。由于不同学者的理论依据和切入视角不同,这方面研究呈现出多样化局面,包括“数据主体—数据经营者”二元的个人信息权—数据资产权;“原始数据—交易数据—增值数据—公共数据”产权四分的自然、约定、添附、国家所有;“个体—企业—公共(政府)”数据产权三分的权属设计等。
    第四,需要说明的是,学界对个人数据权属配置格局也基本上达成了一些共识性框架,但在权属具体配置和平衡上,学界还存在明显的观点论争,这一论争围绕数据保护与利用这一常讲常新的矛盾展开。具体有以下三种观点:其一是风险偏好,即对数据的利用优先于保护。该观点主张立足于促进数据利用和推动大数据发展,限缩数据产生个体的数据权利范围,将其限制为防御性权利,即在避免数据控制者侵权的基础上尽可能促进数据利用。其二是安全偏好,即保护优先于利用。这种观点着眼于纠正数据无序竞争、治理业已存在的数据安全和侵权事件,主张限制数据处理机构的数据权利,即在保护个人数据、保守国家秘密、遵守数据出境规则、尊重知识产权等基础上,规范数据处理机构的数据用益、流转权。其三是国家平衡。主要通过两种方式:一是以权力规范权利,国家通过立法平衡个人数据保护和数据高效利用,通过行政执法和司法救济保障立法目的实现,国家作为“守夜人”规范而不是取得个人数据权属;二是依权力取得权利,国家改造个人数据的权属格局,以“国家所有—市场用益”的新格局,通过数据所有权国家化实现个人数据保护、数据用益权市场化实现数据有序高效利用。
    (三)已有研究存在的相关问题
    虽然个人数据权属配置研究形成了一些共识框架,譬如,人格、财产框架内的权属内容设置,个体、数据处理机构和政府框架内的权属配置格局;但深入其中却是迷雾重重,研究者们就共识框架内如何确定具体权属内容和配置争论不断。结合当前数据立法的要求和趋势,本文认为既有研究存在以下缺陷,对之有效回应或有助于廓清迷雾。
    一是对待个人信息匿名化有失审慎,对个人信息匿名化处理后的“个人数据”的权属问题缺乏关注。既有研究虽然注意到了匿名化在数据技术中的客观存在,但对匿名化技术持怀疑态度,对个人信息匿名化的判断标准缺乏深入分析。信息技术迭代升级十分迅捷,技术攻防贯穿其始终,不能因为匿名化存在可还原的技术可能,就否定匿名化技术应用的必要性。个人信息匿名化是否可能以及如何衡量,需要我们重新审视,这是确定“个人数据”权属及其配置的基础问题。
    二是对“个人数据”及其活动的公共性重视不足,政府作为个人数据权益的“守夜人”角色设计存在缺陷。虽然,当前关于数据主权的研究正在增多,但主要指涉国际社会中国家间的数据管辖权及数据安全,并不涉及国家主权内的个人数据权属配置格局。当前仅有个别研究将国家介入个体和企业为主的个人数据权属配置格局中,提出个人数据集合作为资源的国家所有和市场用益的思路,其他研究主要将国家视为个人数据权属配置和保护中的“守夜人”角色。国家作为公意代表,这样的“守夜人”定位是有待考量的。因为“个人数据”虽然匿名化了个人信息,但其属性标签仍源自个人信息,在实践中,通过数据画像或大数据“杀熟”等手段,个人数据被无序乃至恶意利用已经造成公众不安乃至恐慌,并转变为公众对个人信息权益将被侵犯的合理预期。因此,在个人数据权属配置问题上,应当充分考虑政府的作用。
    本文着眼于既有研究的不足,从立法衡平数据权益保护和数据开放利用的发展态势出发,基于个人信息匿名化渐成行业惯例和法律许可的现实,以匿名化的视角对“个人数据”作重新审视,对“个人数据”和“个人信息”加以区分,提出个人数据作为一种漂流资源的新论断,并基于此设计、论证个人数据权属“国家受托—社会用益”的分置格局,以期与业已成熟的“个人信息”权属一道,补齐“个人数据”权属不清的短板,夯实大数据发展的数据权利基础。
    三、作为漂流资源的个人数据及其权属设计
    作为匿名化的个人信息,“个人数据”在数据处理活动中表现出了自由漂流的特性,具有公共资源禀赋,个人数据的权属设计必须在这一现实的基础上展开。
    (一)大数据时代作为漂流资源的“个人数据”及其特性
    在大数据时代,“个人信息”的流动受到民事法律和信息保护专门法的严格限制,“应用必授权”“授权前置”成为至上原则。反观“个人数据”,由于实现了对个人信息的匿名化处理,数据应用活动无须获得个体许可,数据流动门槛较低,遵循自由流动、法定限制、保障安全的规则,“个人数据”成为一种公开于交易市场和公共空间的漂流资源。
    所谓“漂流资源”,就是能够自发地或在给定的框架内跨时空自由流动,且在流动中可受微环境影响而产生往复性飘荡的连续性有形物或无体物。“个人数据”就具有这种漂流资源的特性。首先,个人数据是大数据的重要来源,具有明显的经济、社会和战略效用。个人数据是通过个人信息匿名化而来的,但在匿名化过程中的要素投入不是数据处理者对个人数据占有和行权的充分理由,法律也将匿名化个人信息与个人信息授权使用的权属原则作了分离,故个人数据可以无限复制和开放取得,属于公共物品。这一点类似于公共水资源,具有明显的非排他性和非竞争性,人人可取之用之而不可损之,人人可用之而不可独占之,不同主体可依据市场原则或公益原则享有用益权。其次,个人数据具有显著的流动性和汇聚性,这是在法律框架和市场机制调控下形成的。个人数据的流动在法律禁止性规定和保障安全义务的限定下,可按照公共空间开放获取或交易市场谈判取得等方式自由流动。当然,在流动中个人数据也可能不断向优势平台汇聚。最后,个人数据受微环境影响存在飘荡式增殖。在宏观层面上,个人数据是朝向高效用领域的定向流动的,但在微观层面上,个人数据在数据处理主体间双向流动、往复性飘荡,实现了数据分享和扩增。
    在大数据时代,个人数据能够成为一种漂流资源,也是技术力和政治力共同作用的结果。
    一是新兴信息技术的类脑智能进化取向,要求并推动“个人数据”成为一种漂流资源。“云大物移智”等新兴信息技术发展的一大特点即是类脑智能趋向的自我进化。物联网、互联网是数据端口和数据采集的主阵地,海量数据通过高速通信技术和云计算实现了大数据迅捷传输和处理,支持人工智能算法的设计和深度训练;反过来,人工智能的成熟尤其是以机器深度学习为代表的类脑智能的发展,不仅推动了其自身的大面积应用,而且改造提升了大数据、物联网、互联网和云计算运用的智能化程度,实现了对现实世界更为立体全面的大数据刻画。如此循环往复,新兴信息技术不断实现着自我进化,开始迈向全面镜像现实世界的数字孪生体。信息技术的类脑智能进化趋势会将越来越多的现实世界场景纳入数据化和智能化范畴,而且由于类脑智能进化进程的高度开放性,纳入的广度和深度几乎不可预测,导致技术应用场景具有高度随机性,这就要求作为底层支撑的数据要实现全量采集、多源异构和自由流动,以供不同的应用场景需求随时自由调用。对于“个人数据”,因为没有类似个人信息流动的授权前置约束,让其成为“漂流资源”是信息技术发展的必然要求。
    二是当前数据治理立法对“个人信息”和“个人数据”作了区别规定,默许并促成“个人数据”成为漂流资源。我国的《个人信息保护法》和《民法典》针对“个人信息”采用权利化或法益化的明确保护,确定了严格的授权、安全和侵权追责机制。而上述法律以及《数据安全法》对于匿名化个人信息之后的“个人数据”,采用尊重自由、法定除外的流动规则。除以法定形式保障数据安全和主权而限制流动外,“个人数据”只需处理机构对不可逆匿名做技术勤勉保障后即可自由流动,无须个人数据产生的主体授权。显然,当前数据治理立法的默许态度,将引导并促成个人数据在现实中自由分享、自由流动。
    概言之,“个人数据”作为漂流资源具有多向度随机、嵌套式增殖、零许可流动的特点。个人数据的漂流不是只基于数据处理流程的单向流动,而是基于应用场景需要和数据处理机构的数据动态采集情况依照协议约定或通行规则随机“漂荡”,此即“多向度随机”;嵌套式增殖主要针对个人数据的更新和扩增,数据处理主体之间依照协议约定或行业规则对流入数据结合自身掌握数据进行匹配和扩增,并进行回流分享;零许可流动强调个人数据因为实现了匿名化,法律政策支持其可以不经信息生成者授权许可即可依照业务需要自行流动。
    (二)作为漂流资源的“个人数据”二元分置权属设计
    在匿名化视角下对“个人数据”和“个人信息”加以区分的基础上,确认“个人数据”的自由漂流特性不仅为兼顾个人信息保护和个人数据自由流动奠定基础,也为讨论个人数据权属配置提供了新的思路。
    对于自由漂流的个人数据而言,其权属不像个人信息那样直接明了、几无争议。当前,关于“个人数据”权属有两种设计思路:一是“生成者所有—处理者用益”,二是“处理者所有”。这两种思路缺陷较为明显,成权合理性尚不充分。
    其一,“生成者所有—处理者用益”,即个人数据的所有权归产生数据的个人拥有,个人数据的用益权归数据处理者所有。这种思路突出了个人数据的财产权益属性,但未与个人信息的权属配置相区分,将个人数据所有权和使用权分别确定于数据生成者和数据处理机构。这一思路的缺陷是所有权的财产利益不显著,个人实现权利的成本高、难度大。因为个人数据经过随机式、嵌套式的多次自由漂流,处理者持有的个人数据多源异构巨量,其中的匿名化技术各有不同,复原匿名化信息所需的算力、技术、时间和资金投入不可控,而且个人数据利用开发的收益是由海量数据分析获得,个人单条数据的贡献权重难以测量,平均分摊则单条数据收益甚少,这样的单条个人数据财产利益的获得成本高、单位价值低、没有显著的公共意义,将其作为权利去实现,不符合成本效益最优的比例原则,甚至没有价值。
    其二,“处理者所有”,即个人数据的所有权归数据处理机构所有并资产化。这种思路是基于数据处理过程中智力、资源投入和契约合意的成权理由,但这不是赋予其个人数据权属的充分理由。因为在大数据活动中,个人数据既源于依智能算法和程序设计进行的终端采集或第三方获取,也生成于数据分析环节的算法运算。虽然,数据处理机构对数据处理投入了资源和智力成果(譬如资金、算法人才与模型等),才能实现个人信息的获取和匿名化,但是,算法研发除了依靠智力、资源投入,也离不开海量数据的输入和训练。训练算法的以及智能采集的多源异构数据本身就来自客观世界的不同对象,数据处理者是在业务经营中与服务对象为便利服务而达成个人信息获取与利用合意,这一合意针对的是服务对象的个人信息的保护与利用,合意的主体内容并不涉及“个人数据”的权属约定和让与。因此,数据处理者配置硬件、开发程序和研发算法而投入的资源和智力成果是其主张个人信息权益而非主张个人数据权属的正当理由。
    不论是经济活动还是政治社会生活,明确权利义务关系都是社会关系成熟化、法治化、可预期的重要标志。基于个人数据的自由漂流特性以及以上对个人数据权属确权的困境分析,本文认为可以探索将个人数据权属分置为“国家受托—社会用益”。个人数据作为一种漂流性的公共资源,从根本上,它不是数据收集、存储、传输、加工等环节数据处理者的私有财产,而是属于指向不特定公众的公共资源,是全社会“公有”的资源。
    需要阐明的是,本文认为,个人数据的所有权应定位在全社会“公有”而非“共有”,乃因二者有不同意涵。虽然,在社会生活中“公共”多作为固定词组应用,但在辞源上,“公”“共”的含义有所不同,“共”(Common),在西语和汉语世界均是“共同享有”的意思,“公”是以私为对照的国家、集体。在政治理论中,“共有”强调共同体立场,“公有”是从个体利益出发建构公利益,也就是与“私”相对照。在产权理论中,“共有”是融合公有、私有经济主体的开放性、包容性、合作性产权机制;“公有”是在公私对堪中确定的国家或集体所有,一定程度上对私有具有排斥性。总之,“公有”是与私有相对的,带有明显的公共价值取向,而“共有”强调产权主体的多样化和份额化,针对的是权属主体关系。个人数据所有权“共有”面临着确权的不经济性和权属份额划定的技术难题,因为海量个人数据复原实名和个体数据对整体数据开发收益的贡献计算是一项成本高企且颇具挑战性的工作。故而,个人数据所有权由全社会“公有”是合理的。
    然而,所有权由全社会“公有”,但其行权是困难的。由于政府具有公权力属性和公共利益代表身份,因此由国家“受托”行权是具有合法性和可行性的。当然,“国家受托”行权是有限制的,政府设置的公共机构只有在基于公共利益要求、国家治理的必需和应急管理的必要时,才可对个人数据享有特定的处置权力。个人数据的“社会用益”是指其用益权向社会开放,由各类社会主体(个人、企业、社会组织、公共机构等)通过立法强制、共建共享等开放式渠道获取。
    (三)个人数据权属配置“国家受托—社会用益”的合理性
    权利主体取得权利的合理性论证是借助学科资源由学术共同体完成的理论创新工作,涉及政治哲学、法学、经济学和应用伦理学等学科,包括自然权利观、自由主义权利论、功利主义权利论、契约权利论等权利证成理论,形成道德权利、经济权利和法律权利等概念范畴。
    不同的概念范畴对理论资源各有倚重,进而赋权合理性逻辑各有不同。道德权利是道德权威通过道德推理证成,其汲取的是义务论和功利论等伦理学学科资源;经济权利是对特定个人或组织的财产经由注册行为和经济合约而正当成立;法律权利是国家(法官)依法律权威对公民及其财产的保护,是对道德权利的法律认可和立法转化,主要须从法学中获得学理支持。
    “个人数据”作为新兴的权利,与传统物权客体之“物”大为不同,对经济活动、社会管理和国家安全均具有重大价值。其作为权利涉及经济、道德和法律等多个层面,从这三个层面论证个人数据赋权合理性是妥适的。如前所论,经济权利的赋权是以特定对象财产为前提的,财产的公私属性是赋权证成的关键;道德权利成权的合理性源于道德推理自洽,根本上须寻求功利论和道义论等伦理理论簇的依据;法律权利的赋权逻辑是国家公权力对值得保护的经济社会关系的法形塑,其背后是法益的共识化和类型化。因此,个人数据权属二元分置的成权合理性需要从个人数据的自由漂流特性,结合经济、道德和法律权利的成权逻辑加以论证。
    首先,“个人数据”的自由漂流特性体现了其公共资源特性,决定了其作为财产的“国家受托—社会用益”的确权思路。个人数据本身具有鲜明的非对象性、虚拟存在、非均质化特点,此外,“个人数据”作为漂流资源,其多向度流动、零许可流动和无限次复用的特质,表明了个人数据具有显著的非竞争性和非排他性。需要说明的是,一些学者认为的个人数据具有排他性,是以数据处理机构对个人信息处理的经济要素投入作为赋权合理性事由论证的,这一论证含混了个人信息与个人数据分别作为相对独立的数据处理活动的事实。要素投入主要存在于个人信息处理活动,数据处理机构在匿名化上的要素投入与个人信息处理活动中的投入相比微不足道,数据处理机构对个人数据没有享有独占排他权益的正当理由。因此,个人数据具有明显的非排他性,符合公共资源构成属性要求,应当由全社会公有并将用益权向社会开放。
    个人数据的公共资源特质也体现出显著的经济权利属性,要求个人数据的全社会公有通过“国家受托”的方式行权。由于个人数据属于公共物品,其作为财产的开放性和非竞争性以及巨大的经济社会效用十分突出。根据公共经济学的观点,对于公共物品,由于排他性、稀缺性不足,其定价机制、准入门槛难以市场化建立。若将产权确定为处理者私有,个人数据的所有者林立,定价难以形成共识,个人数据的多向度零许可流动将无法实现,会衍生出利用或修改个人数据进行商业博弈等负外部性。由于个人数据是一种开放性和不具稀缺性的漂流资源,其定价机制也无法市场化确立,引入公私合作等中间形态的产权设计无法有效落地。实际上,当前关于数据市场的探索,也是将数据产品与数据本身加以区别,只针对数据处理者研发的数据产品的定价、交易等市场机制进行探索,个人数据如何确权与定价尚在悬置。对于此种公共物品,由全社会委托国家作为代表行权,可先行绕开个人数据定价问题,在确定个人数据全社会公有权属的同时,国家作为受托人通过立法强制、共建开放等方式,推进个人数据的自由漂流和用益权社会化,也有利于发挥个人数据的经济效用。
    其次,“个人数据”蕴含的集体人格利益属于特殊公共利益,其所有权应当由全社会公有并由国家受托行权。由于对个人信息进行了隐匿处理,“个人数据”已然不指向民法范畴的个体人格利益。但是,个人数据只是隐去可识别个人的属性标签,且作为漂流资源,个人数据可以无须生成者同意而便捷地随机流动并在此过程中实现数据更新和扩增,这就意味着对个人数据进行大数据分析可以呈现愈益全面、精细、动态的群体性、区域性全息画像,直接关涉不特定公众的生活安宁、社会秩序与公共安全。显然,个人数据蕴含着一种指涉不特定公众的集体人格利益。从政治哲学和伦理学上看,这种集体人格利益表现了一种不同于民主逻辑下的公意生成方式,是极为特殊的公共利益,它要求个人数据由国家受托行权,原因有二:
    一是只有如此才能消除个人数据自由漂流带来的突破民主制度下的公意生成逻辑的隐忧。个人数据的流动汇集特性和嵌套式增殖会极大促进数据开发利用,也会更为全面精准地呈现社会公众需求,由此也带来了不特定人群集体人格画像的浮现。从政治哲学上看,这种集体人格画像是一种现代技术条件下的公意表达。在现代民主制度下,公意通过票决制或协商民主程序得以呈现,国家政权也由此取得合法性,公意也是政府执政的核心资源之一。如果公意可以通过更为迅捷的方式更为精准地通过个人数据自由漂流、汇集分析而得以呈现,数据处理者尤其是优势数据平台掌握公意的过程并未经过民主程序,无法对其有效监督,它利用公意不仅可以实现规模变现,也可以增强对外谈判能力,尤其是可以和政府谈判乃至博弈,将会带来严重的政治和安全隐忧。如果采取行为规制的方式,无论是行政管理还是刑事处罚措施,都属于事后监管,无法对此有效预防。只有将个人数据所有权确定为全社会公有并由国家受托行权,才能从根本上控制和平衡数据处理者尤其是优势数据平台的公意资源优势,消除政治和安全隐患。
    二是只有如此才能有效回应集体人格利益对个人数据作为漂流资源的正当性诘问。集体人格利益是个人数据自由漂流生成的群体性(区域性)画像所附着的整体性和类型化的类人格权益,这种利益关系指向不特定公众和群体,如果个人数据权属确定为个体、集体或者某种混合形式,这种指涉不特定公众的利益就与权属配置本身所保护的利益发生冲突,个人数据作为漂流资源就会受到正当性的拷问。
    最后,自由漂流的“个人数据”指向的开放性财产利益,客观要求其用益权向社会开放。数据的财产利益是其作为新兴生产要素和战略资源的微观基础,个人数据作为漂流资源实现的零许可多向度自由流动、大数据时代对数据全量化全域化的要求和个人数据的公共资源特性,决定了个人数据指向的财产利益属于开放性法益。也就是说,数据处理机构尤其是优势数据平台对个人数据的事实占有并不意味着其对该类数据具有独占用益和许可使用的权利。因此,从法理上讲,个人数据的用益权应当实现向社会开放,具有民事行为能力的各类社会主体可通过共建共享、开放获取等方式实现自由有序使用个人数据。
    虽然,在法律上创制个人数据用益权并赋予开放性十分必要,但实现个人数据用益权的社会化开放,还需要解决可行性上面临的两点争议:一是个人数据用益权开放与《反不正当竞争法》所规定的商业秘密保护之间的平衡。根本上看,二者并不矛盾,法律保护的商业秘密是不为公众所知悉、具有商业价值并经权利人采取相应保密措施的技术信息、经营信息等商业信息,显然,个人数据只是个人信息的匿名化并不是公众不知悉的,个人数据只是数据分析的原料,与生成商业价值尚存在较长的数据加工链条,尚难构成商业秘密。不过,商业秘密问题反映了个人数据用益权开放的设计中需要处理好开放和秘密保护的关系,关注数据安全和风险问题。二是数据平台治理的相关研究提出了“守门人”理论,突出了对大型数据平台的监管,强调了其开放数据的义务,这对个人数据用益权开放性的分步实现具有启示意义,但不意味着个人数据开放会止步于大型数据平台组织。因为数据对于当前人类社会的重要性关键在于其全方位汇聚的大数据,单一数据平台企业其规模再大亦无法涵盖全部个人数据,个人数据开放的意义不仅在于直接获取,更在于用益权社会化开放后数据经纪和数据分析组织的更好发展,个人数据效益发挥更为充分。
    四、个人数据权属分置设计的关键问题
    根据权利理论的一般观点,一项权利的证成涉及权利主体、客体、内容和取得合理性。其中,主体取得权利的合理性论证是权利证成的核心,也是权利理论分殊的标志。除此之外,关于主体对客体的权利内容、权利义务关系不仅要在形式上逻辑自洽,还要在现实中真正落地,即实现权利的可行性也是权利证成的重要面向。
    需要特别说明的是,本文讨论的是个人数据这一新兴事物的权属问题,并将匿名化作为界定个人数据以及区分个人信息与个人数据的关键,因此,论证清楚个人信息匿名化如何能够成功,即不可逆匿名化应当以何种标准判断,关系到个人数据的概念界定和作为漂流资源的属性是否成立,是个人数据权属分置设计的前置要件。所以,个人数据权属分置设计的证成需要回答好三个问题:个人信息不可逆匿名化的判断标准、实现权利的可行性和权利配置中的数据安全保障。
    (一)个人信息不可逆匿名化的判断标准
    个人信息匿名化处理问题在既有研究中已有学者提及,但未在数据权属问题研究中专门加以审视。既有研究未充分重视个人信息匿名化对个人数据及其权属配置的影响,最重要的一点是学界许多人对匿名化不可逆持怀疑或否定观点,匿名化对数据权属配置而言也就变得无足轻重了。因此,本文需要对个人信息不可逆匿名化如何判断进行有效回应,这是支撑“个人信息—个人数据”二元分型以及论证个人数据权属二元分置的关键基础。
    由于国内外数据立法均在个人信息严格的授权、处理和保护规则之外确定了匿名个人信息的豁免规则(即实现不可逆匿名化),个人信息匿名化成为数据企业和监管机构协调个人信息隐私保护和个人数据自由漂流的关键工具。国际上,一些研究对个人信息不可逆匿名化持批判态度,特别是加州大学洛杉矶分校2010年的一项研究常被引用,在学界有较大影响。针对此,本文在此对个人信息匿名化的还原性提出三点反驳理由,意图纠正我们对个人信息不可逆匿名化的极端认识,明晰不可逆匿名化的判断标准。
    第一,不应当对个人信息不可逆匿名化采取极端认知,即反例即为证伪。只要匿名化技术遵循合理必要、符合预期、技术勤勉的原则,最大化抬高匿名化还原的技术门槛,稀释其可得利益,就应当认可个人信息匿名化不可逆。无论是福利经济学的“卡尔多-希克斯”改进,还是政策科学的渐进决策模型均启示我们,人类只能是上帝的邻居,完全理性只存在于演绎世界,有限理性是人类社会的常态。在当前技术条件下,在科技界对数据匿名技术攻防的现状及趋势的合理预测范围内,科技共同体只要采取了适合应用场景的技术方案,选择了针对性的技术工具和安全冗余措施来匿名化个人信息,就可以在当前技术攻防条件下,大概率增加破解匿名化的技术和经济成本,有效减轻和补救还原匿名化的连锁后果,那么,这样的匿名化技术方案就应当被认为实现了不可逆的匿名化。以前文提到的加州大学洛杉矶分校2010年研究为例,该研究所举个人信息匿名化的事例主要采用点匿名、边匿名等匿名方案,通过外部信息获取和交叉分析复原匿名化。但需要注意的是,该研究忽视了其所举匿名化技术之例并非同时期匿名化技术的最新进展,几乎在同时期的全同态加密技术、差分隐私保护等最新数据匿名技术已经成型,这些技术对攻击者利用外部背景信息实现匿名化还原有良好规避效果,故不可逆匿名化不应当轻易否定。
    第二,个人信息匿名化后被还原所造成的法律后果,与个人信息被泄露相比,并无本质区别,匿名化可还原的现象没有特别的公共意义。信息革命以来,个人信息早已经通过互联网应用和电子计算机、智能终端的全面普及而作为身份信息和痕迹数据上传留存于计算机系统和网络空间,个人信息保护和数据安全的制度建设与立法工作已经日臻完善。就算匿名化个人信息被模型算法和大数据联动而还原,但大批量还原匿名化个人信息是未经合意、批准或法律授权的有组织违法犯罪行为,与批量泄露公民个人信息属同类情形,自然会被纳入个人信息保护和数据安全的制度和法律框架进行制裁。因此,与个人信息被泄露相比,个人信息匿名化被还原引致的法律后果并无实质区别。而那些零散式猎奇的还原没有显著的公共意义,个人信息匿名化整体上应当视为不可逆。
    第三,从技术攻防的角度看,个人信息匿名化确实存在可还原的技术漏洞,但这恰恰证明了“个人数据—个人信息”分型和个人数据“国家受托”的现实必要性。由于技术深度、外部信息掌握程度不同,匿名化个人信息被还原后暴露的是随机对象的信息,会持续造成不特定对象信息权益的不确定性损害,使得公共利益和社会秩序处于不安状态。故而,个人数据应当被确定为全社会公有并由国家受托行权,才能有效以公共利益受损的名义进行权益维护。
    (二)个人数据所有权权能配置和用益权社会开放的实现路径
    讨论个人数据所有权权能配置和用益权的实现,需要特别注意与“个人信息”保护的区别。我国《民法典》《个人信息保护法》《数据安全法》等对“个人信息”的保护是完整且严格的,因此,对个人数据所有权权能配置和用益权的实现必须在这个框架下,不能与之抵触。不同于传统物权所有权的四大权能,根据“个人数据”的漂流资源特性和数据活动的现实特点,本文认为个人数据由国家受托行权是基于公共利益的要求、国家治理的必需和应急管理的必要,这样的权能主要包括飞行检查权、算法共享权、读取使用权。
    “飞行检查权”是基于数据分散占有的事实,在分布式存储、高性能计算与通信网络等技术日渐发达的情况下,国家对个人数据彰显占有的低成本变通方式,借鉴药品监管、飞行器质控领域日益成熟和体系化的飞行检查制度,利用数据连通、共享开放和监控技术更便捷、全面、即时地对数据处理机构生成、利用、开放个人数据集合的情况进行检查监督,确保符合匿名化标准、惩处个人数据不当利用、推动个人数据开放共享,促进国家机关跟踪掌握相关技术和数据漂流的最新动态,防止技术信息不对称的情况出现。“算法共享权”是指国家通过要求数据处理机构提供匿名化个人信息的技术算法的方式,从源头防止数据处理者利用《个人信息保护法》对匿名化个人信息的排除适用规定,将个人信息包装为个人数据,以防个人数据权属“国家受托”行权与个人信息个体自主权产生龃龉,冲击个人数据权属的秩序安排。“读取使用权”强调在不与民争利的前提下,基于国家治理的需要,调用相关组织个人数据集或搭建数据通信网络,以进行个人数据调度分析。一般情况下,基于公共利益和紧急事态需要,即使不设置此项权利,国家也可调用个人数据。本文在此强调的是常态情境下,作为漂流资源的个人数据,其自由漂流形成庞大数据集合服务于公共利益、国家治理和应急管理是“国家受托”的应然之义。
    个人数据用益权的内容包括数据使用、收益和流转的权利,但仅有内容设计尚显不足。用益权的关键在于使用和流动,个人数据用益权的社会开放是保障个人数据自由漂流和实现个人数据所有权权能的关键汇集点。因此,个人数据用益权如何落地,就在于用益权社会开放如何实现。本文主张应当通过建立两级用益权制度,实现用益权社会开放,其实现路径具体包括:在地化转换、共建式开放、强制性开放。当前,个人数据处于分散占有状态,主要聚集于大型组织(政府机构、大型数据平台等)。因此,个人数据的“社会用益”应当通过建立两级用益权制度逐步实现。
    一方面,由于数据处理机构对个人数据的生成、存储投入了相当的资源要素,也事实上优先占有这些数据,因此,国家作为受托人可以对各大数据处理机构的数据安全水平和数据占有使用情况进行评估许可,将数据处理机构对个人数据的事实占有“在地化”转换为个人数据的一级用益权。质言之,这些大型数据处理平台是个人数据生成的初始平台,持有庞大的数据量,也是数据活动中的“守门人”,经国家审查许可赋予其对占有数据的一级用益权,是恰当的、合理的。同时,这些数据处理机构也拥有要求其他数据平台开放个人数据的权利,并负有向其他社会主体开放个人数据、培育形成个人数据二级用益权的义务,不可偏颇。
    另一方面,要在此基础上通过“共建式开放”“强制性开放”的途径,建立个人数据二级用益权,实现用益权的社会化开放。“共建式开放”路径主要强调在“国家受托”以许可或备案管理等形式确立的情况下,优势数据平台和行业主体经许可或备案以自主协商的方式,共建数据共享名录、标准和技术规范,推进各自持有的个人数据开放共享。“强制性开放”是政府为国家治理的需要,对政府持有的个人数据和其他社会主体持有的个人数据集合,建立普惠性导向的数据开放目录和技术标准,以政府政策乃至国家立法行动推动个人数据用益权开放。
    (三)个人数据权属二元配置下的数据安全和风险防范
    国家受托的权能配置和社会用益的实现均需要注意数据安全和风险防范,其侧重点有所不同,个人数据“国家公有”需要在权能配置中特别关注数据风险防范,个人数据用益权则是在社会开放的具体路径中关注数据安全考量。就个人数据而言,数据安全的主要考量是避免大面积个人信息还原和个人数据利用危及国家安全和公共安全。
    个人数据“国家受托”的权能配置中的数据安全,可以通过融入飞行检查权和算法共享权的权能行使加以解决。通过飞行检查在检视数据处理者生成、利用和开放个人数据集合的活动时,可以通过引入外部专家和信息安全技术进行压力评估和风险测试。而通过“算法共享权”的行使,国家可以掌握当前个人信息匿名化的具体技术路线,避免低门槛、大批量的个人信息还原,评估并指导用益权人改进数据安全水平。
    个人数据用益权向社会开放中的数据风险问题,主要是在高水平开放后容易出现个人信息的大数据还原和国家安全、公共安全风险。这主要从三个层面的制度安排中加以解决:一是在顶层设计方面,个人数据用益权的市场化开放和共建式开放中要嵌入实现飞行检查权、算法共享权等国家公有权能的技术保障措施,建立个人数据用益权取得的许可管理制度,按照安全技术能力、数据运营规模等标准分级授权许可使用,开放个人数据用益权。二是在中层机制构建中,强化数据风险防范技术设计,包括数据市场交易中的数据源安全技术审查和匿名化技术评估,构建个人数据开放平台中的数据安全技术联盟等措施。三是在微观层面,处理好个人数据与数据处理者的商业秘密、知识产权之间的关系。在数据处理活动中,逐步建立个人数据集合、组织秘密信息和数据产品之间的鉴别标准的行业共识,最终以立法形式确立个人数据与商业秘密、知识产权不同的法律保护规则,避免因为三者鉴别规则不清,导致个人数据用益权开放造成组织秘密信息泄露乃至知识产权侵权事件。
    结语
    在完成个人信息和数据安全立法后,我国对数据保护与利用有了初步的法律规范,尤其是对个人信息的权属保护与开发利用有了明确的法律规制。下一阶段,数据跨主体、跨区域开放共享和自由流动将成为数据治理的主要议程。鉴于当前数据立法对匿名化个人信息(即“个人数据”)自由漂流的默许宽容态度,个人数据如何确权,以最大程度统筹数据安全和开发利用效益,将成为破解“数据群岛”困境以及实现数据开放共享、自由流动亟须解决的重要课题。本文阐释了匿名化标准下“个人信息—个人数据”二元分型,总结了大数据时代“个人数据”体现出的自由漂流特性,并以漂流资源的定位为基点,提出了“国家受托—社会用益”的个人数据权属二元分置思路,进一步从“个人数据”的自由漂流特性蕴含的公共资源禀赋、集体人格利益和开放性财产利益等方面,重点分析了个人数据“国家受托—社会用益”的权属分置的合理性以及所有权权能和用益权实现路径。
    当然,数据跨境生成和流动也是个人数据权属配置面临的又一重大挑战。由于全球社会不存在国家之上的超主权政治实体,个人数据“国家受托—社会用益”的权属分置格局还需要厘清与跨境法律管辖、数据主权竞争的微妙关系,使得个人数据的权属分置安排能够适应并促进数据跨境共享开放和自由流动的全球数据治理趋势。对于这一问题,本文篇幅所限并未展开论述,尚需深入研究。
    转载请注明来源:中国社会科学网
    
相关文章!