宋烁:公共数据识别宜采用功能主义进路
宋烁摘要:公共数据作为构建国家数据基础制度的核心概念,其内涵和外延尚不明确。绝大多数地方立法和大多数学术观点均采用规范主义进路定义公共数据,致使公共数据概念不符合数据开放利用的客观需要,不匹配数据开放的制度目标。公共数据开放制度遵循功能主义建构逻辑,应当转变思路采用功能主义建构模式识别公共数据。首先,应限缩理解公共数据,紧密围绕开放利用的目的,将公共数据限定为可以作为开放数据供社会开发利用的数据。其次,依据公共使用价值标准阐释公共数据的公共性含义,即公共数据是指具有较高开发利用价值和公共使用性的数据。最后,由政府围绕公共数据的本质特征,通过行政规则合理建构公共数据识别制度,包括识别高价值数据的公共数据目录管理制度,识别禁止开放数据的分类分级保护利用制度,以及公共数据识别活动的外部公开和内部备案审查机制。
关键词:公共数据;数据开放;功能主义;数据基础制度;数字政府
公共数据、政务数据、政府数据曾是政策文件、法律规范和理论研究中交替出现、被混淆使用的概念。但近三年来,中央政策和地方立法中更多使用公共数据概念,呈现出以公共数据取代政务数据和政府数据的趋势。2022年12月,《中共中央 国务院关于构建数据基础制度更好发挥数据要素作用的意见》中明确使用公共数据概念作为构建数据基础制度的核心概念。由此,公共数据的含义和范围不仅直接关联公共数据的共享开放、授权使用、流通交易等制度,也与数据产权、数据安全和个人信息保护等制度密切相关。然而,目前公共数据的内涵尚不明确,外延并不清晰,阻碍公共数据基础制度的建构进程。在中央层面的立法和政策均未对何为公共数据作出具体解释的情况下,如何界定公共数据成为理论和实践共同关注的重点问题。各地方立法纷纷探索定义公共数据,学界也就采用何种标准界定公共数据展开讨论。总的来看,绝大多数地方立法给出的公共数据定义和大多数学术观点提出的公共数据界定标准大同小异,基本遵循规范主义进路阐释公共数据概念。然而,公共数据概念依托的公共数据开放制度遵循的却是功能主义进路,应否对公共数据进行规范主义界定值得反思。本文认为,应当顺应公共数据开放的制度逻辑,从功能主义视角出发解释公共数据的含义,识别公共数据的范围。
一、地方立法和学理探讨中的公共数据界定 由于中央立法缺位,各地方政府出台的公共数据相关立法中一般先对公共数据概念作出界定。本文在全面梳理相关立法后发现,各地方对公共数据的界定思路趋于一致,即在政务数据概念基础上对公共数据作出扩大解释;界定标准本同末异,即依据主体要素和行为要素划定公共数据范畴。
(一)地方立法对公共数据的扩大解释
虽然各地方立法对公共数据概念的界定不尽相同,但除《北京市公共数据管理办法》外,绝大部分是对政务数据概念作出不同程度的扩大解释,具体分为以下两类:
1.公共数据=政务数据+公共企事业单位的公共服务数据。即公共数据是在政务数据基础上,增加了公共企事业单位在履行公共服务职能过程中收集、产生的各类数据。例如,《江苏省公共数据管理办法》《四川省数据条例》《重庆市数据条例》《厦门经济特区数据条例》《武汉市公共数据资源管理办法》等地方立法均采用此种界定方式。
2.公共数据=政务数据+公共服务数据。即在上述定义的基础上扩大公共数据范围,将提供公共服务的非公共机构在履职过程中收集和产生的各类数据也纳入公共数据范围。目前,《山东省公共数据开放办法》《浙江省公共数据条例》《上海市数据条例》《广东省公共数据管理办法》《深圳经济特区数据条例》均采用此种界定方式。考虑到此种认识将私营主体产生的数据也纳入公共数据范畴,一些地方通过限定特定领域的方式,防止公共数据范围的不当扩张。例如,《上海市数据条例》和《浙江省公共数据条例》将非公共机构的公共数据限定在供水、供电、供气和公共交通四个公共服务领域,《深圳经济特区数据条例》在此基础上增加列举了教育、卫生健康、社会福利和环境保护四个公共服务领域。
以上两种定义方式的界定标准均围绕公共数据的主体要素和行为要素展开,二者对公共数据的扩大解释也均立足于公共机构的行为要素。两种定义方式的差异在于对公共数据以主体公共性还是行为公共性为主要判断标准的认识不同。第一种侧重依据主体要素的公共性标准界定公共数据,将具有公共性的主体在履行公共管理和服务职能过程中产生、获取的数据划归于公共数据。这种界定思路以公权力主体为中心,围绕公权力的行使展开,将公权力运行过程中形成的信息或数据纳入公共数据概念范畴。由此,公共数据的主体限定于公共机构,包括国家机关、法律法规授权的具有管理公共事务职能的组织和提供公共服务的公共企事业单位。
第二种则侧重依据行为要素的公共性标准定义公共数据,并据此突破了公权力主体的限定。基于私营主体广泛参与公共服务活动的现实背景,依据行为要素公共性标准,将包括私营单位在内的提供公共服务的主体,在履职过程中产生、获取的数据纳入公共数据范畴,使得公共数据主体范围由公共机构扩展至私主体。然而,如何判断数据本身是否具有公共性,是否属于公共服务范畴,是否涉及公共利益等均存在解释困境,随之成为新的难题。一些地方立法只能诉诸有限列举公共服务范围的方式,规避扩大解释公共数据致使公共数据外延不清的问题。
(二)公共数据界定标准的学理分歧
公共数据概念不清、地方立法扩大解释的现状引发学界关注,如何界定公共数据概念迅速成为一个理论研究热点问题。大多数观点主张采用“主体+行为”双要素标准定义公共数据,并通过规范解释对界定标准进行继承式改良。也有少数观点主张放弃目前主流的界定标准,提出以数据内容要素为标准确定公共数据范围的新范式。
沿用地方立法中的“主体+行为”标准界定公共数据目前是学界的主流认识。多数研究基本肯定地方立法采用的“主体+行为”双要素界定标准并对其进行学理阐释,进而就进一步明晰概念范畴提供解释路径。有学者提出“应坚持以主体与行为双要素作为判定公共数据的标准,运用公权理论阐释‘主体+行为’标准,并在此基础上增设资金来源因素作为判断标准”。该观点客观上起到了明确并限缩公共数据范围的作用。其中,以行为资金是否来源公共财政作为公共数据的判断标准,实际上仍然遵循公共数据的公共性源于公权力的逻辑。该观点主要依据数据是否基于公权力产生来认定公共数据,公共数据的范围被限定为由公法行为产生的数据,其他非公法行为产生的数据均不属于公共数据。基于此,该观点得出公共数据开放制度下所讨论的公共数据是政务类公共数据的结论。另有学者考虑到数据内容要素对公共数据概念界定的重要性,提出“主体+内容”的复合标准,在主要依据主体公共性标准的基础上增加考量数据内容是否表征公共利益作为限制条件,将不符合内容要素公共性的部分数据排除于公共数据范畴。该观点引入内容要素改良现有标准,一定程度上解决了“公法行为产生的数据并不都属于公共数据”问题。但该观点依旧深受“主体+行为”标准的影响,强调主体公共性标准在界定公共数据时的重要性和优先性。在阐释主体公共性标准时,无论是从数据主体负担公共数据处理义务的角度去证成其正当性,还是用数据主体履职资金是否源于公共财政来判断其公共性,都是运用公权理论解释公共性的结果。正因如此,该复合标准最终给出的公共数据定义基本继承了地方立法风格,其中体现数据内容公共性的元素较少。
少数研究批评依据“主体+行为”标准界定公共数据的现行做法,提出应当基于数据内容要素的公共性来定义公共数据概念。主张“内容”标准的学者对数据公共性的解读立足数据内容本身的公共性,但对公共性的理解并不相同。有学者将数据内容的公共性解释为是否关涉公共利益,认为“作为公共数据内核本质的公共性并非指数据主体的公私属性,而是指数据承载的信息内容是否关涉公共利益。”该观点并不考虑数据主体要素的公共性,“不论何种主体控制的数据,只要能促进公共管理与服务目标的实现,即具有公共性,都可以纳入公共数据的讨论范畴。”该观点为地方立法中公共数据概念的扩张提供了合理解释,但无法解决公共数据概念不确定问题。公共利益本身即为不确定法律概念,将其作为数据内容公共性的判定标准,不仅无益于明晰公共数据内涵,反而给概念界定增加操作难度和不确定性。另有学者提出“公共数据范畴的锚定应将‘应由社会公众基于公用目的而共同使用’作为核心,在界定方面采取具有弹性的标准,哪些数据应当用于公用目的而被纳入公共数据范畴仍需法律或经法律授权的政府部门结合具体情况作出进一步划定”。该观点应用公物理论阐释公共数据界定问题,以公共数据资源的“用途标准”解释数据内容的公共性,为发挥公共数据要素作用、构建公共数据开放利用制度提供了有益思路。但遗憾的是,公共数据界定问题并非该文研究重点,文章未就公共数据的认定标准及具体划定方式展开详细论述。
纵观学界关于公共数据界定标准的分歧,可以发现主流观点与绝大多数地方立法中对公共数据的界定思路基本一致。根据主体公共性和行为公共性标准划定公共数据范围深受规范主义控权思想的影响。据此界定的公共数据外延过大,与政务数据难以区分,能否实现公共数据开放目标值得反思。虽少数研究提出与主流认识不同的观点,但也未能跳出规范主义界定范式,或未能提供公共数据的具体含义和识别路径。
二、公共数据界定的规范主义进路及其反思
目前地方立法和学理上对公共数据的主流认识基本延续了我国法律对政府信息、政务信息、政府数据和政务数据的界定思路。以采用此种界定逻辑的源头——政府信息概念为例,《政府信息公开条例》将政府信息界定为“行政机关在履行职责过程中制作或者获取的,以一定形式记录、保存的信息”。此种将公权力主体在行使公权力过程中形成的信息纳入概念范畴的界定思路,是规范主义控权模式下的产物。规范主义是西方传统主流公法思想的一种基本风格,信奉分权理想并致力于使政府服从法律,通过法律的裁判和控制功能约束政府权力。规范主义风格注重提炼抽象概念的一般含义并在此之上构建具体规则。受其影响,法律概念的体系化秩序构建成为行政法学的核心目标。政府信息作为《政府信息公开条例》构建政府信息公开制度的核心基础概念,其界定逻辑即遵循了规范主义控权模式。为制约公权力的行使,让权力在阳光下运行,立法在定义政府信息概念时遵循行政权的运行逻辑,确立“主体+行为”要素的判定标准。如此界定政府信息概念能够将其与信息公开行为相对应,进而关联法律后果。由此,围绕法律概念建立的法律规则即可通过立法和司法控制保障其规范性,法律概念的体系化秩序得以构建。《政府信息公开条例》即在政府信息概念基础上形成公开原则、公开范围、公开方式等一系列法律规则,通过课以公权力主体信息公开法定义务来实现立法控制。同时,《政府信息公开条例》还赋予了公民个人政府信息公开请求权,在行政机关拒绝履行公开义务时,公民可以通过诉讼获得司法救济,从而实现司法控制。除了强调法治原则运作之下有限政府的必要性,规范主义控权模式在处理法律和政府之间的关系上,核心价值还强调个人自由的首要性。控制政府权力是为了保护公民权利。定义政府信息的逻辑起点就是从保护公民知情权出发的,预设行政权力的行使会侵犯公民的知情权,因而将公权力运行过程中形成的信息均纳入规范范畴,通过法律控制手段实现对公民权利的保护以及法治对行政权力的控制。可以说,规范主义风格下定义的政府信息,天然具备权利保护视角。政府信息概念与特定类型的政府信息公开行为相连接,这种“类型化行为导向就被有机地与权利保护视角相连接”。可见,规范主义控权模式下的政府信息概念,服务于政府信息公开制度保障公民知情权、监督行政权运行的制度目标,主要满足形式主义法治的依法行政要求。
公共数据概念的法律表达与政府信息可谓一脉相承。纵观地方立法中对公共数据的定义,虽然对公共数据的认识不尽相同,但基本沿袭规范主义界定路径,依据“主体+行为”要素划定公共数据范畴。公共数据的公共性藉由主体要素和行为要素的公共性判断,即享有或行使公权力的主体在履行公共管理和服务职责过程中产生或收集的数据属于公共数据。对公共数据公共性的这一解读方式深受规范主义风格影响,在构建公共数据具体规则时也延续了控权思维模式。有观点将概念界定与特定行为相关联,认为一旦被定义为公共数据,公共机构即负有向社会提供的义务。有观点进一步提出要在公共数据开放利用制度中构造“权利—权力”关系结构,引入数据利用主体的公共数据公平利用权作为权利基础,对应数据开放主体的公共数据开放管理职权,二者共同构成公共数据开放的规范性基础。可见,公共数据的规范主义界定路径使其在规则建构时自然地、本能地选择法律控制模式,承接政府信息概念的规范建构路径。然而,公共数据开放与政府信息公开具有本质区别,法律控制模式无法适应公共数据开放对实质主义法治的良好行政追求。
沿用规范主义控权进路,依据主体和行为要素定义公共数据概念,可能引发以下问题:
首先,界定范围过大不适宜公共数据的开放利用。规范主义界定的公共数据范围无法直接满足公共数据开放利用的需要。公共机构在履行公共管理和服务职能过程中形成的信息或数据并非都能用于开发利用。也就是说,公共机构在履行公共职能过程中产生的数据并不都属于公共数据。例如,有些数据关涉国家安全或社会公共利益,有些数据包含个人敏感信息,有些数据涉及企业商业秘密,这些数据因可能危害国家利益、社会利益和他人合法权益而不能被开放利用。规范主义下定义的公共数据将不能开放利用的数据也纳入进来,导致公共数据概念与数据开放利用范围不能直接对应。地方立法为解决这一问题,对公共数据范围进行二次识别,即根据数据的开放属性进一步限缩可供开放利用的公共数据范围。具体而言,地方立法普遍将公共数据进一步细分为无条件开放类、有条件开放类和禁止开放类三类,其中被划归无条件开放类和有条件开放类的公共数据才对应公共数据开放意义上可供开发利用的公共数据范围。地方这种先扩大再限缩的界定方式给公共数据的识别增加了难度,为公共数据的开放利用增设了障碍。
其次,违背公共数据开放的制度目标。采用规范主义风格界定的公共数据概念与公共数据治理逻辑不符。公共数据开放制度是我国利用公共数据发展数字经济、建设数字政府的基础制度。与政府信息公开不同,在公共数据开放中,公共数据并不以公开为原则、不公开为例外,而是遵循需求导向原则,根据政府治理目标需求和用户应用偏好采用目录管理的动态调整方式划定数据开放范围。这种差异源于数据开放与信息公开在制度基础和目标上存在本质区别,公共数据开放不以公民知情权为基础建立,不以增强政府透明度、实现民主监督问责为目标,其由大数据技术驱动而兴起,以促进数据开放利用,实现繁荣经济、提升治理效能为目标。因此,公共数据开放制度的核心指向是利用,而非公开。沿用规范主义定义公共数据,将公共机构在履行公共管理或服务职能过程中产生的各类数据均纳入公共数据范畴,与公共数据开放的制度目标不匹配,并未对应开发利用公共数据的核心要义。公共数据开放语境下的公共数据,指向适宜再利用的高价值、高需求数据,并非全部公共属性数据。规范主义的公共数据概念未能有效回应公共数据开放利用的目标需求。
再次,容易与政务数据概念混淆,导致相关制度安排上出现误用。最初,地方立法对公共数据的定义趋同于政务数据。首部公共数据开放专门立法——《上海市公共数据开放暂行办法》将公共数据界定为各级行政机关以及履行公共管理和服务职能的事业单位在依法履职过程中,采集和产生的各类数据资源。首部省域公共数据开放专门立法——《浙江省公共数据开放与安全管理暂行办法》也对公共数据作出类似定义。近两年来,各地出台的数据相关立法中呈现扩大解释公共数据趋势,将公共数据理解为包含政务数据的大概念。目前对公共数据和政务数据或全同关系或包含关系的理解造成了概念的混淆,进而导致二者制度安排上的混乱。例如,《上海市公共数据和一网通办管理办法》和《浙江省公共数据和电子政务管理办法》(已失效)使用公共数据概念推进电子政务建设,《福建省政务数据管理办法》和《山西省政务数据资产管理试行办法》在政务数据概念下讨论资产化管理,更多地方更是一并规定政务数据的共享和开放问题。地方立法中因混淆公共数据和政务数据产生的相应制度安排误用现象时常发生。
三、公共数据开放制度遵循功能主义进路
功能主义是在规范主义法律控制模式无法有效实现现代福利国家目标背景下产生的主宰公法思想的另一基本风格。与规范主义信奉法律自治不同,功能主义将法律视为政制机器的一部分工具,用以实现与能动型国家紧密相关的目的,政府则被视为一种促进进步的进化式变迁机构。功能主义思想将公法的关注重点从控制和权利转向功能和效率。受此影响,行政法学的研究视角也发生改变,行政法被看作一种社会规制手段,关注重点从此前的公民权利保护转向实现法律目标。数字时代的到来更加强化了功能主义对行政法学发展变迁的引领作用。政府运行中大数据、云计算、人工智能等数字技术的应用“不限于工具性地提供信息化技术支持以提高行政效率,更重要的是通过组织变革和运行机制创新,大幅度地改变公共行政的体制和制度”。公共数据开放就是由数字技术催生、以实现多元公共福利为目标的新兴制度,其运行逻辑体现浓郁的功能主义色彩。
在我国,公共数据开放的目标定位是通过政策调整方式逐步明确的,经历了从模糊到清晰、从抽象到具体的过程。2015年,国务院印发《促进大数据发展行动纲要》,在中央政策层面首次引入“政府数据开放共享”制度作为实施国家大数据战略的重要举措。其中,对制度目标的表述较为抽象,初步定位为“推动资源整合,提升治理能力”。受较早推行数据开放的西方国家设立政治、经济、社会多元制度目标的影响,在探索初期,我国曾出现延续政府信息公开的规范主义进路构建公共数据开放制度的做法。在中央,国务院办公厅发布的《2015年政府信息公开工作要点》中,政府数据开放被列为完善政府信息主动公开的补充机制。在地方,贵州省作为我国率先推行数据开放的地方,2016年发布《贵州省大数据发展应用促进条例》中规定实行公共数据开放负面清单制度,2017年出台《贵阳市政府数据共享开放条例》在开放范围、开放方式、法律责任等内容规范上模仿政府信息公开条例。然而,这种规范主义进路随着后续政策的出台被否定。“政府数据开放离开了权利保障机制这一传统行政法治建构轨道,走向寻求更优数字治理效果的功能主义制度建构思路。”2018年,中央网信办、发改委、工信部联合印发《公共信息资源开放试点工作方案》,进一步确立公共数据开放的目标为促进经济转型升级、推进国家治理体系和治理能力现代化建设,并围绕制度目标、立足现存问题就公共数据开放工作进行具体试点部署。随后,2019年上海市出台首部数据开放专门立法《上海市公共数据开放暂行办法》,建立起显著区别于信息公开的规范主义进路的制度架构。同年,《政府信息公开条例》迎来首次修改但全文未涉及数据开放内容,放弃在政府信息公开框架下推行数据开放的路径。此后,越来越多地方延续上海市的立法思路出台数据开放地方规范,贵州等地也积极调整原有思路修改立法,在公共数据开放制度建构上放弃规范主义路径已达成共识。
2020年以来,在中央政策引领下,公共数据开放的功能主义建构思路越发清晰明确。中共中央 国务院印发《关于构建更加完善的要素市场化配置体制机制的意见》,将数据纳入生产要素范围,政府数据开放共享被列为加快培育数据要素市场的制度依托。由此,公共数据开放的制度目标逐渐聚焦促进数字经济发展。2021年,《中华人民共和国国民经济和社会发展第十四个五年规划和2035年远景目标纲要》(以下简称“十四五”规划)明确将公共数据开放列为数字政府建设的重要内容,并阐明公共数据开放的公共服务性质以及供社会开发利用的制度目的。为回应既往公共数据开放实践在数据供给和开放利用上的不足,“十四五”规划还创新性提出开展政府数据授权运营,目标直指挖掘利用。在《“十四五”数字经济发展规划》中,公共数据开放在发挥数据要素作用上的功能被进一步明确,即作为强化高质量数据要素供给机制和创新数据要素开发利用机制。2022年,中共中央 国务院印发《关于构建数据基础制度更好发挥数据要素作用的意见》,就更好发挥公共数据生产要素作用作出建立公共数据产权和确权授权基础制度的指示。至此,我国根据国家数字化发展战略布局,通过政策逐步明晰、确定了公共数据开放的制度定位与目标。公共数据开放作为体现数字政府建设水平的重要制度,承担助推数字经济发展的重要功能。在政策指导下,各地方围绕发挥公共数据生产要素作用的目标自行探索公共数据开放的制度建构,为日后国家层面统一规范的出台积累经验。可以说,我国的公共数据开放制度是政府主导、目标导向的,通过政策指导和地方试点的灵活方式促进制度目标的实现,整个过程都离不开政府发挥积极作用,充分体现着功能主义的进化式变迁理想。
在域外,公共数据开放也主要采用通过行政规则推进目标实现的功能主义进路。大多数国家和地区践行公共数据开放行动一般通过制定国家数据战略、开放数据行动计划等一系列政策推行。仅有个别国家将开放数据的政策要求转化为法律规定,如美国2018年底通过《开放政府数据法》(OPEN Government Data Act)。这部法律主要内容围绕机构的数据开放职责展开,包括开放数据应满足的数据标准,各机构制定并维护数据清单的要求,联邦机构及首席数据官的职责等。该法更表现为一种框架性立法,仅原则性确立数据开放的法定要求和规制手段,各机构数据开放职责的具体执行还有赖于行政权力的运行规则落实。根据《开放政府数据法》的要求,各机构应根据自身实际情况制定与其目标相适应的开放数据计划,检验各机构的履职情况是通过要求机构提交与之相关的机构分析能力评估报告的机制进行。OMB作为主要负责具体执行数据开放工作的部门,通过定期发布机构在满足数据开放法定要求方面的报告以及发布最佳做法指南的方式,引导、促进各机构落实开放数据计划。因此,即便是《开放政府数据法》已经出台,各政府机构的开放数据行动还主要依靠行政规则推行。2019年6月,OMB又发布了《联邦数据战略行动计划》(federal data strategy),为全面释放数据价值确立十项数据原则和四十项最佳实践指导,提供了一个如何利用联邦数据的长期行动框架。该框架还要求各机构定期实施开放数据短期行动。虽然美国出台了专门立法,但《开放政府数据法》与传统的规范主义控权模式不同,它并不是命令—控制型立法,没有赋予公民权利与政府权力抗衡,没有规定行政机关不履行法定职责的法律后果,更未涉及通过法律裁判制约行政权的司法控制面向。该法采用要求各机构提交评估报告的非强制方式促进机构履职,设置的审查条件也重在评估机构履职的有效性,而非合法性。可见,出台公共数据开放专门立法的国家也遵循功能主义的运行逻辑。
综上可见,无论是我国还是域外,在建构公共数据开放制度时,均未选择传统的法律控制路径,而是走向了功能主义进路。公共数据开放并不致力于使政府严格受到法律制约,而是追求高效实现行政任务和目标。公共数据开放在制度生成和推进过程中,十分依赖政府的能动作用,主要通过行政规则推行落实制度目标。
四、功能主义进路下的公共数据识别
公共数据作为公共数据开放制度的核心概念,其界定也应遵循功能主义的逻辑进路。如何界定公共数据概念,应当根据公共数据开放的制度目标确定。公共数据定义要立足于公共数据开放的制度功能,服务于制度目标的实现。
(一)公共数据概念的限缩理解
如上文所述,目前绝大多数地方立法遵循规范主义进路,在政务数据概念基础上扩张解释公共数据概念。这种广义界定将公共数据置于政务数据、政府数据的上位概念,直接导致公共数据边界不清、概念泛化。由公权力主体在公法活动中产生、收集的政府数据、政务数据,并不都适宜作为开放数据供公众开发利用。例如,行政机关在实施行政监管活动中获取的自然人、法人数据,因可能涉及个人隐私、商业秘密不宜向社会开放。广义界定公共数据使某一类数据即便落入公共数据范畴,也不当然作为公共数据向社会开放,将导致公共数据概念不能直接对应开放数据的判断需求。哪些数据属于可供开放利用的公共数据范围,还需要对其进行二次识别才能确定。可见,对公共数据进行扩张解释无法有效回应公共数据开放利用之目标,应当转变现有的界定思路,紧密围绕公共数据开放利用目的对公共数据概念进行功能主义限缩解释。公共数据作为公共数据开放制度的核心基础概念,其概念界定应服务于公共数据开放的制度功能。即公共数据概念应当直接释明哪些数据可以向社会开放、供公众利用,其界定目的直指公共数据再利用。据此,只有可以作为开放数据供社会开发利用的、适用于公共数据开放制度的数据,才属于公共数据。在此意义上,公共数据的概念范畴不仅不包含政府数据、政务数据,其外延还应窄于二者。(见下图)
图1 公共数据与政务数据、政府数据的应然关系
对公共数据概念进行功能主义限缩解释,在域外也有实例支持。作为open government data的发起国美国,在其出台《开放政府数据法》中,将公共数据集合(public data asset)定义为:“由联邦政府维护的数据集合,其(A)可向公众公布;(B)已以开放格式向公众公布,并可通过检索Data.gov及其任何后继者可发现;(C)是世界公共领域的一部分,必要时在开放许可下公布。”可见,美国也没有广义界定公共数据,而只是将可以(或已经)向公众开放的数据集合划归公共数据范畴。这体现的就是功能主义的界定思路,从公共数据开放利用的实际目的出发,定义概念并在此基础上建构相应的开发利用制度。2021年,经合组织发布了首个国际层面的数据利用指南——《关于加强数据访问与共享的建议》(Recommendation of the Council on Enhancing Access to and Sharing of Data),其中对不同类别数据概念的界定也直接对应数据利用规则。例如,“开放数据安排(Open data arrangements)”是指非歧视性的数据访问和共享安排,其中数据是机器可读的,可以免费访问和共享,任何人都可以出于任何目的使用,最多遵守保持完整性、出处、归属和公开性的要求;“有条件的数据访问和共享安排(Conditioned data access and sharing arrangements)”是指允许数据访问和分享的数据访问与共享安排,但条件可能包括对授权访问数据的用户的限制(歧视性安排)、数据使用条件(包括数据可用于的目的)、以及对授予数据访问权限的数据访问控制机制的要求。依据功能主义进路定义公共数据概念,无需进行二次识别即可直接对应公共数据开放利用需求并进行相应利用机制建构,充分有效回应公共数据开放的制度目标。
(二)公共性内涵:公共使用价值
从公共数据开放的制度目标出发,公共数据的公共性含义应理解为公共使用价值。我国公共数据开放的制度目标经历了从模糊到清晰、从抽象到具体的过程。自数据成为新型生产要素以来,公共数据开放的制度目标已明确聚焦促进数字经济发展,为其供给高质量数据要素并提供创新性开发利用机制。可见,发挥公共数据的生产要素作用、促进公共数据开发利用从而创造更多经济价值是公共数据开放制度的核心目标。据此,定义公共数据应当紧密围绕“用”这一制度宗旨进行,根据数据本身“用”的价值来界定公共数据。公共数据开放的制度目标决定了公共数据的公共性并不源于其产生行为具备的公法要素,而是基于数据本身具有的公共使用价值。因此,公共数据指的是具有公共使用价值的数据。目前,已有地方立法引用公共使用价值作为公共数据概念的界定标准。如《江苏省公共数据管理办法》第2条规定:“公共数据是指本省各级行政机关、法律法规授权的具有管理公共事务职能的组织、公共企事业单位为履行法定职责、提供公共服务收集、产生的,以电子或者其他方式对具有公共使用价值的信息的记录。”也有地方径直采用公共使用价值标准替代“主体+行为”标准厘定公共数据内涵。如《北京市公共数据管理办法》第2条规定:“本办法所称公共数据,是指具有公共使用价值的,不涉及国家秘密、商业秘密和个人隐私的,依托计算机信息系统记录和保存的各类数据。”
凡是具有公共使用价值的数据,都可划归公共数据范畴。一方面,公共机构在实施公法行为时产生、收集的数据,并非均具有公共使用价值,不都属于公共数据。在此意义上,公共数据并不包含政务数据,只有具有公共使用价值的政务数据属于公共数据,公共数据的外延小于政务数据。另一方面,企业数据、个人数据与公共数据也非泾渭分明。私营企业数据、个人数据也可能具有公共使用价值,因而有可能属于公共数据。公共数据的外延也在此意义上得到扩展。突破数据主体的公共属性定义公共数据可能会遭致规范主义质疑。但实际上,公共数据开放的制度建构已为私主体参与预留了制度空间。我国在设计政府数据开放制度之初,在《促进大数据发展行动纲要》中即明确提出要通过政务数据公开共享,引导企业、行业协会、科研机构、社会组织等主动采集并开放数据。地方层面出台的《上海市公共数据开放暂行办法》《浙江省公共数据开放与安全管理暂行办法》等地方立法也鼓励私主体开放自有数据,以形成多元化的数据开放格局。2019年欧盟关于《开放数据和公共部门信息重用的指令》也明确提出鼓励成员国将本指令的要求适用于公共企业和私营企业。同样,个人数据转化为公共数据也具有制度支撑。个人数据(信息)保护立法的目的,并非禁止个人数据处理行为,而是通过规范个人数据处理行为达到保护个人数据权益和促进个人数据合理利用的双重目的。公共数据开放中的数据处理者,即在满足个人数据保护要求(法定或意定)、履行个人数据保护义务下尽可能寻求开发利用个人数据的最大限度,由此具有公共使用价值的个人数据也完成了向公共数据的转化。政府、企业、个人持有的具有公共使用价值的大数据的汇聚融合,更有利于提升公共数据的要素价值,推动公共数据开放制度目标的实现。公共数据的公共使用价值,具体可结合以下两个方面理解:
1.具有较高开发利用价值
公共使用价值要求公共数据应当具备较高的开发利用价值,这也是由公共数据开放的制度目标所决定的。政府在实行公共数据开放活动时都引入了量入为出的经济理念,追求以最小的成本获得最大的收益。为此,为提高制度目标的实现概率、追求价值创造最大化,各国一致优先开放高价值数据。《开放数据宪章》(G8 Open Data Charter)倡导成员国释放高价值数据,列举企业、犯罪与司法、地球观测、教育、能源与环境、财务和合同、地理空间、全球发展、政府问责与民主、卫生、科学研究、统计、社会流动和福利、运输和基础设施14个对改善民主制度和鼓励数据创新再利用具有高价值的领域数据。欧盟《开放数据和公共部门信息重用的指令》(the Directive on open data and the re-use of public sector information)也采用了高价值标准,并提供了高价值数据集“主题类别”,包括邮政编码、地理空间数据(例如国家和地方地图)、地球观测和环境(例如卫星图像、气象数据、统计数据、移动数据和业务登记(公司登记、公司所有权),这些数据被认为对经济和社会具有巨大价值。我国也同样对公共数据开放提出优先开放高价值数据的要求。“十四五”规划就扩大基础公共信息数据安全有序开放作出部署,明确提出优先推动企业登记监管、卫生、交通、气象等高价值数据集向社会开放。可见,无论是域外还是我国,在确定哪些公共数据优先开放供社会挖掘利用时,都采用了高价值标准。这反映了公共数据开放制度对公共数据的基本要求,也恰恰印证了具有较高的使用价值是公共数据的本质特征。
2.具有公共使用性
公共数据的公共使用价值还要求其可以向社会提供、供公众开发利用。如果说具有较高开发利用价值是对公共数据的正向解释,具有公共使用性则是对公共数据的反向限定。一些数据虽然具有较高的开发利用价值,但如果将其开放利用可能会侵害合法的公共利益或私人利益,则不可供公众开发利用,即不属于公共数据。公共数据开放制度旨在实现的公共目标,不能以牺牲其他公共利益或个人权益为代价。一般而言,国家安全、公共安全、国家秘密、商业秘密、个人隐私、第三方知识产权等因素会被列为数据豁免开放的考量因素。若具有较高开发利用价值的数据可能严重危及上述任一方面,则禁止供公众开放使用,此类数据也因此不划归公共数据范畴。例如,美国《开放政府数据法》将不能向公众提供的数据集合明确归为“非公共数据集合(nonpublic data asset)”,具体包括两类:(A)因隐私、安全、保密、监管或法律规定的其他原因而无法向公众提供的数据集合;(B)承包商提供的受合同、许可证、专利、商标、版权、保密、法规其他限制保护的数据。在我国,涉及安全、秘密、隐私等因素也被明确列为公共数据禁止开放的法定理由。但不同的是,地方立法并未将此类数据明确排除公共数据范畴,而是将其列为不可开放类公共数据。例如,最近发布的《深圳市公共数据开放管理办法(征求意见稿)》第12条规定:“符合以下情形之一的公共数据列为不予开放类:(一)依法确定为国家秘密的;(二)开放后可能危及国家安全、公共安全、经济安全、社会稳定的;(三)涉及商业秘密、个人隐私的;(四)法律、法规规定不得开放的。”从功能主义视角出发,不能开放的公共数据丧失了其作为公共数据具有开发利用价值、可供开发利用的基本功能,无法实现公共数据开放的制度目标。将禁止开放类公共数据划归公共数据范畴不具有实用意义,反而造成公共数据概念与开放利用机制的不对应,为公共数据开放制度设计徒增马齿。将不可供公众开放利用的数据剔除公共数据概念,有利于公共数据的识别、分类与利用。经合组织发布的《关于加强数据访问与共享的建议》(Recommendation of the Council on Enhancing Access to and Sharing of Data)旨在为政府如何在保护个人和组织权利并考虑其他合法利益和目标的同时最大限度提高数据访问与共享效益提供一般原则和政策指导。其中即明确将数据分为非歧视的数据访问与共享和有条件的数据访问与共享两类,在此基础上安排不同的使用规则。而绝对禁止开放的数据并不在讨论之列。
(三)公共数据识别的基本制度框架
“公共数据是具有公共使用价值的数据”是对公共数据概念的描述性表达,而非规范性界定。也就是说,公共使用价值只是对公共数据本质特征的描述,并不具有法释义作用。藉由公共使用价值无法对公共数据作出精确界定,更不具有区分功能。这也是采用公共使用价值标准定义公共数据易遭到质疑之处。有观点指出,“用途标准无法为公共数据提供清晰明确的范畴,还会导致公共数据与私人数据界限丧失。”然而,功能主义进路下的公共数据概念主要是为了形成问题,作为启发性工具而发挥作用。有学者立足数字政府建设与数字经济发展对公共数据的功能性需求,得出“公共数据不是被事先界定的”这一判断。可以说,功能主义视角下的公共数据概念,仅仅描绘出公共数据的应然形象,用以指导我们去发现实然的公共数据。而实然的公共数据还需要依据合理建构的识别机制具体确定。
1.通过行政规则建立公共数据识别制度
公共数据的识别机制主要由政府利用法律工具自我建构而成。公共数据开放是政府在数字时代向公众提供的新型公共服务,是政府履行公共服务职能的具体体现。与政府履行管理职能时需要严格依据法律授权进行不同,服务职能的履行给予政府更多裁量空间,要求政府发挥能动性积极促进行政任务的最优完成。通过法律明确授权以约束行政权力运行的规范主义进路无法适用于需要政府积极主动作为提供公共服务的领域。政府承担服务职能的依据往往只是“行政任务或行政权限相关法规之规定”,缺乏法律的明确授权及指引。在此情况下规范主义模式就丧失了实施有效法律控制的前提和基础。相反,功能主义不依赖法律控制而追求行政自治,主张通过行政内部自我规制达成任务目标的建构思路契合政府履行服务职能的现实需要。“被授予治理任务的政府机构和工作人员承担通过使用权力组织公共服务的义务,同时确保和控制权力的发展。”在功能主义进路下,政府自行建构的内部治理结构的有效性决定着行政任务的完成度。
制定行政规则是政府实现自我规制的有效法律工具。政府通过行政规则具体落实行政任务,同时也能够实现对裁量权的自我限定。这不同于行政裁量基准,虽然行政裁量基准在法律规定不足的情况下能够对规制裁量权的行使发挥积极作用,但其沿袭着概念法学的基本路径,基本思路是对法律规范进行细化,并不注重发挥行政的主观能动性。而制定行政规则是政府为充分发挥能动性、有效完成行政任务采用的自我规制的方式。如上文所述,在世界范围内,公共数据开放实践主要依靠行政规则推进。政府在行政规则中确立了其在公共数据识别问题上的主导地位,哪些数据应被划归公共数据范畴,依据何种标准以及遵循哪些程序确定,主要依靠行政专业优势由政府负责确定。行政规则中要建构起识别公共数据范围的基本制度框架,解决如何确定公共数据的公共使用价值问题。公共数据使用价值的确定包括正向的高价值数据识别和反向的禁止开放数据排除两方面。
2.建立公共数据目录管理制度识别高价值数据
高价值数据主要由政府依托公共数据目录管理制度具体识别。经合组织在其发布的首个有关公共数据开放的实证分析报告中阐明,为了确保公共数据开放真正创造价值,为公众识别高价值数据是政府面临的最重要任务之一。政府一般会根据本国开放公共数据的行政目标,确定若干优先开放的高价值数据领域,作为识别高价值数据的一般性指导。例如,英国的开放数据政策更加强调实现提高政府透明度、实现有效问责的政治目标,因而国家选举数据和预算数据等也被英国列为高价值数据向社会开放。而我国的公共数据开放更聚焦赋能实体经济、提升治理能力的经济社会目标,所以“十四五”规划中将企业登记监管、卫生、交通、气象等数据列为高价值数据。可见,政府主要依据自身的任务目标确定高价值数据范畴,符合相应需求的数据即被视为具有较高开发利用价值的数据。除了中央层面对高价值数据领域的统一指导外,各开放主体还可根据自身实际情况和属地发展需求,划定公共数据开放重点进一步识别公共数据范围。例如,《浙江省公共数据开放与安全管理暂行办法》规定,公共数据开放主体应当根据本地区经济社会发展情况,重点和优先开放与公共安全、公共卫生、城市治理、社会治理、民生保障等密切相关的数据;自然资源、生态环境、交通出行、气象等数据;与数字经济发展密切相关的行政许可、企业公共信用信息等。
在若干高价值数据领域的原则性指引下,公共数据范围经由目录管理制度具体确定。公共数据目录管理制度包括公共数据编制主体、编制依据、编制程序、内容标准、目录调整等方面内容。其中,目录调整是公共数据目录管理的核心内容。公共数据的范围处于不断调整之中,采用目录管理能够满足其应需求变化灵活调整的需要。政府根据行政目标的完成情况需要对公共数据范围进行动态调整,公众对公共数据的利用需求也可以借由目录调整机制予以满足。虽然高价值数据主要由政府负责识别,但考虑到公共数据开放的直接目的指向促进公众开发利用,公共数据的识别不能忽略公众一方的现实需求,在制度设计上要保证公众的参与权并增强政府的回应性。为此,各国政府也将公众需求作为识别高价值数据的标准,并设置相应的回应公众需求的目录调整方式。例如,美国在《开放政策——管理作为资产的信息》(open data policy-managing information as an asset)备忘录中,将客户高需求确定为高价值数据的判断标准,并提出了相应的确定方法,通过数据开放网站建立与客户接触的流程,在此基础上结合必要手段确定数据集发布的优先级。英国在《开放数据白皮书——释放数据潜能》(Open Data White Paper Unleashing the Potential)中也将用户需求作为确定开放范围的标准,并在政府与个体开发商、中小企业、公民、学者和大公司等主要数据用户之间建立对话参与机制。英国专门成立开放数据用户组(ODUG)作为回应用户需求的组织保障,开放数据用户组负责与用户开展对话从而确定公共数据的范围及其优先级,并就优先开放范围向数据战略委员会(DSB)提供建议。英国政府还承诺开放数据用户组提供的建议将优先作为开放数据发布。我国地方立法中也普遍将社会需求列为公共数据的一项识别标准,在公共数据的目录编制和获取环节设置公众参与程序,但在目录调整机制上对公众需求的回应性还有待提高。例如,《浙江省公共数据条例》第29条将社会迫切需要作为公共数据主管部门确定重点开放清单的标准之一,但对了解及回应公众需求的程序设置仅限于“应当听取相关行业组织、企业、专家和社会公众的意见”。公共数据目录调整机制在设计上应当注重回应来自公众一方的现实需求,这不仅是实现公共数据开放目标的内在需求,也是弥补行政自治合法性先天不足的有效方式。
3.建立分类分级保护利用制度识别禁止开放数据
禁止公共利用的公共数据排除范围由政府基于区分风险等级、衡量成本收益的分类分级保护利用制度确定。一方面,公共数据利用的安全性问题是禁止公共数据开放的主要顾虑。虽然安全、秘密、隐私等因素普遍被列为公共数据禁止开放的法定事由,但涉及以上因素的高价值数据并非绝对豁免公共利用。开发利用此类高价值数据可能造成的侵害风险大小并不相同,不能将其一概而论全部列入排除范围。对公共数据豁免开放事由的僵化理解将不当扩大禁止开放范围,从而阻碍公共数据开发利用,违背数据开放制度目标。为保障数据安全,《数据安全法》要求建立数据分类分级保护制度对数据实行分类分级保护。在公共数据开放中,公共数据的排除范围也依赖数据分类分级保护制度确定。政府依据数据开放利用对国家利益、公共利益或私主体利益的危害程度区分不同风险等级,进而进行分类适用不同程度的数据保护和利用措施。其中,位列较高风险等级的高价值数据,即被划归禁止开放类数据,对其实施严格保护禁止开发利用。而具有危害公益或私益风险但风险等级较低,可归入有条件开放类,对其附保护条件进行开发利用。例如,浙江省地方标准《数字化改革公共数据分类分级指南》要求按照公共数据遭篡改、破坏、泄露或非法利用后,可能带来的潜在影响的范围和程度进行安全分级,并要求公共数据的分级与公共数据的范围和开放类型直接相关。同时,数据分类分级保护利用制度本身也具有开放性,能够通过重新分类分级动态调整公共数据的禁止开放范围,在数据保护和开发利用之间寻求价值最大化。例如,根据《上海市公共数据开放分级分类指南(试行)》的规定,对于非开放类数据,经脱敏、匿名等处理后符合开放要求的,可将处理后的数据重新进行分级,纳入无条件开放或有条件开放类后开放。
另一方面,公共数据的开放利用成本也是限制其开放利用的考量因素。成本收益衡量不像数据安全问题构成公共数据开放利用的绝对豁免条件,但却是评价公共数据开放制度有效性的关键指标。目前,开放数据利用成效不佳已成为全球推行公共数据开放普遍面临的主要问题,公共数据开放的成本与效益严重不匹配导致公共数据开放的持续推进受到阻碍。遵循功能主义逻辑建构而成的公共数据开放制度天然追求制度的有效性,将成本和收益衡量贯穿公共数据开放利用全过程。在公共数据的公共使用价值识别上,成本效益理念不仅体现在高价值标准的确立,还显现于公共使用性的认定。例如,美国《开放政府数据法》将“数据转换为公众可理解和使用的方式给公众带来的成本和收益”明确列为各机构负责人在决定是否开放某一特定数据集合时依据的标准之一。具体而言,某个数据集被认定具有较高开发利用价值,且开发利用此数据集的安全风险等级较低,并不必然被列入公共数据范围供社会开发利用。应否列入公共数据范围,亦或纳入公共数据排除范围,还需衡量该数据集的开放成本和预期收益。如果该数据集转化为公共数据供公众开发利用将使政府付出高昂成本,与其预期可创造的收益不成比例,此时该数据集将会因成本收益考量被归入禁止开放类别。而目前我国地方立法中,普遍未将成本收益分析列为公共数据禁止开放的衡量标准。在未来制定统一的行政规则时,应考虑将符合公共数据开放制度目标的成本效益原则上升为公共数据开放的一项基本原则,用以指导公共数据开放利用的全生命周期。在公共数据的公共使用性认定上,成本效益原则不仅能够指导划定禁止开放类数据范围,还适用于调整有条件开放类和无条件开放类数据范围。对于安全风险等级低可归入无条件开放类的公共数据,经成本收益衡量可划归有条件开放类,从而节省公共数据开放成本,提升数据开放制度效能。
4.建立外部公开和内部备案审查机制监督公共数据识别
政府承担向社会提供公共数据的服务职能,具体开放哪些公共数据属于其职权范围,应当允许政府自行建立公共数据识别机制。但政府在自我建构中享有较大的行政裁量权,具有选择作为或不作为、如何作为的权力。加之在行政自治中,立法控制减弱、司法救济缺位,都使得信任政府自治的功能主义难免遭到质疑。但正如戴维斯所言,我们“不要反对与政府所从事的任务相称的裁量权,要反对超出这些任务的裁量权。不要反对被适当限定、建构和制约的裁量权,要反对未被适当限定、建构和制约的裁量权”。为防止行政的恣意与专断,政府也应建立相应的监督救济机制对行政权力进行限定和制约,通过政府自我合理建构的规则体系来保障行政任务的圆满完成。
首先,建立公开机制可以实现对公共数据识别的外部监督。由于公共数据开放遵循功能主义进路,打破了规范主义在行为和结果上建立起来的直接关联,立法控制和司法救济无法经由法律后果发挥监督功能。功能主义表现为“对硬性法律后果的关注较少,更强调实现特定任务目标的软性评价标准”。具体到公共数据识别问题,这些软性评价标准表现为对政府建立的包括开放数据计划、开放数据目录、开放数据标准、分类分级标准、目录管理规则等规则体系在公共数据识别上的有效性评价。而监督公共数据开放服务职能的履行,不是追究政府法律责任满足行政合法性的底线要求,而是帮助政府建构起一种公正、有效的治理结构促进行政目标的最优实现。相较于以法律控制为基础的监督机制,公开机制在监督政府积极职能履行方面更具优势。要求政府将其制定的开放数据计划、开放数据目录、开放数据标准、分类分级标准、目录管理规则等规制工具向社会公开,不仅能够起到约束政府自我规制活动的作用,还能通过政府和公众之间建立的沟通机制改良治理结构。例如,在编制公共数据开放目录时,设置回应公众需求的参与机制,起到了监督并优化政府识别高价值数据行为的效果。因此,公开并不是终点,政府还要在公开基础上进一步建立公众参与机制,如申请、投诉机制等,落实对公共数据识别的外部监督。
其次,政府还应建立备案审查机制对公共数据识别进行内部监督。戴维斯曾感叹:“或许对裁量行为最重要的制约就是上级对下级的监督。”备案审查机制作为极具中国特色的规范性文件监督制度,在防止裁量行为恣意、规范裁量权行使上也具有适用性。同理,在识别公共数据这一行政裁量领域,行政系统内部建构的监督机制发挥着举足轻重的作用。美国的《开放政府数据法》即基于行政系统内部报告机制形成对各机构履行公共数据开放职责的内部制约。具体而言,该法详细列举了各机构的数据开放职责,但未选择设置相应的法律责任,而是通过提交审查报告的方式评估各机构的履职能力。上级主管部门也通过发布报告和建议的方式给出开放数据的最佳做法,用以指导下级部门开展数据开放行动。这种不具有外部强制性的、注重发挥行政系统自我调节功能的内部监督思路更符合功能主义的建构逻辑。我国地方立法中尚未建立公共数据开放内部监督机制。未来制定公共数据开放行政法规时,可以建立备案审查机制对数据开放活动实行内部监督。具体到公共数据识别问题,可以要求各公共数据开放目录编制主体在公开目录后的一定期限向上级公共数据主管部门备案,并就开放目录编制的依据、内容、程序等进行情况说明。上级公共数据主管部门可以对报送备案的开放目录进行主动审查,审查中认为目录编制存在问题的,可以向报送单位提出书面意见。上级公共数据主管部门也可以综合地区或领域的实际需要,发布有关公共数据开放目录编制的指导意见,指导下级机关改进目录编制行为。据此,行政系统内部通过非强制性的备案审查机制实现了对公共数据识别行为的内部控制。
结语
功能主义视角将公共数据从规范性概念导引到目的性概念。公共数据不再具有明确的内涵外延,牺牲了规范性及法释义功能,换来的却是对公共数据治理目标的有效回应。此时,公共数据概念从识别手段转变为识别目的,需要借助一套有效建构的规则体系来完成公共数据的具体识别。这套规则体系主要由政府负责自我合理建构,因为公共数据识别的目标在于促进公共数据的开放利用,而这属于政府履行公共服务的积极职能范畴。对于我国而言,现阶段迫切需要国务院制定“公共数据开放条例”,在其中明确建立起公共数据识别制度。从长远来看,包括公共数据识别在内的公共数据开放制度,还有赖国家立法的规范确认。虽然法律在控制政府履行积极职能上的表现差强人意,但仍能发挥原则之治的作用,并为政府自治提供不可或缺的合法性来源。因此,政府通过行政规则建构而成的公共数据治理体系有赖于法律的框架性授权。在法律框架之下,政府得以充分发挥能动性,“提供一种有效和公正的结构来促进公共福利”。