数据要素作为新型生产要素,能产生巨大价值,且很容易被复制。如果脱离了监管,可能引发难以消除的外部性问题,比如,要么形成数据垄断,要么严重影响公众利益。这两点是探索数据要素变现过程中,可能面临的最大系统性风险。
3月31日,北京国际大数据交易所(以下简称北数所)重组更名后正式营业,此举被认为是“深入贯彻落实国家大数据发展战略,加快推进大数据交易基础设施建设,促进数据要素市场化流通”的切实行动。
对数据的合规使用、对数据价值的合理开发,已经成为全球数字经济浪潮中的共识。
然而,记者在调研采访中发现,仍有不少问题待解决:政府、企业、法律界乃至公众对数权的理解是否统一?数据所承载的权益图谱涵盖哪些方面?监管的难度何在?技术能发挥什么样的关键作用?在防止系统性风险方面,北数所等新机构能走多远?
专家表示,对一些重要的关键概念,应允许经历更长的百家争鸣阶段;目前探索的一些路径究竟能取得哪些实效,也需更多时间来一一验证。
“数据要素元年”,群雄逐鹿争夺治理主导权
“2020年被我们称为‘数据要素元年’,美国、中国和欧盟作为全球三大经济体,相继出台数据战略、制定顶层战略架构,提出创新治理体系,在技术研发、数据共享、安全保护、经济发展等方面进行整体布局。”钟宏作为清华x-lab数权经济实验室主任、清华大学技术创新研究中心研究员,对数字经济的最新国际形势了如指掌。
2020年4月9日出台的《中共中央 国务院关于构建更加完善的要素市场化配置体制机制的意见》正式将数据列为与土地、劳动力、资本、技术并立的第五大生产要素。
继美国发起一场所谓的“清洁网络”计划之后,2020年9月,中国向世界发出《全球数据安全倡议》。
“从全球范围来看,数据作为数字经济的核心生产要素,抢夺其发展权、话语权和规则制定主动权,已经是全球性的话题。”钟宏这样判断。
他进一步分析:首先,把数据驱动数字经济的发展作为重要的市场战略,这在全球已是鲜明的争霸策略;其次,从市场角度,数据产业和数据核心技术的发展,已经在驱动人工智能、智能制造等的升级换代;最后,全球也在围绕数据标准和治理架构展开新一轮角逐。
欧盟于2018年生效并实施《关于自然人个人数据处理和数据自由流动的保护条例》,即《通用数据保护条例》(以下简称GDPR),其被认为是最严格的个人数据和隐私保护条例。
外界普遍认为,GDPR限制了欧盟数字经济发展,对人工智能技术企业亦非土壤厚植,但此举也被钟宏解读为“通过设计一定的壁垒,给自己留出空间和时间来发展核心能力”。
果然,2020年,欧盟委员会发布《塑造欧洲的数字未来》《欧洲数据战略》和《人工智能白皮书》三份文件,涵盖网络安全、关键基础设施、数字教育和单一数据市场等各个方面,形成了欧洲新的数字转型战略。
“中国的战略布局和行动步骤不但没有落后,且率先提出‘数据要素’的概念,应该说走在了世界前沿。”清华大学交叉信息研究院长聘副教授、博士生导师徐葳如是说。
避免“择数据而居”,该塑造怎样的新“数据观”
数据到底是一种怎样的生产要素?
“这意味着,我们要让数据变成真正的生产资料,必须实现数据的资源化、资产化和资本化。”钟宏认为,“这是培育数据要素市场的关键任务,因为它是数字中国建设的生态体系核心,也可以说是土壤。”
作为生产要素的数据,还应该具备什么特点?
徐葳认为,数字时代的生产要素一定要能流通,否则,资本向占有海量数据的巨头靠拢,与农耕时代“择水草而居”的差别何在?
徐葳举例,以往为确保金融数据安全而设定的“金融数据不出门”等行规,客观上让互联网巨头涉足金融的试探有了丰富的想象空间和实践基础,对金融监管部门形成了新的挑战。
他分析,这种敝帚自珍的做法,对金融行业来说,往好了说是确保了数据安全,但实际是一种固步自封,其对金融数据的低加工成本优势,在数字经济时代完全没有存在感。
这种“拧巴”的现状,正是数据要素区别于其他生产要素的特点所致——只要复制一份,它用来做什么,就不受控制了。
钟宏提到“数据要素的全生命周期”概念:“数据要素不等同于数据,也不等同于大数据,围绕数据,有很多权益也需要界定清楚,比如采集权、存储权、控制权、可删除权、可携带权等等。这些特点,都无法对标传统生产要素。”
他举例,个人在医院检查过程中获得的生命体征数据,一方面,其源头确实来自病患自身,但另一方面,产生这些数据所用设备是医院提供,诊断结果是经医生对相关结果标注的。“经过多次加工、整合形成新类型数据的海量医疗信息,在流通过程中就面临非常复杂的权益归属问题,需要制度和技术保障各方权益”。
钟宏建议,可以“一事一议”,根据不同的场景,判断相关数据的权属。
但即便这样,在现实中,政府、企业、学者、媒体、公众乃至法律界,在谈及相关话题时,仍然存在理解不同导致的“鸡同鸭讲”现状。
钟宏认为,数据权属的细化和各类概念提出,可能有助于理论研究和立法推进,但数据析权应遵循实践可操作原则。
怎么办?技术界并未停止探索。
徐葳提出,如果做到“数据可用不可见,可控可计量可监管”,或可为数据的安全流通提供一道“护身符”。钟宏的建议是:“对标欧盟建设数据要素监管沙盒,以科技监管构建数据要素开发利用的综合治理体系。”
底线在哪儿?全球人工智能产业发展痛点和堵点并存
2020年6月22日,科技巨头甲骨文公司数据管理平台BlueKai因为在服务器上不加密码,泄露了全球数十亿人的数据记录。
近年来,此类事件层出不穷,涉及个人隐私的数据安全问题,屡次被全球媒体报道,其中不乏欧盟根据GDPR对跨国互联网巨头开出巨额罚单的案例。
人们生活在充满数字的世界,人工智能的实际应用几乎无处不在。而这些惠及生活的潮流科技,没有哪一项是凭空产生的,它们都是经过大量数据“投喂”“训练”的结果。
以中国人工智能领军企业商汤科技为例,其人脸识别技术应用备受全球知名手机品牌青睐,从这项技术衍生出来的人工智能测温仪,也在新冠肺炎疫情期间广销海外市场。
记者对话商汤科技工程院院长、信息安全管理委员会主席沈徽,他用“负重前行”来形容企业在发展中对数据合法合规使用的自加压系统。
商汤从创业初始就在数据获得和使用上贯彻全程授权规程——在数据采集过程中,数据采集团队根据不同业务的需求来采集不同数据,配合公司法务部门的详细指引及文件材料,与合规且专业的数据采集机构合作,获得数据提供对象的逐一授权,签署相关协议。
“这一过程投入了较多资金和资源,包括面向自然人采集个人信息时支付采集费用等。”沈徽坦言,有社会责任的人工智能公司,在数据方面投入的成本都蔚为壮观。
今年4月21日,欧盟就监管政府和企业对人工智能的使用,公布了一项法律框架。未来欧盟将可能对违规最严重的公司,处以相当于其全球年销售额6%的罚款。
虽然该法律框架最终通过还需几年时间,但对人工智能应用的发展,将产生不可估量的影响。
的确,拿人脸识别技术来说,面部信息与购物偏好、电话号码等互联网及通讯数据不同,它带有鲜明的、独一无二的个人生物特征,一旦泄露,就收不回来了。
“人脸识别如果采集和分析此类敏感数据,确实应该分级管理。”沈徽如是说。
“我们时刻保持底线思维,但底线究竟在哪里,我们有时也很困惑。”沈徽看似“凡尔赛”的焦虑,恰恰说明,中国迅猛崛起的人工智能产业已渐入佳境,中国借人工智能等新兴战略产业实现跨越发展的机遇已经显现。
沈徽呼吁,全产业链应共同推动对涉及计算机视觉不同应用场景的数据进行分类、定义乃至分级和监管。与此同时,中美欧日等经济体之间,应秉持开放共享和数据共同体的理念,尽快取得数据安全流通和跨境使用的国际共识。
他表示:“我们非常努力想去理解和遵从一些指引,也愿意作为业界领先的实践者,继续参与相关行业标准工作的制定之中。”
安全交易倒逼技术革命,监管平台也要自带“紧箍咒”
数据要素市场的科学健康发展,离不开监管。到目前为止,相关法律还在审议中。
但数字经济的治理体系,需要提前布局并统筹内部性和外部性协调发展。
徐葳举了一个例子,煤企挖煤,谋求煤炭本身的经济价值是企业自身的问题,但开山挖矿可能造成的生态灾害,会引发这一行为的外部性问题。如果不去监管,进行掠夺性使用,其造成的危害会越来越大。
“数据要素作为新型生产要素,能产生巨大价值,且很容易被复制。如果脱离了监管,可能引发难以消除的外部性问题,比如,要么形成数据垄断,要么严重影响公众利益。这两点是探索数据要素变现过程中,可能面临的最大系统性风险。”
然而,对这种全球共同面临的新业态和新领域,没有哪个国家有成熟经验可以借鉴。但对于能流通的高价值生产要素,需要通过交易所等形式加以监管,这是近代经济文明下屡试不爽的解决方案。
数据交易所的概念和实践,并非现在才有。据了解,此前,贵州、上海、浙江等多地建设了大数据交易中心或交易所,但效果并不尽如人意。数据权属界定不清、要素流转无序、定价机制缺失、安全保护不足等,成为数据要素交易的关键掣肘因素。
北数所是在数据作为生产要素写入中央文件后,探索“数据特定使用权流通”的首个交易所。
业界对其在法律与政策层面先行先试、减少企业外部交易成本、降低企业合规风险等方面充满期待。
然而,承担监管职能的北数所,能否在数据流通和交易中,成为数据买卖各利益攸关方都可信赖的角色担当?
徐葳的观点是,如果最初不将监管技术设计融入到相关数据交易的基础平台中,后期再想监管和取证,几乎没有可能。
现在,北数所通过隐私计算、多方计算、区块链等先进技术,让数据安全地交易、畅快地流通起来,帮助等米下锅的人工智能、科技金融等产业上下游,以低成本获取高质量数据,释放数据要素的价值。
徐葳担任首席科学家的科技企业华控清交信息科技公司,这次直接将多方计算等先进的底层技术,嵌入到北数所的运营平台建设之中。确保所有权和使用权剥离、去中心化及数据分层可控的底层逻辑思想,在管理实践中得到切实应用。
“这相当于给监管平台也带上了‘紧箍咒’,平台管理者只知道发生了数据的交易,也知道交易方的数据使用方法和使用目的,但无法看到交易的数据本身。”徐葳进一步解释,北数所会提供一个安全环境,交易时原始数据仍被数据提供方完全掌握,数据使用方只会得到一个共同计算的结果,交易平台和算力提供方可以审核数据的具体使用方法,但得不到任何数据,并且其间所有操作均可追溯、被记录,“让数据交易在阳光下运行”。
“打铁还需自身硬”,除了靠创新的底层支撑技术架构为数据供需双方提供可信的数据融合计算环境,北数所还从积极创新数据交易模式,进而构建集数据资源、技术支撑、场景应用、交易服务等四位一体的数据流通产业新生态。
这一思路赢得了北数所48家初始会员单位的信任和认可,重组后的北数所及其监管创新之举也成为学术界研究的全新样本。
“主导这件事情的各方思路很清楚——北数所一定是技术导向型、技术驱动型的数据交易所。”钟宏对北数所在数据要素提出后的示范作用予以肯定。
技术驱动的数字文明建设,将考验各国的政治智慧和经济智慧
万物上链后,将不可避免地带来数据的市场化、产业化、资本化和国际化。
钟宏认为,这恰恰是我们探索数字经济新型基础建设考虑的着眼点——既要全球化融合发展,又要自主可控。换句话说,既要国内和国际同步,又要安全保护与开发利用并举。
2013年7月,习近平总书记在视察中国科学院时指出:“大数据是工业社会的‘自由’资源,谁掌握了数据,谁就掌握了主动权。”
随着中央到地方支持数字经济发展的重要文件陆续出台,伴随“一呼百应”之势,以数据为基本要素的数字经济必将迅速“红火”起来,中国正在探索的适应新经济形态的监管,也在助力相关产业有序开展要素流通。
“如果此类交易所能切实提供高质低价的可信合规数据,对人工智能产业来讲,真是巨大利好。”沈徽的期待,真诚而热烈。
企业是创新实践的主体,在数字经济时代尤其如此。
“企业的社会责任,应体现在通过丰富实践,不断给予业界经验积累的总结,并形成标准、范式和样板。”沈徽介绍,商汤不仅牵头国内标准的制定,还于2020年底成功立项电气电子工程师协会(IEEE)标准《人脸识别系统技术要求》,并担任“人脸识别”工作组主席单位,目前已经通过专家内审会并在积极推进中。
沈徽坚信,在尊重全球用户基础上,在不断完善的数据要素监管生态保驾护航下,我国的人工智能产业一定会在未来的数字文明中,靠实力“平视世界”。
来源:科技日报