文/谢楚鹏 温孚江
基金项目:本文系山东省科技计划项目“渤海粮仓增产增效的大数据支撑研究(2013G0020112)”和山东省农业厅2014年农业重大应用技术创新项目“农业大数据的数据采集、共享机制以及示范工程”的部分研究成果。
摘要:本文从大数据背景下,个人数据发展的现状入手,探讨了跨组织数据交换的挑战,并讨论了数据使用权在数据交换和数据商品化方面的重要意义。本文首次提出个人数据权的概念,认为个人应被国家赋予访问、获取、整合、利用和出售与个人直接相关或个人参与创造的数据的权利,即形成数据交易市场。本文认为,针对个人隐私的争议,问题不在于隐私被使用,而在于被他人滥用;由于隐私权保护和企业边界的存在,个人是整合跨组织数据的最合适主体;一旦个人数据财产价值有了变现的渠道,必将有力促进个人及社会的数据品种和总量的增长。个人对自身数据的积极支配,将促进数据的自由流通与保值增值,减少对超大型互联网企业的依附程度,增加新兴企业的发展机会,提升数据应用的多样性和效率,最终使大数据的价值得到充分发挥。
教育期刊网 http://www.jyqkw.com
关键词 :大数据;个人数据权;数据商品化;数据市场;数据价值
引言
数千年的文明历史以来,由于缺乏普遍和有效的数据记录和存储工具,无数的人雁过无痕,消失在时间和记忆中,只有少数人的吉光片羽散落在少量的书册和文物中[1]。然而,自从人类创造了互联网、智能手机、可穿戴设备等工具,越来越多的个人信息和行为被记录和存储在互联网或物联网的比特世界中。例如,智能手机捕捉了我们通话、短信以及使用软件的习惯;手机上的各类传感器收集了各种信息,比如gps收集了我们的位置信息,摄像头则保留了视觉记忆;社交网络保存了人们的社会关系、个人状态、沟通记录、生活照片和喜好;银行保存了我们的理财和刷卡记录;而医院则拥有我们的医疗和健康信息。这些数据源自个人的行为和活动,从这个意义上来说,个人已经成为了数据生产的重要主体,个人数据也因此有了更深更广的内涵。
1、个人数据的定义
对于个人数据的定义,传统上是从隐私保护的角度出发的[2-3]。各国法律层面的定义存在较大的分歧,但在内涵上,个人数据被普遍认为是能够直接或间接识别出特定个体的数据。例如,1995年的欧盟《个人数据保护指令》[4]将个人数据定义为:与识别一个在世的个体相关的所有数据。其中, 可识别的个体是指通过身份证号码或身体、生理、精神、经济、文化、社会身份等一个或多个因素可直接或间接确定的特定的自然人。
在大数据时代[ 5 - 7 ],商品的生产和价值的创造日益走向社会化和公众参与[8-10],数据也更成为一种资产。从这个角度出发,世界经济论坛[11]定义个人数据为由个人创造或与个人直接相关的数据,包括个人自愿提供的数据(由个人创造并且明确分享的数据,例如社交网络个人资料),观测到的数据(记录个人行为的数据,例如使用手机时的位置信息),以及推断的数据(基于对个人自愿提供的信息或观测到的数据,例如信用评分)。
综合以上定义, 本文将“ 个人数据”定义为个人提供的信息(比如搜索关键字、注册信息等)、或个人原创内容(比如社交关系资料、评价和晒单、旅游攻略、原创小说、原创视频等)、或个人(浏览、购物、阅读、观看)行为产生的数据、或被政府、企业、医院和研究机构收集的与个人直接相关(比如GPS位置、IP地址、基因测序、医疗记录、信用卡记录、通话记录等)的数据。这些个人数据描述了我们是谁,在哪儿,做了什么,认识哪些人,有什么样的健康状态和生活形态,展示了我们的数字化存在。
2、个人数据权与数据商品化的必要性
虽然,通过各种智能终端上传和收集的个人数据越来越多,个人自己却很少能够控制和利用这些数据。个人数据是社会和商业组织中数据的重要组成部分,然而各个组织对个人数据的使用却极为有限,使大数据的社会和商业价值很难发挥出来。这主要是因为个人数据仅以碎片化形式分散存在于各个组织中,而个人数据目前又被局限于仅在组织内部被整合、挖掘和利用,很少在组织之间被交换。
在大数据背景下,各个社会和商业组织都非常关注跨组织的数据交换[12-13],以获得外部数据,从而更全面地了解个人用户,掌握更真实、更立体的个人消费、社交、和工作场景。然而,跨组织的数据交换却很难发生,因为一方面,企业的数据资源是自身的宝贝,都很不愿意拿出来;而另一方面,由于隐私权的限制,除非获得用户的同意,否则跨组织的数据交换几乎是不现实或不合法的事情。这种状况使得大数据的应用出现了十分突出的矛盾:虽然计算设备和传感器越来越多,源于个人的行为和活动,电子商务、社交平台、传媒、移动通信、金融、物流等都积累了大量的数据,但是能够充分利用这些数据资源的机构是极少的。更普遍的情况是,绝大多数机构面对想要解决的问题,能供使用的数据如凤毛麟角或很不全面,大多数机构找不到可用的大数据资源,更谈不上利用大数据的方法与技术。也就是说,社会中的数据总量很多,但是大多数机构能用的数据资源稀缺[14]。
跨组织数据交换的极度困难,至少导致了如下几个重要问题:
(1)数据黑市和数据滥用的日益猖獗。我国刑法有“出售、非法提供公民个人信息罪”。法律上的不支持,导致了数据黑市和数据滥用的存在。然而即便如此,商业组织仍然难以获得有效和精准的个人数据,因为这些黑市交易的数据质量很差,而且很难得到更新。例如,匿名化处理后的社交数据难以和交易数据相关联,从而难以被整合起来进行深入挖掘,挖掘出来的结果也不能被精准应用到个人,因而难以产生较大的价值。
(2)少数超大型公司逐渐统治所有的私人活动空间。互联网市场正在日益集中,少数超大型公司已经在很多领域形成了垄断力量,产生了商业帝国,减少了其他企业自由发展的土壤[15]。麦特卡夫定律指出,网络价值以用户数量的平方的速度增长,它创造了赢者通吃的市场。因此,我们正在进入一个数字封建主义的世界,在这个世界中,数字贵族的存在形成了数据特权,导致数据割据,阻碍了数据市场的形成。事实上,谷歌公司占据了全世界搜索引擎市场70%以上的份额,百度在中国的搜索市场上也占据了83.6%的份额。苹果公司更是通过建立一个产品专卖专有的系统建立了一个商业帝国。在数据领域的过于垄断或割据,会导致数据资源难以被充分和有效率地利用。由于缺乏有竞争力的数据资源,新兴的互联网企业正在被少数超大型公司更广泛更快速地并购,即使没有被并购,也很难获得急需的数据养分以得到公平和快速的成长。
(3)数据分析和应用型的专业公司缺乏基本的生产要素
数据的拥有者有三个主体:政府、企业和个人。一方面,一部分数据拥有者,特别是企业和政府,不愿意提供垄断性拥有的信息和数据,另一部分数据拥有者,特别是个人,缺乏数据供给的机制和工具,因而不能发挥数据应有的价值和使用价值,造成资源的流失和浪费;而另一方面,新兴的数据分析和应用行业急需这些数据进行社会生产,开发信息和数据的价值功能,但是没有获取的途径。这种矛盾已经阻碍数据产业形成专业化分工与合作,成为我国大数据产业发展道路上亟需解决的矛盾。
在这种情况下,整个社会亟需能促进跨组织数据交换的办法和机制。本文认为,由国家赋予个人数据权,并以此为基础进行数据的商品化势在必行,这将有效解决跨组织数据交换的困难和最大化数据的价值。 同时,国家应尽快制定相关法律,依法有序形成数据交易市场。
个人数据权的定义源自“ 数据权”。英国首相戴维·卡梅伦最早提出“数据权”一词[16],称其是信息时代每一个公民都拥有的一项基本权利,并承诺要在全社会普及数据权。《信息自由法案》[17]于2005年1月在英国全面生效,首相戴维·卡梅伦将民众依法获取政府公共数据称为“数据权”。他说,“这将确保人民有向政府索取各式各样的数据,用于社会创新或者商业创新。通过这些措施,我们可以创建一个最开放、最负责和最透明的政府。”
卡梅伦定义的数据权仅针对政府公共数据,并未将企业数据考虑进来。而在大数据的背景下,企业的生产和价值的创造日益走向社会化和公众参与。随着社会信息产生与传播方式的变化,企业与消费者个人间的关系趋向平等、互动和相互影响,由个人用户创造的信息和数据已成为互联网企业海量数据的重要来源。
用户个人在互联网或移动互联网企业平台上产生的原创内容、行为(包括浏览、阅读、购物等)、社会关系、银行记录、和手机通话等各个方面的数据,应为个人和企业平台所共有。信息时代每一个公民的“数据权”也应包括民众依法索取企业与个人有关的各式各样的数据,用于社会创新或者商业创新。同时,“数据权”还包括个人积极地利用、控制、和交易自己的相关信息和数据,从而产生财产利益,将个人数据商品化的权利。
因此, 本文首次提出“ 个人数据权”,并定义该权利为个人积极从政府和企业采集、控制、利用和销售个人非职务创造的或从各种合法渠道获得的数据,从而将个人数据商品化的权利。其必要性意义体现在:
(1)个人数据权将积极促进跨组织数据交换的发生,并产生最优的数据质量和经济效果。由于隐私权保护和企业边界的存在,个人成为整合跨组织数据的最合适的主体。相对于其他选择,比如机构被赋予权利等来说,个人被赋予权利后,个人主动整合各个来源的数据的效果也会最全面,成本也最低,因为各个来源的数据可以基于个人的身份标识统一地关联起来,而且每个人对于自身的行为和活动也最了解。消费者档案和行为数据在社交网站、电商网站、手机运营商、银行、医院、政府等数据库中大量地以碎片化形式存在,这些数据非常有价值,但如果能关联和结合起来,就会更加有价值。没有任何一个数据收集者能合法地收集所有的这些个人数据,除非在个人数据权的基础上个人进行采集、整合和销售。在大数据时代,数据之“大”,不仅指数据的规模,更侧重的是数据本身的大价值。精准和有效的个人数据是商业创新领域梦寐以求的重要资源。从传统上的粗糙杂乱的原始数据中提取自身需要的信息耗费了经营者的大量成本,精准和有效的个人数据则将大幅减少数据加工过程的资源投入。
(2)数据的商品化[18-19]将促进数据的自由流通和数据市场的繁荣,并发展社会生产力和创新力。数据是可再生资源,同时也是可以重复利用的资源。一旦个人数据财产价值有了变现的渠道,必将有力促进个人及社会的数据品种和总量的增长。在大数据时代,这也意味着社会财富总量的增长。数据商品化交换的广泛发生,将促进数据资源的流通和应用,为各个新产业的发展提供宝贵的生产资料,从而充分发挥出数据的价值。
3、个人数据权与数据商品化的合理性
在个人数据权方面,互联网技术的发展使得用户的个人数据成为了一种有着巨大经济价值的商品,并具有了潜在的广阔交易市场,网络服务提供商可以通过对信息的收集和利用谋取相当大的利益。在互联网环境下,个人数据具有了财产属性,个人数据兼具人格与财产的双重属性,可以同时受到人格权及财产权的双重保护方式加以保护。对于那些与人格尊严无关的个人数据,若其具有商业价值,应该将其视为数据主体的个人私有财产,等同于其他财产权客体,权利主体对其享有占有、使用、收益、处分的全能,对其自主进行商业化利用自然不在话下。因而,从法律理论上,个人数据的商业化利用具有合理性[20]。因此,大数据的发展亟需相关法律的产生,使数据交易有法可依。
虽然个人数据的隐私问题是大数据商业价值受到质疑的主因,但是当前的隐私争议不在于隐私被使用了,而在于被滥用了。在数据的黑市交易中,利益由数据的收集方获取,而个人不能够从自己的个人数据中获利,这非常不公平。个人数据权保障个人获取数据和利益的权利,这也是尊重数据和财产为个人所有,让个人拥有明确产权和支配权的重要举措。
数十年来,数据的产生和组织方式发生了革命性的变化,个人第一次成为数据生产的主体。在大数据这个新时代,个人数据权应该是每个公民都可以享有且应充分享有的一项新的基本权利。如果没有这项权利,新兴的产业将缺乏创新和发展的土壤,而个人用户将越来越依附于这些极少数的超大型企业,失去独立性和选择的权利。如果没有这项权利,大数据将难以转化为财富,价值将难以充分发挥,社会的数据量和数据财富将难以增长。
而且,个人数据源自个人,个人数据的产权和支配权也应明确到个人。根据科斯的产权理论,如果产权明确到个人,且产权人享有剩余价值的占有权,产权人会有更强的激励动机去不断提高数据的质量和数量,并进行更充分的交换和合作。
当然,个人在出售自己的个人数据时,可以对产生个人数据的企业平台进行成本补偿。
在数据商品化方面,个人数据,特别是个人行为数据和个人原创的内容,在生产的过程中凝结着个人用户的智慧和劳动,具有价值。由于人与人之间的差异,每个人在产生自己的个人数据方面,常常具备不可替代的作用。个人数据的生产可以满足商业和产品创新、广告营销、社会研究、政府决策、其他用户的兴趣和需求等利益相关者的需要,所以个人数据还具有使用价值。
个人数据具有价值和使用价值的这一商品特征是构建数据市场的理论基础,个人数据作为商品不仅仅是为了自身的消费,其最重要的目的是进行对外交换以促进个人数据价值的最大化,从而增加社会的精神和物质财富,因而具有交换价值。信息经济是创新型的经济,很多创新都依赖于长期积累的数据。在数据不能交换的情况下,创新只能在某些组织的内部进行。积累的数据将用户锁定套牢在一个整体的商业产业链中,使任何一个试图引进一个可以与其形成竞争的新的竞争者都面临着巨大的屏障。随着垄断力量的不断增强,竞争和创新将逐渐减弱,数据被充分和多样化利用的可能性就降低了。
举例来说,个人消费者在电子商务商城中消费,商城将依据消费记录和信用数据的情况,给予每个人一个等级(例如钻石、金牌、银牌、铜牌、皇冠等),并且提供个性化商品和优惠的推荐。消费者在这个商城的消费时间越长,购物记录越多,那么等级划分、商品和优惠的推荐就越精准,用户的购物体验就越高。久而久之,其他商城就失去了与该商城公平竞争的能力,因为没有积累的数据,就无法为该用户提供同等精准的服务。在不公平的竞争环境下,极少数公司很容易形成垄断性的优势,以至于在商业发展的某个阶段,甚至不需凭借持续的技术创新,而仅凭数据的积累,就能保持或扩大该垄断性的优势。
数据商品化是把数据产品当作商品出售、购买和转让,通过数据商品的交换实现数据本身的价值和使用价值。数据的商品化源于人类社会和商业创新中强烈的数据需求。数据商品具备“消除不确定性”的效用价值,信息的量“不是指信息内容的多少,也不是指信息符号的多少,而是指信息能够消除‘不确定性’功能的大小”。
随着信息技术的发展,个人数据的交换将具备便捷的工具和平台,个人数据这种资源的配置将是所有者和使用者双方进行市场化的公平、自主、双向选择形成的结果,形成较高的配置效率。
4、个人数据权与数据商品化的实现机制
针对每个人的个人数据权赋予需要由国家立法和保障实施。国家应保障个人积极从政府和企业采集、控制、利用和销售自己的相关信息和数据,从而产生财产利益,将个人数据商品化的权利。国家应该用国家强制力,来促使每个企业都配合个人行使个人数据权以及相应的数据采集行为,提供该企业或企业平台中与个人直接相关的数据。
数据的商品化方面,已经有一些实践探索[21]。比如2013年4月,一位名叫Federico Zannier的美国人[22]引起了广泛关注,因为,他要把3个月积攒的大约7个GB的隐私数据卖掉,而且已经成功炒到了1100美元。Zannier记录了自己的网页浏览数据、地理位置信息、鼠标轨迹、屏幕定时截图、摄像头定时照片、键盘输入记录、App登录信息等数据,在短短3个月的时间内,就积攒了超过7GB的“个人数据”。从这个极端的个例中,可以看出大数据的商品属性。
一些新平台也在试图帮助用户获得主动并努力成为个人数据的代理人。比如,Datacoup鼓励用户将Facebook、Twitter等社交媒体上的账户[23],以及信用卡和借记卡的交易记录对该平台开放,一方面用户可以获得全面的网络画像以更好地了解自己,另一方面用户可以选择将数据匿名开放给他们喜欢的品牌(广告主),并由此获得每月支付的费用。
Meeco则推出个人云和数据交换网络,试图说服用户将所有的个人数据都集中到其平台上进而方便用户进行统一管控和数据交换。
然而,单个用户数据的商业价值是很有限的,足够多的用户“集合”数据才具备较高的挖掘价值。特别重要的是,个人积极从政府和企业采集个人数据时,政府和企业应当以通用的格式和语言输出个人数据,从而方便个人进行汇总和整合。在这方面,会计数据是典型的参考案例:作为世界通用商业语言的会计数据能在国与国之间频繁交换,极大地促进了世界经济的交流与合作。针对较为杂乱和无序个人数据,也需要创建和形成通用的商业语言,从而以较高的效率、较低的成本在整个社会和商业范围内广泛流通。这样才能较好地实现数据的商品化和大数据的价值。
数据商品是一种抽象的商品,但一定程度上可以类比于劳动力商品:单个劳动力的价值很有限,只有足够多的差异化的劳动力集合在一起,在专业化分工和合作后,才有较高的交换价值。是否出售个人数据就像出卖劳动力一样应由个人来决定。最终,个人数据的交换应该像自由劳动力市场一样,成为一个自由买卖的市场,通过“看不见的手”来提升个体间的合作、创新、经济成长、以及自由。随着信息技术的发展,个人对个人数据的获取、控制和出售,预计将简化为点击几个按钮,让每个人都能很容易、很便捷地完成。同时,个人在对个人数据商品化的过程中,也需要对共同生产数据的平台企业在生产环境和存储费用方面进行必要的成本补偿,以实现共赢。
5、个人数据权与数据商品化的发展展望
根据前面的分析,个人数据权的赋予与数据的商品化将积极促进数据市场和大数据产业迅速和健康地发展。显而易见的是,在大数据时代,个人数据是个性化商业服务和创新最重要的生产要素,是数字化经济的新石油。个人数据权的赋予与数据商品化将至少产生如下具体的预期效果:
(1)个体数据权将明确个人对于个人数据的产权,释放出个人采集、获取、利用和出售数据的积极性。个体数据生产的动机将超越当前以个人兴趣或个人需要为主的模式,更多的数据将按商业的需要由个人以专业化、职业化的形式进行分工、生产、整合和出售,以支持产品和商业模式的创新。同时,更多的传感器、存储方式、可穿戴设备将被发明和应用,来支持个人数据更多更好的采集和存储。
(2)个人的数据,就是个人的记忆和历史,是自己工作的记录,而且每个人的历史都是不一样的。基于存储下来的个人数据,可以很容易地为每个人写下传记,帮助记忆、文化和文明留存下来。这也将为社会学研究和家族传承留下重要且丰富的素材。以往少数贵族和名人才能享有的立传立传,将被普通的个人所享有,这也将是珍贵的历史资料。
(3)个人或个人集合的数据将帮助社会和商业机构进一步理解甚至预测每个个体,挖掘出现实世界运行的逻辑,并提升创新的能力。商业机构将进行更精准的营销或提供更个性化的服务来提升商业效果;政府将更多地利用个人的反馈数据来改进公共设施;研究机构将利用尽可能多个体的治疗数据提升药品和治疗手段的种类和适用性。
(4)新兴产业和商业创新将通过个人数据的交换更容易地获得重要的生产资料,从而能更平等地与超大型的企业竞争。长期积累的数据资源也将在竞争的环境下得到更多更有效率的应用,从而发挥出巨大的价值。
总而言之,个人数据权和数据商品化是个人数据发展的必要和合理的基础。个人数据的发展将为人类文明的进步和传承提供更坚实的基础,同时,这将促成一大批新的创造社会价值和财富的产业机会。
教育期刊网 http://www.jyqkw.com
参考文献:
[1] 黄辰兰.个人数据:新资产的崛起[N].第一财经日报,2011年10月14日第D01版
[2] 王忠.大数据时代个人数据隐私规制[M].社会科学文献出版社, 2014年9月.
[3] 王忠,殷建立.大数据环境下个人数据隐私泄露溯源机制设计[J].中国流通经济,2014(8): 117-121.
[4] On the protection of individuals withregard to the processing of personaldata and on the free movementof such data [EB/OL]. http://ec.europa.eu/archives/ISPO/legal/en/dataprot/directiv/directiv.html
[5] Lynch C.Big data:How do your datagrow?[J].Nature,2008,455(7209).
[6] Bughin J,Chui M,Manyika J.Clouds,big data,and smart assets: Ten tech-enabled business trends to watch[J].McKinsey Quarterly, 2010 (8)
[7] Dabenport T H,Barth P,Bean R.How“Big Data”is different[J].MITSloan Management Review,2012,53(5)
[8] 冯芷艳、郭迅华、曾大军、陈煌波、陈国青.《大数据背景下商务管理研究若干前沿课题》[J].管理科学学报,2013(1):1-9.
[9] Aral S, Walker D. Creating socialcontagion through viral productdesign: A randomized trial of peerinfluence in networks[J].
Management science, 2011, 57(9)[10] ManyikaJ,ChuiM,BrownB,etal.BigData:The Next Frontier for Innovation,Competition,and Productivity[M].NewYork: McKinsey & Company,2011
[11] Personal Data, The Emergence of aNew Asset Class [EB/OL]. WorldEconomic Forum,2011:http://www3.weforum.org/docs/WEF_ITTC_Person-alDataNewAsset_Report_ 2011.pdf
[12] Frankel F,ReidR.Big data: Distillingmeaning from data[J].Nature,2008,455(7209).
[13] Bryant R E,Katz R H,LazowskaE D.Big-data computing: CreatingRevolutionary Breakthroughs inCommerce,Science,and Society[M/OL].www.cra.org,2008
[14] 胡小明.大数据应用的误区、风险与优势[J].电子政务, 2014(11):80-86.
[15] R.W.麦克切尼斯,J.B.福斯特,郭莲.互联网与资本主义[J].国外理论动态,2012(3):1-11.
[16] David Cameron. We are creating anew era of transparency [EB/OL].http://www.telegraph.co.uk/news/politics/david-cameron/8621560/David-Cameron-We-are-creatinga-new-era-of-transparency.html
[17] Freedom of Information Act 2000(英国信息自由法案) [EB/OL].维基百科.2014年10月.http://en.wikipedia.org/wiki/Freedom_of_Information_Act_2000
[18] 郭明龙.论个人信息之商品化[J].法学论坛,2012(06):108-114.
[19] 张亚鹏.我国信用信息商品化机制研究[D].湖南大学,2011年硕士论文
[20] 黄镭.论个人数据商业化利用的合法性和必要性[J].法制与社会,2013(4): 239-240.
[21] 侯宏.数据供应链驱动企业与消费者协同[EB/OL].2014年10月, http://www.199it.com/archives/285455.html
[22] 屈一平.揭秘大数据买卖在中国[J].小康,2014(14): 56-58.
[23] 汤姆.西蒙尼特. 数据挖掘的生意:每月8美元出售你的个人数据[J]. 科技创业,2014(5):15-16.
作者简介:
谢楚鹏,博士,教授,现就职于山东农业大学农业大数据研究中心,主要研究方向为大数据与数据挖掘;
通讯作者:温孚江,理学博士,教授,现就职于山东农业大学,主要研究方向为植物病理和农业大数据等。