摘要:大数据已经渗透至全球政治经济的各领域,提高了全球各部门、各行业的创造力、竞争力、生产效率与经济效益。人文地理与城市学科应该抓住大数据时代这一新的科学研究机遇期,这对于理论创新与解决实际问题都具有非常重要的意义。
关键词:大数据;人文地理学;研究
1“大数据”的定义与类型
总的来看,当前仍然没有形成对“大数据”统一的定义。早在17世纪,哲学家们使用“数据”这一词汇,专指真实的、反映事实的相关信息。长期以来,研究过程中的“数据”指的是依据某些传统调研方法(例如:问卷、访谈、日志等)收集的信息,以及这些信息所抽象表达出来的意义。进入20世纪80年代,信息通信技术的进步改变了人类的生活方式,加速了信息的存储、交换与计算过程。特别是互联网的使用,遗留下大量的数据“痕迹”,而且产生的速度也是日益增倍。据Hilbert等的研究表明,仅2007年人类大约存储了超过300EB的数据,而人类存储信息量的增长速度比世界经济的增长速度快4倍。这一海量的数据被形象的称为“大数据”,这一定义突出体现了数据规模大的特征。
简单来看,“大数据”可以大致划分为三种类型:直接观测型、自动获取型与自愿贡献型。①直接观测型主要是指由各种电子监视器等(例如道路卡口摄像头)直接观测的数据,往往针对某一特定地方或人(群)。②自动获取型数据是由于电子信息设备或相关网络应用程序的使用而自动留下的网络“痕迹”。例如网络中留下的搜索与浏览记录;网络购物留下的交易数据、快递包裹留下的转运记录;出租车gps记录的时空出行路线、智能公交卡记录的上下车出行记录;手机基站检测得到的手机用户位置、手机用户间的通信记录等。③自愿贡献型数据是人们自愿在网络上发布或分享的数据,主要是社交网站上使用者的相互作用,例如社交网站签到留下的时空数据、社交网站用户的社交关系网络、社交网站用户的相关言论,以及Frickr等分享网站上游客上传的照片信息等。
2“大数据”为人文地理学研究带来变革
从人文地理学发展历程看,大数据迎合了人文地理学“计量转向”与“社会转向”的发展规律。1950年代,得益于计算机处理数据能力的提升,人文地理学研究出现了“计量转向”。数量模型的引入提供了空间研究的方法基础,避免了简单、抽象、定性的约束。特别是舍弗尔(Schaefer)等为代表的学者倡导地理学是一门追求普遍规律的实证主义科学,并力图借助数学模型等工具发现空间法则。大数据提供了丰富的、详细的、实时的信息,有助于社会科学家更加全面、大尺度、精细化地研究各类社会科学问题,考虑到越来越多的大数据携带的地理空间属性,无疑也为关注空间的人文地理研究的发展提供了新的机遇。
同时,更加重要的是,在当前社会科学空间转向的大前提下,大数据为人文地理学科在整个社会科学领域内争取更多的关注与重视提供了新的契机。人文地理学的发展由早先的以定性描述分析为主到计量革命后的定量方法兴起,到20世纪70、80年代以后定性与定量相结合的研究模式,再到大数据环境以数据驱动的人文地理学研究,这其中通过对人与自然交互活动过程的实时、精细、动态感知,使从原先只能由结果去推断过程的研究模式转变为可以对事件发生的全过程实现可感、可知、可控的革新。这就是以数据驱动,特别是大数据环境人文地理学研究范式的一个创新。
大数据给人文地理学带来的变革除了思维模式以外,对现象与要素数据的实时性、覆盖面、精细程度(实时监测数据)也是一个极大的补充。传统统计数据发布由国家权威部门提供,而大数据时代到来使得人人都有可能成为统计数据的提供者与发布者(VGI),这是一种由下至上的自发数据收集形式,可能促使传统统计数据采集方式有所革新。带有空间信息的大数据给人文地理学研究带来了机遇。大数据与计量地理革命以及社会转型不应该被忽视,因为其提供了大量带有时间与属性信息的人类行为数据。新的数据源:大数据时代向通常以传统统计数据为研究基础的人文地理学研究提供了新的数据来源、方法论、思维方式。数据采集方法也已经从传统的统计年鉴数据、调查问卷数据、访谈数据转变为网络数据(社交网络数据)与新的空间定位数据(GPS,智能手机,位置服务等)转变。
3大数据应用于人文地理研究的总体框架
大数据已经渗透至国家、区域及城市经济社会与公共管理的各个领域,人文地理的研究应抓住大数据这一机遇,对城市居民活动、企业空间布局、公共服务供给及城市治理等领域开展深入研究。总体来看,人文地理研究或应用的框架构建需要以大数据为核心。通过网络数据挖掘或信息设备采集等手段获取主题网站、社交网站、智能手机及城市传感器等行为活动数据,利用传统人文地理研究方法和地理信息科学GIS等数据分析工具对大数据进行相关关系分析,并结合部分传统数据对研究主题内部存在的因果关系进行把握,从而构建以居民个体或群体组织行为分析为核心的大数据应用支撑平台。
在此数据平台基础上,城市地理学研究应重点关注居民行为、活动等及其影响下的城市空间组织和结构的变化;社会地理学研究则需要集中分析社会群体特征、网络、活动等及其影响的社会空间分异或融合;政治地理学研究则通过基于舆情分析的国家或地区间地缘政治关系判断政治现象发生和影响规律;旅游地理学研究应强调旅游者行为分析在旅游出行方式、资源选择、旅游體验及设施应用等研究方面的重要作用;交通地理学研究可以以基于电商大数据的物流组织分析为切入点来优化区域或城市内部的交通网络;经济地理学研究应系统模拟企业生产、经营、迁移等行为活动及其对区域或城市生产力空间的影响;文化地理学研究则需要从大量居民活动或情感数据中分析城市文化特质或结构来探讨人类文化活动对区域或城市的影响;军事地理学研究可以侧重对大体量地理环境、政治因素、突发事件等信息进行安全评估来制定军事战略方针。同时,还应借鉴地理学(自然地理学)、社会学、经济学、计算机科学、情报科学、心理学、数学及城乡规划学等其他相关学科新的理念、方法和技术手段来不断完善大数据时代人文地理研究框架或体系。
[1]吴传钧.人地关系与经济布局[M].学苑出版社,1998:28-33.
[2]郑度,陈述彭.地理学研究进展与前沿领域[J].地球科学进展,2001,16(5):599-606.
作者简介:田可,女,土家族,湖北民院生科院学生