辛妍

利用大数据改进城市规划和管理,努力提供人性化的服务,最终使城市更有吸引力、更宜居、更可持续发展和更绿色

数字技术在过去十年间覆盖了我们的城市,并已经成为大型智能基础设施的支柱。随着宽带光纤和无线通信网络的推广,移动电话和平板电脑的使用变得越来越便宜。与此同时,开放式的数据库不断提供各种数据和各类信息,其数量之大令人震惊,比如每天我们能产生2.5×〖10〗^18个字节的数据,当今世界上90%的数据都是在过去的两年产生的,每分钟谷歌会收到超过2百万条搜索请求,等等。这些数据有的是来自于社交媒体网站发的贴子、移动信号和网上采购交易,但越来越多的是来自于对象上的传感器。这些传感器可以被安装在灯柱上,也可以被放置在摩天大厦中。以此为基础,越来越多的传感器和数字控制技术都与价格便宜、功能强大的计算机相结合。早在1997年,建筑师和城市规划师、Mike Batty教授就曾预言说,到2050年,我们周围的一切都将会是某种形式的计算机。而现在,这已经开始成为现实,因为我们的城市已经迅速地变成了一个大的“露天计算机”。

今天,我们生活在一个高度仪器化和数字互联的世界,在某种程度上说,这使得网络世界和物理世界之间的边界越来越模糊。同时,这种仪器化和互联使得有关城市、物理基础设施、服务和人与人之间的交互信息变得实时可用。而智慧城市作为系统的系统,正在利用大数据,致力于改善物理基础设施,改进规划和管理,努力提供人性化的服务,最终使城市更有吸引力、更宜居、更可持续发展和更绿色。

据世界银行估计,到2030年,全球将有2/3的人口生活在城市。为此,世界各地的城市都面临着不断增长的人口和日益严峻的气候变化的双重挑战。为确保未来城市的安全,并能让人们在其中健康地生活和工作,全球范围内都正在建立智慧城市的概念,并实施相应的举措。大数据的爆发影响到很多行业,城市也不例外——城市坐拥数据宝库,因为这些数据可以转化为新的、更深刻的见解,从而提高公民的经验水平,并更好地指导政府决策。比如美国印第安纳州的South Bend政府就利用大数据分析,准确预测哪个区域可能会遇到污水溢出,进而采取必要的行动,将实际污水溢出数量从以前的每年27起减少到1起,在基础设施维修方面节省近1.2亿美元,并同时改善了城市的整体生活质量。

本文将探讨智慧城市中大数据的分类,ICT的作用及面临的挑战,并阐述世界上一些智慧城市如何有效地利用大数据,以及智慧城市中的大数据的隐私与安全问题,以期促进我国更好的利用大数据建设智慧城市。

智慧城市中大数据的分类

通常城市是为了适应峰值基础设施需求而建设的,但实际需求数量或需求模式却鲜为人知。以电为例,电力部门只是负责用电缆传输电力,并希望电网维持正常运转,但却并不知道、也并未关注这些电实际上用在何处。如果存在一个系统,能够明确指出这些电具体用在哪里,至少就能在节约能源方面优于现有的系统。就供电而言,提供最后5%的峰值需求远比提供最初95%的电力成本更高、污染更严重,因为通常只有到最后关头,那些老旧的、效率较低的电厂才会被启用。如果能够预见需求,那么,就可以适当的关闭系统中的一部分,而致力于提高系统的其他部分的运行效率。这样,不仅可以节约大量的能源,而且能够降低由其带来的环境污染。同样的,如果能够追踪到从某一地点到另一地点的实际流动人数,并分析得出每天的模式有何不同,就能重新配置相应的交通运输系统,提高运输效率。

数据和信息遍布我们的城市,它们来自于不同的数据源,呈现出各种不同的形式、间隔度、动态性和质量。对于当今智慧城市的利益攸关者而言,这些数据是最具扩展性的资源,因此关于信息空间的知识,对于创建智慧城市至关重要。有些学者将智慧城市中产生的这些数据分为三类:硬数据(hard data)、软数据(soft data)和复合数据(compound data),如下图所示。

图下方的金字塔代表城市中的“硬数据”,包含三个层面:第一个层面主要是从物理世界的传感器收集得来的测量数据;第二个层面是“原子数据(atomic data)”,它们由物理事件组成,与特定条件下的人类互动有意义地结合在一起(比如交通数据);第三个层面是通过对“原子数据”的数学操作产生的数据,通常被用于获取更有意义的信息。这类数据包括城市指标、元数据或关键绩效指标(KPI)等。

图上方倒金字塔顶端的数据代表着智慧城市的思想领域,它们来自于社会中的人类互动,被称为“软数据”。这些数据结构性较差,需要更专门的统计和分析处理。这类数据的第一层面由“多重数据”主导,即信息由人类的社交互动产生,例如位置数据、来自移动设备的传感器数据、公民报告和公民标记等;第二个层面是文本数据,例如Twitter上的消息等;最后,这两个金字塔的交叉部分是城市中的“复合数据”,是硬数据和软数据的组合,包括链接的数据、社交媒体数据和结构化的数据。

其中,复合数据是当前大数据中最令人感兴趣的数据类别,它含有很多社交媒体信息、网络日志数据和文本数据的组合,以及来自Twitter、Facebook等社交媒体的数据等。

要充分利用所有这些关于城市的数据,并产生对公民有价值的服务,就必须让大数据变小,也就是说能让公民易于访问这些数据。在智慧城市的框架中,它所提供的服务的基本成分就是数据。随着对大数据的需求与日俱增,到2013年,大数据驱动的在硬件、软件及相关服务上的支出达到2320亿美元。要让智慧城市基于数据提供增值服务,就有必要将产生自社交媒体的数据整合到开放数据战略中,用以部署最合适的大数据技术,使数据能在便于访问的结构中被提取、标准化、存储、分析和可视化。否则,劣质数据将会对政府造成巨大的损失。以美国为例,跨政府和企业的劣质数据让其经济每年损失约3.1万亿美元。

智慧城市中的ICT

现代社会需要公共行政部门更多地直接与公民进行沟通,从公民的角度来看存在的问题,并对公民的需求及时做出反应。为此,现代技术就成为了非常有价值的工具,因为它们除了是丰富的信息来源,更是我们日常活动的有机组成部分。

面对种类繁多、形式多样的大量数据,市政当局和城市规划者可能很难确定切入点和起始点。但有一点是明确的:要改善生活质量,每一步都要从分析数据、并使其有意义开始。智慧城市的成功在很大程度上归功于良好的治理,这种治理不是集中于在道路或灯柱上放大量的传感器,而是集中于使用技术,将公众参与融入到决策过程当中。今天,信息和通信技术(ICT)正在推动城市向智慧城市的发展和转型,最终目标是提高公民、企业和当局的意识,改善生活质量,同时也使得城市发展可持续。下图正说明了ICT如何驱动城市向智慧城市转型,从中又面临哪些挑战。

首先,有了ICT的支持,数据变得可扩展,并能在线访问。在智慧城市中,每天有数以百万计的消息通过成百上千的设备(如移动电话、电器仪表、气象站等)进行交换。通过匹配这些设备上所产生的信息,可以增强智慧城市的管理。例如,故障设备会造成能源或水的损失,通过实时将从用户水/电表上测量的消费值与从其他公共事业系统上测量的数值相匹配,就可以减少这种损失。正因为如此,实时处理数据就变得更加重要,而传统的先存储再处理的方法——即各公司检索数据,并为预防将来某天需要访问这些数据而将其存储起来——可能将不再适用。

其次,ICT促使形成分布、平行式的思考方式。智慧城市由若干个独立的网络组成,因此不存在一个集中的应用程序来囊括所有的设备交换信息。同时,ICT设备共享了大量的信息,使得信息并行处理成为一种必要行为。为此,要分析设备上所交换的信息,并充分利用这些信息,就需要将分析向更接近信息来源的方向推进。

再次,ICT需要并能够验证、评估和保护数据。通常,价格便宜、有资源约束的设备主要用于建立形成智慧城市物联网的网络。但不幸的是,这类设备测量和报告的数据(例如,能源消耗读数)通常比较杂乱,并且有信息损耗。造成这一问题的原因并不仅限于设备本身,也有可能是由公民(可能是恶意的)自身造成的。例如,由于有些用户想少交电费,就可能会恶意操作,而使电表的消耗读数不正确。因此,ICT必须采用验证方案、评估方案和安全对策,以确保信息的使用者不会被不正确、局部或恶意的数据误导。

如今,世界各地的城市都在使用ICT方面取得了巨大进步,为公民提供新的服务,对更多的公民需求做出快速及时的反应,并增加了政府机构的透明度。可以说,ICT帮助城市变得更有效率。

大数据在智慧城市中的应用

城市信息学是一门新兴学科,它研究大数据和城市的交叉部分,用大数据来学习和提高大城市的动态,因此它是一个涉及多学科的领域。城市信息学的潜在好处包括实时系统监控、管理和优化等,例如管理交通、煤气、水和电的流量;监测桥梁和管道的状况;规划新的公共交通线路和公用配电系统;监测公众健康,和管理应急响应等。

迄今为止,城市信息学的最大的尝试之一是纽约大学(New York University,NYU)的一个新的研究中心——城市科学进展中心(Center for Urban Science and Progress,CUSP)。该中心旨在通过广泛的传感器和由此产生并筛选的海量信息来把握纽约的脉搏,从而改善纽约市的生活质量。与其他中心不同的是,纽约大学的城市科学进展中心专注于物理、生物和信息传感的融合。目前,该中心有众多的合作伙伴,包括十个业界合作伙伴(其中包括微软、施乐公司和IBM等),有四个国家实验室参与,并与五个学术机构建立了伙伴关系。

在美国和全球的其他城市也有城市信息学中心。比如作为欧洲数据最密集的城市,西班牙北部海岸港口城市桑坦德(Santander)就有城市信息学中心。三年前,该市获得了欧盟委员会800万欧元的资助,于是欧洲的大学和电信运营商联合在市区安装了各种类型的固定和移动传感器,共计大约1.8万个。除了用于监测空气污染、噪音和其他环境条件,传感器还会在垃圾箱需要清空或路灯烧坏时有所指示,甚至可以指示当附近没有人时,哪里的路灯需要并可以被关掉。而那些埋在路面下的传感器也有其独特的用途,它们可以检测露天停车位,并将信息转发至安装有数字显示器的主要路口,用以帮助引导司机寻找最近的停车位。.

智慧桑坦德(SmartSantander)项目的主要研究人员、Cantabria大学的Luis Mu?oz教授指出,最开始,项目的目标只是让研究人员可以使用传感基础设施,同时向居民提供一些有用的服务。但后来,智慧桑坦德项目开发了智能手机应用程序,让居民能够报告如坑洼一类的问题,并跟踪政府的响应,以使道路更平坦,交通更顺畅。使用智能手机,居民可以利用由位于全市旅游景点、商店、公交车站等处的2600个光学和无线标签组成的“增强现实”系统,方便地在线获得关于这些地点的各类相关信息。

世界各地大大小小的城市都在利用大数据——如交通统计、能源消耗率和GPS地图——启动项目,以提高各自社区的生活质量。在伯明翰,灯柱装有传感器,可以传输有关云覆盖的信息,以提供超本地的气象预报;在挪威,有超过4万个公交车站有twitter,让乘客能够留下他们的经验信息;在伦敦,市长办公室开始给每棵树设置标签,让人们可以了解它们的历史;在麻省理工学院的Senseable城市实验室,西雅图的5000个垃圾被进行地理标记并在全国各地跟踪了三个月,以验证回收是否真的有效。可以说,对象上的传感器让人们以全新的方式讲述城市的生活故事。

当然,最成功的案例之一可能是在2012年伦敦奥运会期间,负责运行伦敦公共交通网络的公共当局机构“伦敦运输(Transport for London)”。在使用者增加25%的情况下,该机构使用收集自闭路电视摄像机、地铁卡、移动电话和社交网络的实时信息,确保火车和公交路线只能有有限的中断,从而保证顺畅的交通。

在电力消费方面,美国西雅图市与微软和埃森哲(Accenture)合作了一个试验项目,以减少该地区的能源使用。该项目收集并分析从市区建筑物管理系统中得来的众多数据集,通过预测分析,找出哪里可以减少能源使用,或者根本不需要能源使用。项目的目标是将该地区的电力消耗减少25%。

在交通拥堵方面,2012年,法国里昂市与IBM的研究人员联手建立了一个可以帮助减少道路上的交通拥堵的系统,使用实时交通路况报告来检测和预测交通挤塞。如果运营商看到可能会发生交通堵塞,就可以相应地调整交通信号,以保持平稳的车流。该系统在紧急情况下尤其有用,比如在救护车前往医院的途中。随着时间的推移,系统中的算法将从最成功的建议中“学习”,并将这些知识应用到将来的预测当中。

另外,在城市中寻找停车位,尤其是在大城市中,毫无疑问是令人头痛的问题。目前有一种为iOS和Android设备开发的应用程序,可以追踪多个城市的停车位。用户只需要输入地址或所在的邻里,就可以得到附近的可用车库和停车位的价格和可用时间的信息。并且,该应用程序还会实时跟踪可用性,实时更新。目前美国已经有七个城市应用此程序,包括华盛顿、纽约、芝加哥、巴尔的摩、波士顿、密尔沃基(Milwaukee)和新泽西州的纽瓦克市(Newark)。

在城市规划方面,利用3D可视化的数据,政府可以看到城市在任何时刻的运行情况,这种以新的方式来呈现数据的方法无疑带来了令人震惊的效果。比如在德国,3D可视模型可以向人们展示一条新铁路线将会给周围带来怎样的影响。这就如何在一个游戏环境中,人们可以把它放在iPad上,随时缩放3D模型。以前,任何人如果想要涉足城市规划,就必须要去一趟市政厅,去看那些他们可能并不理解的地图。而现在,只需要一个应用程序就可以搞定一切。更多的视觉冲击力能彻底改变如何构建城市,它能使决策过程更透明、更民主,设计过程更具包容性。

智慧城市中大数据的安全问题

不管喜欢与否,我们已经开始与我们所生活的城市进行互动,不论是通过短信知道刚刚经过的商店可以提供20%的折扣,还是使用智能手机上的位置传感应用程序得知最近的咖啡吧在哪儿。智能城市的核心功能正是需要收集大量的数据,这些数据关系到我们生活的方方面面,发生在每一天的每分每秒。比如人们在上网的时候,可能很自然的就单击了“是”这个选项,但是却并没有意识自己分享的所有东西都可以被别人收集。再比如一个人从自己的车上走下来要去一家大型连锁超市,那么甚至在他下车前,就已经进入了摄像头的视角;当他的手触摸店门时,他的图像可能已经通过公司的服务器传送给了全世界;当他进入到超市里边时,大数据将会提供一份关于他个人的完备的客户信息,包括购买历史、社交媒体账号、公共记录,甚至是他的鞋码等。可以说,我们就如同盲目地走进了全时被监控着的社会。

本质上说,我们正在建立物理世界的数字拷贝,而这将产生深远的影响:它改变了世界的运作方式,很神奇;但同时,它也很可怕,因为在公共场所、移动设备上和主要零售商店中获取的大量个人数据并没有被共享回个人,使得我们每个人的信息变得越来越透明。也就是说,虽然智慧城市中大数据的收集有巨大的价值,但也会引起巨大的伦理问题。例如,近年来,在关于智能电表和智能电网的影响的争论中,一个重要的组成部分就是对隐私和安全的担忧,而这些担忧也同样适用于智慧城市中的大数据。当智慧城市成为现实时,个人或许将无法控制他们被监控的方式,也不能控制从他们身上收集的信息将被如何处理和使用。如果是这样,那将与智慧城市的预想完全背道而驰。

因此,在智慧城市中,大数据所带来的隐私和安全问题将会越来越受到重视。或许城市会创建自己的隐私保护章程,以纾缓公民的忧虑。但是,其实更大的挑战来自于数据安全,而目前智慧城市的倡导者仍未充分解决这一问题。城市系统日益复杂,在其基础设施建设的新领域中,仪器仪表的使用越来越多,同时系统之间的相互依存性日益增加,所有这些都令城市在面对恶意攻击、系统故障或极端气候事件时变得更加脆弱。为此,城市的领导者必须要确保新系统能够抵御这些威胁,并使其成为城市战略的一部分。并且,未来所有由智慧城市启动的可能,象改善生活质量或提高能源效率等,都应当建立在信息处理的有效性和用户的隐私保障方案之上。

公民是智慧城市重要的利益攸关者、消费者和大数据的生产者。最终,我们希望城市能够通过这些数据来适应市民,而不是限制他们。同时,城市是大数据真正影响的区域。城市规划者和行政机构需要合适的工具来消费城市产生的所有数据,并将其转化为行动,以提高人们的生活质量。在这种情况下,大数据不只是昙花一现或营销炒作,对于选择住在城市中的人来说,它是一种现象,将对生活质量有着直接的影响。明天的城市是在今天建立起来的,而它们的建设离不开大数据。