云栖手记(2):杭州城市大脑背后的三重意义

2016 年云栖大会媒体采访间,阿里云总裁胡晓明被问到的第一个问题就是:这一年感受到的最大变化是什么?胡晓明不假思索地回答:「人工智能」。

事实上,过去一年来阿里巴巴和阿里云在人工智能领域的确做了不少探索。从小 AI 机器人预测「我是歌手」冠军归属到进化版的 ET 发布,以及淘宝 Chatbot 客服机器人,而到了一年后的 2016 年云栖大会上,阿里云更进一步地推出新「产品」——参与到杭州政府的项目中,共同研发杭州城市数据大脑。

所谓城市数据大脑,简而言之就是利用人工智能技术,形成以数据为驱动的城市决策机制,根据实时数据,调控调配公共资源。根据阿里云的官方说法:「城市大脑的目标,是让数据帮助城市来做思考和决策,将杭州打造成一座能够自我调节、与人类良性互动的城市。」

表面来看,阿里云的城市数据大脑项目十分类似过往的智慧地球、智慧城市理念,但在本质上,两者又不同。某种意义上看,智慧城市搭建了一系列看似智能的硬件平台,但即便是这些标榜智能的硬件,倘若期间没有互联、没有数据交换,充其量不过是市政工程的摆设罢了。但城市数据大脑,则以数据为核心,依托海量实时数据的分析、建模,帮助政府各部门做决策,最终能够影响到普通市民的方方面面。

更进一步看,城市数据大脑项目在人工智能落地、政府数据开放、新一代城市规划发展方面都会产生深刻的影响。

技术层面:人工智能能否落地的试验场

人工智能真的很火,火到几乎任何一家公司都在宣扬自己在研发人工智能。但在众多普通消费者看来,除了 AlphaGo 带来的那几声「Wow,原来人工智能这么厉害」,人工智能似乎又离普通人很远。

原因不难理解。当下基于海量数据喂养的机器学习、深度学习需要巨大计算能力支撑,已非普通所能承受。过去一年来,不管是亚马逊、微软还是阿里云,相继开始在云端处理这些数据,这种将云计算与人工智能结合的思路逐渐成为业界共识。

如果细心去看杭州城市数据大脑的架构,你会发现这个城市大脑就是由「云计算+人工智能」共同组成:

  • 数据采集系统:不同终端的海量数据源源不断进入系统平台;
  • 数据交换系统:通过将不同终端、不同政府部门、不同商业公司的数据进行融合加工,形成多维度的数据;
  • 开放算法平台:利用强大的计算能力为数据建模;
  • 数据应用平台:将算法形成的决策快速输出到各个应用场景中。

上述四个系统构成了一个数据「输入——处理——输出」的闭环,更重要的是,城市数据不仅数量大、多种多样,而且具有实时性。比如此次城市大脑第一个要攻克的难题就是应对杭州的交通拥堵,城市交通涉及方方面面,而且实时变化,这些都需要强大的实时计算能力,才能保证快速输出结果,形成决策。

另一方面来说,杭州城市大脑也会成为当下基于深度学习的人工智能可否落地的重要试验场。就目前的深度学习进展来说,其真正能发挥作用的场合有很大局限性,要么停留在一些细分领域,比如将图像、视频识别与广告、安全的结合,要么通过非实时的方式,不轻易影响终端用户,比如一些利用深度学习识别图片的相册应用。但在城市这个复杂体,即便是城市交通这个领域,海量实时数据的处理需求、终端用户可实时感受到的影响,这些挑战也会成为深度学习快速成长的机会。

政策层面:城市数据开放后的想象力

过去几年,大家都在谈大数据、大数据公司,但真正的大数据拥有者只有一个:政府。

当人类由信息时代步入数据时代之后,数据成为一种资产,甚至一种自然资源(王坚博士语),政府理应开放这些数据,不仅能够提升政府工作透明度,更能够推动在数据——这个新时代资源基础上的创业创新。

2011年,在美国政府的倡议下,全球正逐渐形成「数据开放联盟」,40多个国家和地区纷纷加入该联盟。美国政府更是在 2013 年启动「开放数据项目」,要求公开教育、健康、财政、农业等七大关键领域数据,并对各政府机构数据开放时间做出了明确要求,同时向社会开放更多政府API,让开发者可以各方便地利用政府数据创造潜在经济价值。

在中国,尽管早在 2011 年上海市政府就开始试点政府数据开放计划,包括上海市公安局等 9 个市级部门参与其中,但由于缺乏宣传,外界并不知晓。直到 2015 年 9 月,国务院正式发布《促进大数据发展行动纲要》,纲要首次在国家层面推出了「公共数据资源开放」的概念,将政府数据开放列为了中国大数据发展的10大关键工程。纲要规定,2020年底前「逐步实现信用、交通、医疗、卫生、就业、社保、地理、文化、教育、科技、资源、农业、环境、安监、金融、质量、统计、气象、海洋、企业登记监管等民生保障服务相关领域的政府数据集向社会开放」。

此次,杭州城市大脑计划进一步将政府数据开放落实到实处。除阿里云外,还有 12 家企业参与了城市大脑计划,这些企业从不同领域,比如阿里云提供计算能力、中移动/联通提供网络能力、海康威视提供图像视频捕捉能力等等,结合各方不同的技术优势,共同挖掘、分析杭州的城市数据,这对今后城市数据平台的搭建和完善具有积极效应,而随着数据成为一种资源,新一代的创业公司,完全可以依托数据开始创业,比如当城市交通数据成为可随时接入的 API 后,创业公司在产品设计时就可以直接拿来主义,极大节约了产品研发的宝贵时间,大幅提升产品开发速度。

更重要的一点,城市数据多种多样,不同维度下呈现不同的存在形式,再加上中国广阔的市场和巨大的城市人口流动,这些都将成为推动中国新一轮创业热潮的巨大红利。从这个角度来看,杭州城市大脑计划可谓开了一个好头。

城市发展:如何成长为智慧有机体?

城市堪称人类伟大的创造,而现代城市则完全由交通塑造。火车的出现催生了第一批现代意义的城市,而汽车工业进入大规模生产后的直接结果,则是带动全球意义上的城市扩张。随之而来的,则是所谓的「城市病」——人口、工商业等资源等过度集中到中心城市,而大城市不同城区之间的资源分布不均又导致各种「睡城」的出现。

很长一段时间以来,治理城市病的思路是开辟新道路(梳理交通),建设新区(疏通人口)、规划新商圈(调配商业),但倘若让城市看作一个得病的有机体,上述方法更像是西医疗法里的头疼治头、脚疼医脚,没有从根本上了解病情。这并非治理者不努力,而是随着城市快速发展,人类治理者在决策机制上无法适应城市的需求。

美国学者简·雅各布斯在《美国大城市的生与死》里论述了城市规划者如何异想天开地希望通过自己的规划,让贫民区消失掉,但事实却恰恰相反。尽管雅各布斯更倾向于对城市社区自然而然发展的偏好,但这妨碍我们从另一个层面切入城市发展:数据。

如上文所言,传统城市治理的方法从未将城市看作一个整体,局部的改造对于城市发展不仅没有好处,甚至加剧城市问题。而从整体上分析城市问题的第一步就是收集海量数据。过去几年,中国城市规划者们对于数据采集方面的投入非常巨大,比如为了治理交通堵塞部署了大量交通监控摄像头,但另一个问题又凸显出来,这些摄像头采集到数据如何与其他数据,如红绿灯数据、道路导航数据进行整合。此次云栖大会上,一手缔造阿里云的王坚博士直言:「世界上最远的距离是红绿灯与交通监控摄像头之间的距离,他们虽然在同一根杆子上,但是从来没有通过数据被连接过。」

以杭州为例,仅视频摄像头就有 5 万多路,这些摄像头每天产生的海量数据,需要实时与其他数据整合,从而构成城市路网的立体数据平台。当不同设备、不同政府部门的数据最终被打通,一个城市的真实面貌也将最终呈现在决策者面前,在这个基础上,无论是交通规划、城区建设还是商圈拓展,一切都围绕时刻流动的数据来展开,实时调整,实时优化。这是新一代城市规划的最终方式,也是唯一方式。

中国城市化已经走到一个新的阶段。2014 年,李克强总理在人大工作报告中提出,要「促进约1亿农业转移人口落户城镇,改造约1亿人居住的城镇棚户区和城中村,引导约1亿人在中西部地区就近城镇化。」对地方政府而言,人口落户城市绝非单一事件,随之而来的交通、就业、医疗、教育问题也将凸显。杭州城市大脑计划作为全球首个以数据智能驱动推动城市发展的项目,或将成为城市决策者们手中新的利器。

对很多人来说, 人工智能似乎离他们生活很远,然而人工智能却又离他们很近,一如那个经典的人工智能悖论:「当人们对某个人工智能习以为常时,它也就不再是人工智能了。」在我们生活的城市,人工智能正在或即将改变城市运作的内在规律,感谢云计算、人工智能让我们第一次了解到城市的真实一面。随着数据越来越多、计算能力越来越强大,机器的算法也会越来越聪明,接下来,就是见证奇迹的时刻。


延伸阅读

云栖手记:七年后,阿里云能否成为中国公司撬动世界的变量?