中国信通院云计算与大数据研究所高级工程师闫树 :城市大数据平台白皮书发布

2019-06-06 18:48:00

vbox11115_AM2I2901_094727_small.JPG

大家好,今天我会详细地介绍《城市大数据平台白皮书》。

为什么写这个白皮书,我们发现最近几年电子政务服务化和智慧城市,发生越来越大的变化。很多电子政务服务化升级到了城市大数据平台。随着智慧城市进入新型智慧城市阶段,信息科技与城市融合的模式和形态正在发生重大变化。通过城市大数据平台可以加速资源整合、提供丰富应用,可以创新城市治理模式、改革政府管理方式,因此中国信通院和企业共同编写了城市大数据平台白皮书1.0版本。

白皮书内容首先介绍城市大数据平台发展背景;第二个是城市大数据平台的发展现状;第三个是技术参考架构;第四是运营模式分析。第五是结论与建议。

白皮书首先介绍了我国新型智慧城市发展的主要的历程。我们国家电子政务做了20年甚至更长的时间,但是智慧城市的建设是在电子政务有了一定基础后才有了相应的模式。2005-2008年,IBM等一些国外的企业就有了智慧城市的概念。

2011年,我国在上海、宁波、广州等一些地方政府通过政府文件的形式,探索智慧城市建设。这个阶段叫做初步探索阶段,也就是以联网或者完善基础设施作为智慧城市建设的主要内容。包括2012年底,住建部批准了国家首批智慧城市试点90个,我们规划部也参与了很多其中的规划。到2014年8月,国务院发布《关于促进智慧城市建设健康发展的指导意见》,标志着我国智慧城市建设进入到了落地实施阶段,此阶段的特点是,越来越多的事情可以在网上办理了,越来越多的城市的服务可以通过智慧城市的建设,获取一些线上的办理方式,从2015年3月,智慧城市首次写入了政府工作报告。这一阶段的智慧城市建设,同样面临很多的问题,比如一些横向系统之间不共享,更多的政务数据的交换共享不是城市应用,或者城市应用仅仅提供的是比较基础的应用,并没有提供大规模的智能化的应用。

2015年底,国家提出新型智慧城市的概念,我们认为智慧城市建设迈入了新的阶段,这个阶段的重要特点是智能。党的十九大提出“智慧社会”的概念。近年来,各省市发布的《新型智慧城市指导意见》,新型智慧城市的建设提出更多更高的要求。

新型智慧城市的核心是数据,或者是数据驱动,智慧城市也在从网络化、数字化迈向智能化。大数据是其中一个很重要的战略资源。城市运行必将产生很多的数据,不管政务的数据,政府治理、交通、医疗等。

白皮书对城市大数据首先有一个定义,城市大数据等于城市数据+大数据技术+城市职能。城市数据是海量的异构、快速变化的。大数据技术就是各种企业用到的尖端的技术也在逐渐的落地使用。城市大数据也跟城市职能分不开。新型智慧城市的建设同样离不开城市大数据的建设,各种政通、惠民、兴业的建设,都需要智能感知技术、统计分析技术、数据挖掘技术、分布式存储技术、实时动态可视化技术等等的技术支持,从数据收集、数据整合、存储、分析都离不开大数据的支持。

新型智慧城市发展面临三个问题:第一是信息系统烟囱林立,阻碍数据共享。多年的信息化建设使得每个部门都有一套自己的信息系统,系统之间是孤立的、未经整合、片断化的。系统之间横的联系非常薄弱。

第二是数据治理普遍薄弱,使得数据价值大打折扣。涉及到的城市数据内容很多、类型很多,结构也非常不一样,所以政府往往缺乏政务数据治理的经验。所以对于收集上来的数据,更多的是存着,而它的使用还没有发挥很多作用,我们对于数据拿到手以后不知道怎么治理,不知道怎么样质量提升,不知道怎样清洗,所以数据缺失、数据失真、数据过期、效率低等等现象都略有存在。

第三,数据管理水平不一,缺乏整体联动。国家政务长期存在纵强横弱,公安、税务、海关、工商纵向管理的部门,它们之间的数据打通的比较好,上传下达做的比较好。横向之间各职能部门之间基本上没有什么太多的数据的交互。实现城市功能往往需要多部门的数据智能化的共享,所以这方面就需要现有的电子政务的共享交换系统还做不到。

所以我们认为,需要通过建设城市大数据的平台,破解上述智慧城市难题。城市大数据平台可以强化跨部门、跨行业的组织统筹力度,提升信息资源整合水平,全面加快城市信息资源的有序汇聚,深度共享、关联分析、高校利用,为政府、企业、和市民提供跨层级、跨地域、跨部门、跨业务的协同服务,最大程度的展现城市智慧,把城市大数据平台总结为四个点:横向贯通,这个是智慧城市重要的一点,不同部门之间的数据一定要贯通。第二,集中建设,实现了横向贯通,建设初期就考虑如何贯通,怎样共享。第三,统一运营,城市大数据平台运营者是城市高级管理部门,不光是某一个单独的部门来运营,所以不管是建设还是运营来讲,都有了统筹规划,可以更合理的使用。第四,一站服务,对于城市大数据平台使用者来说,以及对于广大市民来说,它的服务都是一站式的。

我们总结了很多建设城市大数据平台的意义,比如通过数据汇集加速信息资源整合应用,通过精准复杂提供政府公共服务水平,通过数据开放助推城市经济力量的发展。

白皮书里统计了我国36个主要城市,直辖市、省会城市、副省级城市的政务或者城市大数据平台建设情况。像北京、上海、杭州、贵阳、南宁、福州、海口、广州、宁波、深圳根据公开的资料,它们已经开始建设或者说已经建设完成了一部分,但是建设完成也都是一期城市大数据平台相关的建设。其它16个城市基本上处于政务平台的建设阶段,有的已建成,有的还在建设。

其它的像雄安新区、苏州、衢州也在启动城市大数据平台建设。它的功能落点主要是政府部门之间的内部数据共享还是应用于整个城市运行的智慧服务。另外城市大数据平台一个很重要的功能就是城市数据的开放,我们对主要城市数据开放情况做了调研,这里面的研究我们也做了很多年了,发现36个城市里,11个城市没有开放平台,25个城市已经建成了开放平台。

这几个城市平台都已经建成了开放平台。我国主要城市大数据主管机构也进行了分析,36个城市里有32个已经成立了专门的大数据管理机构,大数据局或者是一些大数据中心,它可能有政府组成部门,级别比较高的,比如说人民政府管辖的政府有关部门;或者是政府直属机构;还有政府部门管理机构,在办公厅下或者这样的一些机构,我们对这些情况也进行了统计分析。城市大数据平台的建设,往往需要城市级的管理者,所以有一个强有力的具有城市大数据平台建设职能的机构来进行一个管理,对于城市大数据平台的建设会起到很关键的作用。

白皮书还专门对于城市大数据平台的技术进行了参考架构的解读。因为各个城市目前建设的城市大数据平台,它本身的建设模式和建设的参考架构是非常不一样的。我们把诸多城市的政务系统平台的架构进行了一个总结,我们认为目前在这个城市大数据平台建设中,比较需要考虑或者可以用来作为推荐给城市大数据平台建设者使用的参考架构。

城市大数据平台是建立在城市云平台基础上,云平台为这个城市大数据平台提供了云服务器、云资源等,其实我们这里面省略了数据如何搜集的,这个是比较关键和麻烦的事情,这是技术架构解决不了的问题。我们假设这些数据现在已经有了这个对应的收集的方式,收集到了城市云平台。在城市大数据平台进行一个从底层的清洗到管理开发,到对外提供,城市大数据平台解决的是这样的问题。而从城市大数据平台出去的数据,是我们很容易接触到,而且具有良好的结构的,能直接用来应用的,或者相当于面对前台的可以对外提供公共服务、医疗、教育、交通、社区服务、产业等面对城市提供的服务。

我把城市大数据平台架构给大家说一下。我们把它看成若干关键的系统,管理开发系统、业务支撑系统和数据开放系统。

首先是管理开发系统里面,数据共享交换、数据集成、数据治理、数据开发、数据开放。包括快速构建分布式的数据交换网络,云平台上的数据通过交换系统进行数据的横向交换,以数据目录的方式提供给上层,这样同时提供一些展示窗口和配置运行多种模式的交换任务。

第二个数据集成,将各方数据进行集成,帮助城市大数据平台平滑获取政务、公共安全、企业、运营商、互联网相关的结构化、半结构化、和非结构化的数据。城市大数据平台区别于传统的电子政务平台,更重要的不光是内部数据,还有外部数据,包括外企数据、公共数据,需要专门的集成部门进行集成化,从而达到数据的统一协调。

第三是数据治理,这是很关键的部分,我们将分散多样化的数据通过汇集、标准化、清洗等操作对数据质量进行全面的提升和监控,像数据质量管理我们有对政府数据治理的一套方法论。数据开发,数据开发提供数据作业的开发、测试、生产、运维、数据挖掘分析功能,作为系统角度,对我们收集到的需要治理的数据,如何进行开发和协同。数据开放,对外提供数据的方式,像数据直接共享式以及接口调用等等对外提供开放。

大数据资源中心,包括归结库、主体库和基础库。归结库相当于技术架构,前置机的那种库。基础库就是人口库等,可以各个部门频繁调用的部门。主题库就是依据业务领域经济分析、经济运行等等具有主题色彩的数据库。

数据智能系统,面对智能化业务需求,主要承担复杂的学习预测类智能需求研发。城市平台的运行经常会有智能化的需求,我们本身也不知道它应该通过怎样的算法和分析实现,就会用相应的智能性的平台来开发,解决一些相应的需求的问题。

数据安全系统,包括技术安全加固、数据资产安全管理、数据安全风险控制、统一化安全运营管控等等。

业务支撑,主要实现统一用户认证及统一支付功能,账户管理和支付的功能。

除了这些组件之外,往往需要建设运维支持的系统和标准规范体系等等,通过这些系统来保证支持我们的平台运行。

白皮书里以深圳为例,深圳提出的从支撑、平台的应用的新型智慧城市一体化建设格局。包括一个支撑、两个中心、四大应用、两个保障,这个我们是认为各地当中做的很完善的,也是值得推荐的架构。

运营模式方面。政府主导型、政企合作型、企业主导型。政府主导型,政府可以充分发挥其宏观调控和协调沟通的作用。政府主导型在数据安全可控性方面是更方向。但是技术和场景应用方面有所欠缺,以及真正的拓展能力不太够,比如说上海市数据共享交换平台就是政府主导型的。

政企合作型,充分利用政府地区资源,也充分发挥企业技术优势,但是也带来一个问题,政企之间易产生管理分歧,导致平台开发建设受阻。比如杭州的城市大脑,以阿里巴巴为主的11家企业共同开发建设的平台。企业主导型比较少,这种建设模式下企业技术优势可以得到充分发挥,但是整体采购成本较高。我们没有找到城市的例子,但是数字广东大概属于这个运营模式。不同的城市可以根据自己不同的特点,比如自己的信息化基础,自己对这个需求的明确程度,然后自己的采购预算等,来选用自己合适的企业。

白皮书的结论与建议,目前我国城市大数据平台建设仍处于探索阶段,各地纷纷在管理机制、业务架构和技术能力方面积极创新。未来还需要通过多方面的机制未来加强建设与运营。我们六个方面的建议,强化平台顶层设计,完善平台配套保障机制,加强数据管理,因地制宜开展平台建设与运营,开展城市大数据综合评价,加强平台数据安全保障。这也是我们后期要做的主要的工作。

白皮书的参与单位包括数梦工厂、阿里云、优刻得、新华三、联通大数据等等。对于这些企业表示感谢。

接下来我们将会以白皮书为基础,继续深入研究,对白皮书的内容进行更新迭代,同时制定相关的城市大数据平台和政务大数据方面的标准体系,以及相关的一些亟需的政府的标准,另外对各地政府建设城市大数据平台的规划提出建议。另外我们还会制定评估城市大数据平台建设的评价指标体系,另外与各地政府深度合作,配合建设需求。也诚挚的邀请各地政府、专家参与我们白皮书的撰写,共同助力与城市大数据平台的建设。谢谢大家!