孟庆国清华大学 清华大学教授孟庆国:大数据环境下的政府数据统筹和整合

2018-01-27
字体:
浏览:
文章简介:清华大学教授孟庆国:大数据环境下的政府数据统筹和整合清华大学 教授 孟庆国 大数据环境 政府数据 整合数据派本讲座选自2015年11月29日清华大学公共管理学院孟庆国教授在清华RONG系列论坛之六---大数据与政府治理研讨会上所做的题为<大数据环境下的政府数据统筹和整合>的演讲.孟庆国:大家好!今天要谈大数据,又要谈政府治理,尤其是依托数据研究院的RONG论坛,这其中蕴含着交叉中的融合.融通含义.所以,今天就政府数据的融通问题,跟大家做一交流.前一段时间国务院颁布了大数据发展纲要,其中有一个重

清华大学教授孟庆国:大数据环境下的政府数据统筹和整合

清华大学 教授 孟庆国 大数据环境 政府数据 整合

数据派

本讲座选自2015年11月29日清华大学公共管理学院孟庆国教授在清华RONG系列论坛之六---大数据与政府治理研讨会上所做的题为《大数据环境下的政府数据统筹和整合》的演讲。

孟庆国:大家好!今天要谈大数据,又要谈政府治理,尤其是依托数据研究院的RONG论坛,这其中蕴含着交叉中的融合、融通含义。所以,今天就政府数据的融通问题,跟大家做一交流。

前一段时间国务院颁布了大数据发展纲要,其中有一个重要的一个话题,就是大数据的整合问题,也是我要讲的数据统筹问题。在该纲要的指导思想部分,第一句话强调了大数据的统筹发展问题。纲要的核心任务第一条也阐述了信息共享和数据资源整合的问题,并给出了一个非常明确的目标,即到2017年底解决跨部门的数据共享问题。

其中的专栏部分也都是提到了数据的整合与共享问题。所以,数据的统筹很重要。当然,这个问题很难,也是一个老问题。我今天主要是把问题抛出来,并试图给出一些数据统筹的思路,不一定对,欢迎大家批评指正。

主要讲三个方面的问题:

第一,为何要讨论政府数据统筹问题?

第二,政府数据统筹要考虑的因素和主要思路是什么?

第三,政府数据统筹如何布局,尤其跨层级的数据如何统筹。

在数据资源规划中,长期以来存在有两种思路:一种是基于政府现有的职能构架来进行数据信息资源的规划。另一种是基于外部用户的需求,从外部需求角度来进行数据资源规划问题。

如,美国BSI给出的两种思路:从部门职能到服务提供的规划思路,和从服务需求到部门的数据资源规划思路。

所以我们把第一种叫做叫从职能到服务的模式,也称为“自上而下”的模式;第二种为基于外部需求来进行数据资源的整合,强调以服务来定职能的思路,即“自下而上”的模式。美国BSI对这两种模式进行了深入讨论,一个是从原有各个部门提出构架的角度,来规划应该如何提供和展现服务。

另一个是,从外部服务需求的角度看,反过来规划、整合政府部门的职能结构、业务流程和数据资源。这两种思路,是非常不一样的,不能简单的理解为同一系统结构下的两种不同形态,而是两种不同的结构,因而也有着不同的路径。

在政府职能构架导向(自上而下)的思路中,政府部门有内在的动力,因为这是以政府部门为中心的、供给式服务方式,在不改变政府自身的职责结构、甚至业务流程的情况下,通过信息化手段实现局部的服务提供。在这一思路中,会存在受制于政府部门自身因素,使得数据信息的整合不能到位,容易导致信息孤岛、服务分割等问题。

以服务需求导向(自下而上)的规划思路,恰恰是从政府部门外部的需求视角,规划服务的提供。这种基于外部需求的规划和整合,反过来会要求政府部门内部的业务流程、组织结构、信息资源的整合等进行变革,以实现公众为中心的服务模式。这种方式的实现,在某种程度会带来政府的变革或革命。这两种思路,我们该走哪一条?

大数据发展纲要中,强调了这一问题的重要性,明确提出实现跨部门共享的目标。但是,我认为纲要里面没有给出解决问题的答案和思路。我们的路该怎么走?

政府数据统筹的问题就变得有为重要和关键。

如何来思考政府数据的统筹规划问题,我们能不能先回到问题的起点,即先从单个部门的数据来考虑这一问题。

可以把单个部门所拥有的数据画一个圈。这个圈里面有三类数据:一是需要与其他部门共享的数据。这些数据需要和其他的业务部门之间进行共享,以实现业务的协同。如果这类数据解决不好,可能会出现审批中的重复验证的问题,如在各部门办理事项中需要证明“我妈是我妈”的问题。二是需要向社会和企业开放的数据。大数据环境下,政府把数据开放出来,可以激励创新,促进市场和社会的活力,增加创新的空间。

所以我把大圈里面画了两个小圈,一个圈表示需要共享的数据,另一个圈代表要向社会开放的数据。当然这两个小圈这样画,是有争议的,因为有人讲能开放的数据一定是能共享的,共享数据圈应该包容开放数据圈。其实,开放和共享是两个概念,一般认为它们之间的关系是,能共享的不一定能开放;能开放的应该能共享。

我的观点是,能开放的也不一定能够共享,或者有必要共享。有一些数据对别的部门不敏感,但对社会很有用。能不能先把这个数据开放出来,我想应该是可以的。

但是这个数据要实现部门交换,可能一下子还实现不了。所以,我还是分成了两个圈,而且这两个圈是交叉的。将来数据开放与共享都做到位了,可能共享数据圈里里面是包括开放数据的。除了共享和开放数据之外,还有部门自有的数据,这些数据由于保密等的原因,既不能共享,也不能开放。或者,也可能由于用途不大,别的部门不感兴趣,也没有向社会开放的价值,这类数据我称为部门自有的数据。

需要共享的数据必须有数据共享平台,这里面要涉及到数据资源目录、数据交换体系、数据授权管理体系等,目的是为了实现与其他部门进行业务协同。需要开放的数据必须有数据开放平台,这里面涉及到数据的开放评价机制、清洗脱敏机制、定价交易机制等,目的是实现数据的安全、有序开放,进而促进数据的开发和利用。

这些问题理清楚之后,我们才能很好地进行政府部门的数据规划和整合问题。传统数据管理模式都是以各个部门为主的方式,在物理分散是分散的。每个政府部门都在建自己的数据中心,而一站式服务通常强调以数据的逻辑集中来实现。但由于建设标准、部门利益等方方面面的原因,物理分散、逻辑集中的方式存在很大的问题,必然导致信息“孤岛”、数据“烟囱”、重复建设等现象的普遍存在。

导致信息和数据物理分散的格局根本原因是政府职责结构,即分割化的部门设置和上下重叠的职能配置。这个问题不是技术、不是信息化本身的问题,是政府体制和结构固有的东西,这种政府体制和结构配置给信息化的建设带来了非常大的制约,是深层次的问题。

首先,政府职责同构一定会带来信息化领域低效配置、重复建设。其次,政府条块分割必然会导致信息资源分散建设和信息孤岛的问题。所以,从数据资源的整合上,必然面临,横向部门间的数据“聚不了”、“通不了”;纵向政府层级间数据“上不去”、“下不来”。

很多地方政府都曾对这一问题进行了探索。佛山市南海区的数据统筹主要是实现区级部门间横向的统筹,主要是解决部门信息不能共享的问题,解决行政审批和办理服务中重复的提交材料、相互印证的问题。安徽芜湖的社会服务管理信息化平台也很好地尝试了这些方面的探索。

南海实现横向统筹的同时,也面临着与条上数据的整合问题,如与市、区、镇、村联动的城管系统的数据整合存在问题,作为区的城管是按照四级联动自上而下方式的来统筹数据,还是按照区一级即南海统筹局的方式与各个部门统筹数据。在类似情形下,一些政府部门则被夹在了中间,同时面临着多个平台的问题。

我们应该如何思考这个问题?究竟数据如何统筹。是应该如南海区一样,每一层级进行每一级的数据统筹?还是向贵州的思路那样,全部集中整合到省级统一平台上?还是,应该走第三条道路,统一统筹跨层级政府数据的整合问题,即省、市、县等各层级之间应该有不同的定位和角色。

我们初步的判断是,各级政府既不能孤立地进行本级部门的数据统筹,也不宜把各级政府的数据完全统一到某一级政府平台上去。如何要进行跨层级的统筹,应该考虑哪些因素呢?我们认为,要考虑三个方面的因素:一是技术;二是数据属性;三是各级政府职责与职能。

从技术上看,主要取决于网络技术的支撑能力,如带宽、载荷各方面的情况。我们调研了三类情形:公共服务的访问、信息管理及流程类应用、业务数据管理应用,我们发现基于不同类型的业务应用对技术资源的需求不一样。所以,技术条件决定了不同类型的数据应该放在哪一层更合适。

这张PPT是我们对贵州的初步调研基础上形成的对不同应用清晰的数据适合于统或分的情形。

从数据属性上看,基于数据的溢出效应,也可以判断数据统筹至哪一级平台上更为合理。省级平台统的应该是基础性、宏观性、统筹性的数据;市级平台应该统交叉性的、共享性的,或者地方应用比较多的数据。这些数据可能不一定都要往省里统,再说统到省里导致的使用成本也可能很高。

国家大数据发展纲要里明确说将来不再进行地市以下的系统审批,我个人认为这句话说的有点绝对。不需要每个县都建设数据平台,但是有些应用专有性、属地性、特色性很强,此类数据,可能建在县里可能比较好。

比如说一个县,有旅游特色,非要把与此相关的数据都放在省上,可能没有必要。再如,县里某一街面的摄像头数据,下水道井盖数据,可能别层级政府也不会太关注,可能就没有必要统到省里面去。所以,要考虑数据的溢出效应,进行数据的统筹布局,有些数据适于放在市级节点,有些数据放在省级节点更能发挥效用。

基于这种思路,我们把数据按照数据的外溢价值和政府的层级两个维度划分成四个区域,据此可以直观分析各类数据的统筹问题。

从政府职责履行上来看数据统筹。各级政府都有明确的职责体系,对政府职能进行精耕细作,就能摸清每个部门到底有哪些职责事项。对不同职责事项所涉及的数据要具体分析,看看如何进行数据的统筹。如各种规划的管理、产权、国有资产、灾害、人事劳动关系等数据在省级节点比较合理,像基础性的建设管理、市政市容、园林绿化、社区管理等数据还是在地方节点上比较合理。

财政的收支管理、价格管理等不好判断的类别,还要做进一步的专门讨论。交叉性、共享性比较强的数据,如住房、社保、社会救助、生产过程这些对各级政府都很重要,那么在各层级之间可通过目录交换来实现统筹。

对管控度高、复杂度高的数据统筹起来意义很大。对管控要求高、横向关联强的业务数据,加强数据的统筹就很必要。

基于这种考虑,从一个省级政府来看,省里面有省里面的数据统筹的平台;地市有地市的平台,每个地市是不是一样,地市更多的是属地性、专有性的平台。一些特色县,也可以有自己专有的、特色性的平台。但绝不是上下一般粗、各地完全一样的数据平台,而是完全基于政府职责的更好地履行和数据得到最好利用的统筹方式和思路。

基于这个思路,我们应该是:“统一的建设,分类的部署”的思路。如,省级统一建设平台,根据地市、县的业务和数据的特点,适当部署分节点,来满足地方业务的需要。既然要统,就要统一审批,减少重复建设浪费。不需要统的数据,需要统一的标准,保证交换和共享。即使对区县平台,同样要统一布局,将来都纳入到整个省级平台框架体系里来。这样才能发挥好各政府的效用,同时又能发挥好数据聚集的效应。

“分”的问题,是指在部署上是分散的,即利用云的理念,在市和县上部署一些节点,强调管理权限和部门的法定职权。因地制宜,按照统一标准,自主开发建设地方特色云和专有云节点。

跨层级数据统筹平台建设“统分结合”的思路,能够处理好不同层级政府间的数据整合问题,从而打破数据空间上“职责同构”和“条块分割的局面。

跨层级的数据平台的统分结合,根本性的目的要避免在数据层面上的条块分割。数据平台既不是原有部门层级机构的映射,也不是完全把政府业务数据全部集中整合。所以,其总体思路,既不能自上而下的,也不是自下而上的。我们主张的就是第三条道路,即按照“统分结合”的思路来规划各级政府的数据问题。

以上不对的地方,请大家多批评指正。谢谢!