www.T1soft.com

 

首页 | 关于我们 | 软件产品与服务 | 解决方案 | 技术理论基础 | 成功案例和科研成果 | 动态和评述 | 联系我们 | 留言簿 

 

  

加拿大经验与中国统计数据库建设

作者:贾淑君/国家统计局计算中心  摘自:中国统计》

  

 

  根据中国一加拿大统计信息管理项目的要求,国家统计局和加拿大统计局认识到,有必要建立国家统计局统计数据库,旨在帮助国家统计局进一步开发统计数据库系统,使之成为向各类用户及时、高效、全面发布官方统计数据战略的组成部分。为此国家统计局把大型宏观数据库作为中加合作项目包含在国家统计局数据库建设总体框架中。“大型宏观数据库”是为建立一个中国权威的官方社会经济综合统计数据库,将国家统计局和其他部委统计部门产生的所有官方社会经济统计数据(年度数据及普查和不定期调查的数据)存储在一个数据库里,并同元数据相连接。该数据库通过因特网和其他电子媒介向外发布,服务于国内外用户。为了更好地完成《国家统计数据库系统建设总体框架》规定的系统建设目标,我们把大型宏观数据库实现重点定在数据管理和发布应用;核心是数据管理和应用;数据存储重点是存储年度和普查数据;服务对象是政务内网和外网。

  大型宏观数据库,是国家统计局数据库建设“一期工程”的核心内容,是整个国家统计局数据库建设的基础工程。它的成败关系到国家统计局数据库建设的成败。我们通过与加方的合作,在技术上很有收益。加拿大经验在国家统计局大型宏观数据库系统中的应用主要体现在以下几个方面:

  一、多维概念的应用

  在大型宏观数据库设计中,我们深入学习了加拿大统计信息管理数据库CANSIM工工数据库的多维结构,并认为这种结构是和加

拿大的基本国情和统计制度相适应的。我们根据中国是发展中国家的基本国清和统计制度经常变化的具体特点,采用多维数据库的

理念,自主设计了具有中国特色的数据库结构,支持各种多维结构的操作和应用,同时又支持随机灵活的查询。

  维就是相同类数据的集合,也可以理解为变量。对于统计数据来说决定某一数据点的含义主要有四大要素:指标、时间、地址、单位,这些要素组合后成为限定某一个数据点的条件。而每个指标、每段时间、每种地址等都是某摊的一个成员。每个数据点由一个特定的指标、特定的时间、特定的地址、特定的分组等组成。在宏观数据库设计中我们引入维的概念把决定数据点意义的每一个属性作为一维,那么对于一个数据点就由多维去定义,而且数据点的维数理论上讲是不受限制的,比如说对于一个数据点除了上述四大要素外还应该有专业、报告期、分组等。这样用这种多维结构定义数据点,就能充分实现数据的灵活查询。这种强大的数据查询功能在大型宏观数据库系统中就得到了充分体现。这种多维结构的概念从根本上解决了我们实现跨专业、跨表灵活查询的问题。同时多维结构是决策支持的支柱,也是OLAP(在线分析处理)的核心。这对以后我们数据库的扩展很有意义。

 

  二、指针式结构的应用

  在数据结构中,一个指针变量所存储的信息是一个对象在内存中的地址。通过指针间接地访问对象。我们通过学习加方的经验把这种指针概念引入到我们数据库结构中,对指标、分组、地址的数据结构定义中,我们利用父指针、左指针定义这些数据间的前后、左右位置,并利用指针进行排序,这样克服了对指标、分组、地址等元数据的编码给我们带来的许多弊病。和顺序编码结构相比,指针式结构空间上不受限制,管理模式稳定,管理规则简单,为编制程序创造了良好的基础,为实现工作的高度自动化创造了有利条件。虽然在编制程序方面难度会增加,但是总体上说这是一种先进的思想和模式,具有很强的灵活性、稳定性、可扩充性,在各方面的应用具有广阔的前景。

  以指标为例,以前我们对于统计指标都采用指标编码来管理,这种管理有两种不利:1.在两个连续编码的指标之间无法插入新指标。2一旦完成对指标的编码将无法调整指标间的顺序。指针式结构的应用使指标的管理不再依赖于编码,而是用指针管理指标间的关系,不但解决了上述问题,而且使管理更加灵活可靠。

  

  三、数据发布自动化规范化思想的应用

  以前我国的数据发布规范化的思想不强,随着世界货币基金组织数据公布通用系统GDDS的加入,和对加拿大CANSIMII数据库系统的学习,我们对数据发布的自动化和规范化思想得到了很大的提高。我们已经着手进行制定有关的数据发布业务规则,在数据库系统中开发了相应的程序,数据发布自动化规范化的工作得到了很大的加强,并力争逐步地实现真实、准确、及时、全面地反映统计数据,以便于政策制定和分析。

 

  四、全程监理开发模式的应用

  在国家统计局元数据库和数据库工作协调小组领导下,2002年成立了数据库研究和开发工作组,负责组织国家统计系统数据库的研究和开发工作,我们的工作方式是与软件公司共同开发,做到优势互补。通过政府招标的方法,选出有实力的公司进行宏观数据库的软件开发工作。在开发过程中我们借鉴加方的经验,国家统计局数据库研发组技术人员要负责系统的需求方案、系统的总体设计和开发中监督、管理和协调工作;公司负责具体的软件开发工作。研发组要全程监理,只有这样才能保证整个系统的延续性。

  在开发过程中,为了保证项目的顺利完成,研发组对该项目实施了严格的规范化管理,并严格按照软件工程实施项目,对开发人员职责和要求作了详细的规定。对如何组织开发软件项目,使之更加快速、有效的完成,整个项目分成以下几个阶段进行:项目计划阶段、需求分析阶段、软件开发阶段、测试阶段、管理软件开发过程。这是对开发模式规范化的一次重要促进。我们从加拿大统计局扎实的工作作风和完善规范的工作流程中吸取了经验,引进了对开发过程进行监理的概念,是整个开发过程完全置于国家统计局数据库开发组的监督之下。开发过程中,注意文档和程序的同期建立,加强了后期的验收工作,各项工作都努力按照加方提出的严格要求去做,整个数据库设计、开发、验收等各项工作的水平和规范化程度得到了很大的提高。

  数据库研发组进行了大型宏观数据库汇报演示。14个业务司、队、中心,32人参加了演示会。2003年7月开始对14个专业司92人次进行了数据库培训;目前已有4个专业司在数据库中加载了多个年度的综合数据,并在内网上实现信息共享。

  目前该项目已通过了加方的总体验收。正是在加拿大专家的指导下和数据库研发组人员的不懈努力下,我们觉得大型宏观数据库在设计上充分考虑了目前统计方法制度的变革、各个专业的业务流程和统计数据的不同特点,具有很强的适应性;功能上完全能够满足统计业务的要求;操作上采用了结构清晰的树状结构以及灵活的“拖放”方式,使操作简捷灵活,界面友好,能够广泛适合各类统计工作人员对数据库的操作。

 

  

首页[1]末页

 

版权所有 ©2003 中国人民大学统计数据库研究室