|
COGNOS是一家专门进行商业智能软件开发的独立软件制造商。Cognos系统是这家同名公司的一个比较成熟的产品,Impromptu是Cognos系统的前端数据展现工具,通过它,我们就可以在IE浏览器上进行数据库的在线分析处理。Cognos的Powerplay
Enterprise Server 具有Cube(立方体)发布的功能,发布的方式可以是基于Client/Server(客户机/服务器)方式,简称为C/S;也可以是基于Browse/Server(浏览器/服务器)方式,也就是Web(网页)浏览器方式,简称B/S。
数据挖掘(Data
Mining)就是从大量的、不完全的、模糊的、随机的实际应用数据中,提取隐含在其中的、人们事先不知道的、但又是潜在有用的信息和知识的过程。数据挖掘其实是一类深层次的数据分析方法。数据挖掘与传统的数据分析(如查询、报表、联机应用分析)的本质区别是数据挖掘是在没有明确假设的前提下去挖掘信息、发现知识。数据挖掘所得到的信息应具有先未知,有效和可实用三个特征。数据挖掘在电子政务中主要用来为政府重大政策出台提供决策支持。如通过网络的形式对各种经济资源的挖掘,确定未来经济的走势,从而制定出相应的宏观经济调控政策。
随着社会主义市场经济的逐步建立与完善,政府宏观调控政策就更加需要统计系统对社会、经济分析的强有力支持,统计为经济服务的领域越来越宽,同时也对统计数据的整体分析要求越来越高,对数据的深层次开发与挖掘就显得越来越重要。这就要求我们统计部门利用先进的数据挖掘工具对数据进行深层次的开发。
我局于1999年提出了具备灵活、多样的汇总模式的综合数据查询系统,并于2000年开发完成并投入运转。但是,由于系统开发过程中没有成功的经验可借鉴,使系统应用存在着盲点,个别专业不能很好地应用,而且操作步骤相对复杂,在人员基础水平不高的情况下,应用范围也相对较小。这就迫使我们不得不寻找新的数据分析软件,以满足更多的应用者的需求。
现有的数据挖掘工具中,市局推荐的COGNOS数据挖掘系统,就是一个非常好的、相对成熟的市场化数据开发工具。为了解系统的应用情况和取得实践经验,我们特地走访了东城统计局,考察兄弟区县“网上在线分析查询系统”的开发和应用情况。
该系统利用COGNOS作为前台开发工具,后台采用SQL
Server 2000大型网络数据库系统。整套系统采用C/S结构完成数据管理功能,采用B/S模式完成数据分析、查询功能,利用COGNOS建立模型,对各专业数据进行挖掘,利用Web页提供查询、汇总、打印功能。局内领导和业务科室人员等被授权的用户,只需打开IE浏览器,像打开主页一样敲入查询系统的IP地址,进入“网上在线分析查询系统”后,通过拖拽、拼接等操作,就能比较直观的查看相关数据,同时显示出发展趋势图(可选择饼图、直线图、柱形图等方式).在数据显示区可按专业、按年度或其他各种属性显示数据,汇总分组类型可以自由拖拽,数据可以任意组合,充分体现出这一系统的优势。对业务科室人员来讲,通过对数据指标的多样化查询、分析、比较,更能发现数据存在的潜在问题,对数据质量的提升将有极大的帮助。对于领导决策和深层次的分析经济发展规律将是一个强有力的工具。
一、COGNOS系统与我局综合数据查询系统的比较
COGNOS系统是一个成熟的市场化产品,具有许多强大的功能,这是我局自行开发系统所不能比拟的,但同时也造成了部分功能的复杂性。下面我们就数据整理、查询模型建立、查看查询结果三个主要方面进行比较。
1、数据整理复杂,需要投入大量时间和精力
COGNOS系统对数据的导入功能并不强大,没有我局现行系统的数据导入管理功能简便易用。我局查询系统的数据导入功能是建立一个数据导入模板,只要将原始数据库字段与综合数据库字段确立一一对应的关系,系统就可以自动导入。而COGNOS系统需要更多的人为参与,不是一般普通专业人员可以完成的。
2、两个系统对查询模型的建立同样需要专业知识
任何一个查询分析系统都离不开查询模型的建立,COGNOS也不例外。所不同的是,COGNOS系统是对任何一种可能出现的分析、汇总情况进行了提前的设计和计算,工作量全部堆积在系统维护人员身上,是牺牲大量的前期准备时间、系统资源和存储空间,来换取最终使用的简便、快捷。而我局的查询系统只提供了查询的模型,具体的汇总分组、查询条件等内容,需要查询者自行设计,根据实际查询情况系统再进行计算,这就需要查询者具备基本的计算机逻辑知识,对查询者的素质要求较高。
3、对查询结果的处理各有优势
COGNOS不仅能够以表格形式反映查询结果,而且可以进一步向下展开查询资料,并同时产生各种类型的数据图表,查询结果可以打印,但它虽然能够转存为EXCEL文件,可是不能将指标名称、计量单位等整表信息同时转存,只能存储数据资料,用户再进行表头的手工编辑。我局的系统不能对查询结果再向下扩展,如果有新的需求只能再重新进行一次查询。查询结果虽然不能同时产生图表信息,但可以将报表的所有信息转存为EXCEL文件,在EXCEL文件中再进行图表生成等操作。
整体评价两个系统,应该说最终实现的要求基本相同,但我局的系统对应用人员的要求较高,而且只提供C/S结构,致使应用面过窄。而COGNOS系统对应用人员的要求不高,同时支持Web查询,具有广阔的应用前景。在条件成熟时,可利用政府内部网络向各级政府机构开放,各级领导可实时进行自主查询。
二、准备工作是COGNOS系统应用成功与否的关键
我们在利用COGNOS进行开发时,要在人员方面、数据方面、网络安全和保密方面作好充分的准备。
1、加强对COGNOS系统的培训力度。一方面是程序员的系统搭建、组织、安全技术培训,一方面是业务科室人员的数据整理、清洗,数据模型设计技术培训。
2、数据准备将是耗费最大精力的部分。COGNOS的建模,填充、清洗数据的大量工作需要计算机中心和业务科室的密切配合,尤其是对历史数据的统计口径、范围、指标属性等,要重新进行整理、统一和再加工。
3、网络安全、保密工作除了基本的计算机网络安全、保密体系外,还要界定出完整的数据指标体系,确定可对外公开的指标种类、范围、口径、期限、深度等,避免保密数据或敏感数据外泄。
三、COGNOS系统在我局应用的设想
从计算机技术和统计信息化的发展趋势来看,今后统计系统绝大部分的应用都将建立在B/S结构上(即业务人员通过打开IE浏览器的方式对数据实现:采集、查询、汇总、打印的功能)。这一点从“网上直报(为实现数据采集上报功能)”和“网上在线分析查询系统(为实现网上数据查询、汇总、打印功能)”这两个系统近年来的发展完全可以看得出来。
我局现有的分析系统支持对专业数据进行分析,但在跨专业分析、基于数据仓库理念上的数据挖掘、实现B/S实时分析方面还存在很大差距,我局即将建设的以数据仓库为基础的“朝阳区社会、经济综合数据库”是不可能以现有系统作为分析软件,就需要一个功能强大的分析软件作支撑,COGNOS系统无疑是较好的选择。
COGNOS系统在第五次人口普查和第二次基本单位普查数据汇编时得到过应用,但我局没有进行过真正意义上的开发,如果一次性进行大规模地推行与开发,势必要造成人员、精力、物资的浪费。
基于上述综合阐述,为此我们提出以下建议:
(1)对全局的程序员进行COGNOS系统培训
我们将采取“走出去、请进来”的方式,请市局计算中心的同志对程序员进行系统地培训;走访例如东城统计局等已经进行开发的兄弟单位,进行经验交流,吸取经验教训,减少弯路,加快系统应用进程。
(2)抓住一个突破口,首先在一个专业或专项调查取得成功.
为减少开发成本和开发周期,在取得成功经验之前,不作全面开发,而是集中精力,首先选择一个专业或专项调查为突破口,进行全方位的开发实验。在功能上得以完全成功后,其它专业就可以完全套用,只需在数据整理方面下些功夫,成功的概率将大大提高。
(3)整合网络资源,实现跨平台的沟通
在COGNOS系统实现C/S结构的数据分析和B/S结构的在线查询后,对COGNOS系统平台和我局信息网站进行安全挂接,首先实现在朝阳政务网内部的在线查询功能。然后再与Internet网站实现资源整合,最终完成向社会提供信息服务的渠道。
(4)在技术成形后再实现所有专业的数据分析系统转型
在所有技术难题全部解决以后,再依次在各专业推行,最终实现所有专业的数据分析、汇总转入到COGNOS系统。
COGNOS系统作为一个成熟的市场化的开发工具,如果能够真正在我局得以实施,将进一步加快我局的信息化建设步伐,成为继《办公自动化OA系统》之后又一个拥有自主研发能力的系统。
|