www.T1soft.com

 

首页 | 关于我们 | 软件产品与服务 | 解决方案 | 技术理论基础 | 成功案例和科研成果 | 动态和评述 | 联系我们 | 留言簿 

   

艾瑞.舒沙尼(Arie Shoshani):统计数据库管理系统的开拓者

作者:薛薇 摘自《www.t1soft.com》

  

  统计数据是政府社会经济信息的主体,是企业经营管理信息的主体;同时也是科学研究与科学实验信息的主体,所以统计数据库研究与开发具有广泛的应用领域和巨大的商业价值。

  统计数据库管理系统(SDBMs: Statistical  Data Base Management system)研究起步于上世纪80年代。1981年美国科学家艾瑞-舒沙尼(Arie Shoshani.)在数据库方面的研究中,发现统计数据的存储和管理的一些独有特征,并在第7届国际大规模数据库(VLDB :Very Large Data Bases)年会上合作发表论文:《SUBJECT:一种目录驱动的大规模统计数据库组织与存取系统》(SUBJECT: A Directory Driven System for Organizing and Accessing Large Statistical Data Bases),提出了针对统计数据的特殊存储策略SUBJECT方法。虽然论文中涉及了统计数据库的称谓,但是统计数据库并没有作为单独的研究对象明确提出。

  1982年艾瑞-舒沙尼再次在国际VLDB会议上独立发表多篇论文,其中《统计数据库:特性、问题和若干解决方法》(Statistical Databases: Characteristics, Problems, and Some Solutions),正式提出了统计数据库系统由于统计数据的本质(多维性、语义性、层次性、变化性、冗余性等)带来的诸多问题,并提出了若干解决方案,这些概念和方法为之后蓬勃兴起的统计数据库研究指明了方向,奠定了基础。同时他的研究成果彻底扭转了70年代关于统计数据库安全研究领域中对统计数据库的功能性界定,当时的“统计数据库”是指对一般性数据库系统进行统计运算时(如SUM、COUNT、MAX、MIN 等),如何防止个体信息泄密的概念。

  原籍以色列的艾瑞-舒沙尼于1969年获得美国普林斯顿计算机科学博士学位后,在一家计算机系统开发公司工作了7年,然后就一直在美国加州的国家能源研究科学计算中心NERSC (National Energy Research Scientific Computing) 劳伦斯-伯克利实验室(LBL:Lawrence Berkeley Laboratory)从事科学研究。

  以LBL为研究基地,1981年举办了第一届LBL统计数据库工作研讨会。1983年举办了第二届,1986年举办的第三届LBL工作研讨会中,由于发现科学研究与科学实验中的众多数据性质与统计数据一致或者类似,所以引进了科学数据库(Scientific Database)的概念,扩充了研究领域,形成延续至今的科学与统计数据库(SSDBM: Science  and  Statistical  DataBase Management)研究方向。

  自1988年开始每年一次的国际科学与统计数据库学术会议正式启动,使得统计数据库研究逐步进入繁荣发展的快行线,受到各界广泛的关注。2004年6月在希腊举行了第16届大会,会议出版的论文集代表了当今国际学术界关于SSDBM最前沿研究成果。

  艾瑞-舒沙尼则以其开创性的工作和不断发表的新研究成果,长期担任SSDBM大会主席或名誉主席。这些研究成果主要涉及统计语义数据模型、查询语言、时间型数据处理、高效率数据存储与存取算法、统计与OLAP数据库、科学与统计数据库应用技术等。

  我国哈尔滨工业大学的李建中教授在统计数据库研究方面取得了可喜的成绩,从上世纪80年代中后期李教授在理论研究中比较完整地提出了统计数据库的数据定义语言(DDL)和数据操作语言(DML)。原中国人民大学信息中心主任江昭教授比较注重原型系统开发研究,在统计语义模型、统计数据库查询优化等方面取得了诸多阶段性成果。

  科学与统计数据库具有广泛的应用前景和经济价值,吸引了众多数据库专家学者开始深入研究统计数据结构的特征和处理方法的特征,同时这个研究领域与多维数据库、OLAP、数据仓库、时空数据库等研究方向不断融合,相互促进,取得了许多重要的成果,为现代数据库系统研究和商业开发作出了突出贡献。

  科学与统计数据库研究的目标是根据统计数据和科学数据的特质,研制一套完善的数据库管理系统(DBMS),所以称为科学与统计数据库管理系统(SSDBM),这与在一个数据库中存放一些统计数据或者统计表的所谓“统计数据库(SDB)”是完全不同的概念。

  目前,科学与统计数据库的主要研究方向为:

  1、数据逻辑模型与用户界面技术(包括科学与统计数据库模型、查询语言、图形化用户界面、时间型数据模型、序列型数据模型和多维数据模型等)

  2、数据物理组织与存取方法(包括科学与统计数据库压缩、转换的文件结构、时间型数据结构和多维数据结构等)

  3、科学与统计数据库特性算法(比如抽样、转置和聚合等)

  随着我国市场经济体制的确立,以及信息化建设的深入发展,对于计算机统计应用的需求越来越迫切,统计数据库和统计信息系统开发受到广泛的关注,我们相信新一代统计数据库管理系统的研发将在政府统计、企业统计和科学研究中发挥更大的作用。

 

首页[1]末页

 

版权所有 ©2003 中国人民大学统计数据库研究室