|
从11月1日举行的第五次全国人口普查将普遍采用最先进的光电录入系统,在数据量大大增加的情况下,数据采集速度仍将提高近六倍。据悉,这是我国第一次自动手段采集人口普查信息。
建国以来,全国人口普查已经进行了四次,从算盘、计算器到计算机,虽然每次都采用了当时的先进技术,但数据录入仍以手工为主。这次普查采用清华紫光提供的人口普查光电录入系统,拥有目前最先进的手写数字录入技术,做到扫描与录入完全同步,真正实现了高速的光电录入,运用这套软件,使人口普查技术跃上一个新台阶,所采用的技术达到甚至超过了发达国家2000年人口普查数据录入技术水平。
人口普查光电录入系统的核心技术OCR是国家863计划的重要成果。OCR即光学字符识别,人口普查员通过入户调查,将相关信息填写在调查表光上,光电录入机通过高速扫描仪将表中的数据读入计算机中。系统的自动识别精度误差小于0.056%,识别速度为每分钟27页双面普查表。
据国家统计局计算机中心滕若波研究员介绍,我国从1982年第三次人口普查起采用计算机技术,从国外进口了几台大型机,集中处理数据总共用了一年半时间。
1990年第四次人口普查,信息量翻了一番。当时在全国340个地市建立起处理数据用的服务器,全国共聘用3000个数据处理人员以及1万个录入员,工作了整整一年。
第五次人口普查数据信息将再翻一番。全国约有3.6亿张短表,4000万张长表,500万张死亡表,500万张暂住人口调查表。采用光电录入技术,一个人就可以操作一台光电扫描仪,承担100万户的数据,全国大约有五百个人就可以完成数据采集工作。最快的省市只要两个月就可以全部完成普查工作。
另外,这次人口普查还采用了网络机、小型机和大型数据库处理技术,目前,已在北京和31个省市建立了32个网站,通过网络做人口汇总信息和分析信息。在地市只需要完成扫描和录入工作,数据通过网络传递到各省市统一处理。在网络上采用CA身份认证技术,在普查期间,给需要随时了解情况的部门或领导发一个IC卡和读卡机,就可以及时上网查询各省的数据。最后的数据在国务院公布之后,就可以让所有人都通过网络随时查询数据和相关分析结论。
|