摘要 本文介绍PDF417二维条码的编码、译码及纠错的原理和特性。分析目前在公文处理中出现的低效率、可靠性差的现状,阐述PDF417条码在公文处理中的应用,实现公文自动化。 关键词 PDF417; 二维条码;编码;译码 1 引 言二维条码是不依赖计算机网络和数据库存储、转移信息的一种方法,是信息的另一种表示形式,是信息携带、信息自动传递、信息防伪的理想手段。PDF417条码是应用最为成功的一种二维条码,它以其高密度、高信息容量、纠错能力强、成本低等特点,广泛应用于国际贸易、物流、工业、商业等领域,已经取得了巨大的社会效益和经济效益,但在公文处理中比较少。长期以来,我国的公文函件流转一直采用面对面交接、手工登记的传统方式,这种方式,人为因素强,极容易发生错发、漏发等错误,同时,许多相同信息会被反复记录,造成查找和统计的困难,消耗大量的人力和物力,效率很低。本文阐述了PDF417条码在公文处理中的应用,以实现公文自动化处理,提高公文处理效率及可靠性、保密性。2 PDF417条码结构与特性2.1 结构PDF417二维条码是一种堆叠式二维条码,由美国SYMBOL公司发明的,PDF(Portable Data File)意思是“便携数据文件”。组成条码的每一个条码字符由4个条和4个空共17个模块构成,故称为PDF417条码。每一个PDF码的储存量可高达1,108个汉字,若将数字压缩则可存放至2,729数字字符。 每一个PDF417码是由3~90行,1~30列堆叠而成,而为了扫描方便,其四周皆有静空区,静空区分为水平静空区与垂直静空区,至少应为0.020寸,其结构如图表1所示:A为静空区、B为起始码、C为结束码、D为左标区、E为右标区、F为资料区。图表 12.2 特性u 信息容量大PDF417码由3~90行、1~30列堆叠而成,根据不同的条空比例,每平方英寸可以容纳250到1100个字符。在国际标准的证卡有效面积上(相当于信息卡面积的2/3,约为76mm×25mm),PDF417条码可以容纳1108个汉字或2729个数字字符,比普通条码信息容量高几十倍。如图表1所示的为6行11列的PDF417条码,错误纠正等级为3,其译码后包含的内容为“DEMO-PDF417二维条码与公文自动化处理 cgh 2005-09-21”。u 保密、防伪性能好PDF417条码具有多重防伪特性,它可以采用索引密码、数据加密或利用所包含的信息如指纹、照片等进行防伪,因此具有极强的保密防伪功能。u 译码可靠性高普通条码的译码错误率约为百万分之二左右,而PDF417条码的误码率不超过千万分之一,可靠性极高。u 修正错误能力强PDF417条码采用了世界上最先进的数字纠错理论,在选择适当的纠错级别时,如果破损面积不超过整个条码符号的50%,依然可以照常恢复丢失的信息。错误纠正可分为九个等级,其值从0到8,级数越高,错误纠正能力越强,但可存放资料量就越少,一般建议编入至少10%的检查字码。资料存放量与错误纠正等级的关系如图表2。错误纠正等级纠正码数可存资料量(位元)自动设定641024021108141106281101316109243210725641024612895772568048512496图表 23 公文自动化处理现状目前,很多机关单位建立了自身的办公自动化系统提高机关办公效率。这些系统一般都是进行文件电子信息的管理,其重点是使办公过程电子化、迅捷化,方便检索和查询。然而由于多年来养成的办公习惯,尤其是领导批示环节还很难实现全面电子化,还有各部门之间的网络连接和网络安全问题,造成纸质文件和电子信息流的共存状态。因此纸质文件仍然被作为最终有效的办公依据,而办公自动化系统对纸质文件的流转并不做登记处理,大部分纸质文件的传输,必须通过传统的登记本进行手工登记、签收,完全是原始的手工作业的模式,由于人员配备少,文件、信件、公文流转量大,在纸质文件流转过程中,依然存在着手工登记签收责任不清、劳动强度大、数据不准确、保密安全性差、查询统计困难以及文件实物流和电子信息流“非同步”现象等问题。所以如何对文件尤其是大量的纸质文件进行有效的管理,使得纸质文件能和办公自动化系统中流转的电子版本对应、同步,仍然是这些机关单位很难解决的棘手问题。而条码技术的发展,尤其是二维条码技术的发展,为解决在公文处理中遇到的人工随意性强,交接过程记录难以细致准确,公文流转保密、安全性差等问题,提供良好的技术保障,使公文处理真正实现自动化。下面以PDF417条码在公文处理中的应用为例。4 公文自动化处理实现如上所述PDF417二维条码具有信息容量大、信息密度高、修正错误能力强、译码可靠性高、保密性强和容易印制等特点,使它可以不依赖于数据库,随公文进行信息流转,实现公文的自动化处理。我们以公文自动流转和公文自动追踪为例。4.1 公文自动流转公文流转包括公文收发、登记、签收、归档等工作,按传统的做法,该过程中涉及的人工的因素最多,最容易出现记录数据不准确,查询统计困难,费工费时,保密性差等情况。在公文中加入PDF417条码后,将能提高流转效率、准确性及保密性,根本上解决了上述问题。其实现设计流程如图表3:图表 3与传统的公文流转流程不同的是:我们在流程的过程中增加了三个辅助模块(条码生成模块、条码分拣箱、条码读取设备),这三个模块是软硬件相结合的,为在流转的公文上的PDF417条码提供编码和译码工具。其功能如下:u 条码生成模块该模块主要是为签发公文的信息生成一个标签——PDF417条码。其内容包括签发单位、签批人、发文时间、公文标题、公文字号、公文种类、主题词、秘密等级、公文页数,以及其他流通双方约定俗成的内容,可分为两种生成模式:a) 硬件模式 借助条码生成设备,将信息输入该设备,生成PDF417条码,然后将该条码粘贴在公文上,与公文一起流转。b) 软件模式 使用条码生成控件,将控件直接嵌入公文生成软件。以Word文档为例,将条码生成控件嵌入Office中,直接在Word文档的预定位置生成PDF417条码,这样条码与公文融为一体,在网络传输中很有利,签收单位收到电子公文后,即使打印出来,也能很方便的通过译码器获得该公文的基本信息,可随打随用。c) 如下条码实例图表4显示的演示信息为下方圆括号中的内容:图表 4(DEMO-某单位^某某某签批^2005-9-21^关于PDF417条码在公文流转中的应用^123456789^请示^PDF417条码应用^秘密^平急^5页^其他相关信息-DEMO)u 条码分拣箱条码分拣箱是条码的一个读取设备,也可称为条码交换箱,可识别条码信息,其主要的功能表现在两个方面。第一,对待发文件或文件中转站的收文进行分拣,便于发送或签收。通过译码器获取公文上的PDF417条码信息,并按信息自动分类,减少人工分拣的失误,提高工作效率。第二,与数据库相连,自动将获得的信息登记入库,减少手工登记、签收的失误,减少工作量,提高签收效率和准确性。u 条码读取设备目前,市面上条码的读取设备有很多,其主要功能是获取条码信息。在这里,它主要用于在公文签收时,获取公文上的PDF417条码的信息,并把信息登记入库,替代人工登记、签收,可以实现公文流转核对确认率达到100%。同时,PDF417条码保密性高,防伪性能好,可以提高公文在流转过程中的可靠性。 如上,在公文流转中增加PDF417条码的编码和译码设备后,发文、签收显得简单而方便,我们很容易从这些设备上获得公文信息,并自动登记入库,减少了人工操作引起的不必要的失误,同时,由于通过设备的译码速度快(只需0.2秒),核对准确率高,能够大大提高公文流转的效率。另一方面,公文信息可以在加密后,再进行编码译码,所以,它还能有效的防止不法分子的伪造公文,提高了公文在流转过程中的安全性。4.2 公文自动追踪公文自动化追踪一直是公文管理的重要问题,如:公文收发起草和登记,公文收发处理,公文查询和借阅等。由于长期以来,我国一直采用面对面交接、手工登记的传统方式,一旦出现问题,就很难有效的跟踪到出错的地点和原因。下面阐述PDF417条码的应用,解决公文自动化追踪问题。 图表 5 如图表5,显示的是公文从起草、审批、核稿、签发、发布、