简体版  |  繁体版   推荐信息:
解决方案

清华紫光:浙江省工商管理局OA系统解决方案

出处:天极网 作者: 2005-05-11 14:33 评论
字体大小: | |
系统对公文进行处理后,将关键字段信息保存为XML文件,将正文文字和图像保存为双层PDF文件。

  一、项目背景

  浙江省工商管理局OA系统是基于Lotus Notes开发的,于2000年开始正式运行。在全省范围内共有103个下属机关使用这套系统。

  系统中的公文录入、流转、显示部分一直不能很好的满足用户的需求,本项目的目标就是对这一功能模块进行修改和补充,使系统在这一部分的不足得到改变,从而更好地为用户服务。

  二、用户需求

  现有的系统对公文录入方面有两种方式。第一种方式是将公文中的文字输入到系统中,系统对文字的格式有一定的控制,基本上可以按照公文的原样进行显示。但是文字本身的可信度得不到保证;第二种方式是对公文进行扫描,并将所得的JPG格式的彩色图像文件加入到系统中,用户在查看时看到的是公文的图像。由于JPG格式本身的局限所致,图像显示时有不够清晰、不能同时显示所有页,查看不方便等弊端。而关于公文本身的一些关键字段信息,如发文单位、公文字号、标题等信息均要靠手工录入。

  事实上,用户对公文浏览方面的需求是两方面的。一方面希望能得到公文的文字,便于进行对正文的全文检索,以及对这些文字的便捷的引用;另一方面希望能看到公文的原始图像,这样可以提高系统中对于公文描述的可信度,同时图像中保留了公文中的红头和红章,因此更加符合用户的日常对公文的使用习惯,但是图像还要有足够好的显示效果。

  因此,用户希望能有一个好的解决方案来解决上述的问题。具体的说有如下的几点:

  1. 支持高速扫描仪,进行公文图像的快速扫描。

  2. 可以对公文进行全文识别,并提供正文文字。

  3. 自动提取公文中的关键字段信息。

  4. 提供公文的原图像,并要求对图像进行适当的处理,提高其显示效果,并支持多页显示。

  5. 提供文字和图像的对应关系,便于用户进行对照浏览。

  6. 可对系统中已有的公文图像进行加工,使之能够满足用户新的需求。

  7. 系统需要的改动尽量要少。

  三、解决方案

  鉴于上述的系统现状和用户需求,本项目拟采用《公文高速录》软件作为公文录入的工具,对公文进行扫描、识别、校对等处理后,将关键字段信息保存为XML文件,将正文文字和图像保存为双层PDF文件。然后由一个应用程序(公文代理,Archive Agent)将XML中的信息和PDF文件导入到系统中的正确位置,供用户进行检索和浏览。

  3.1 本方案的特点

  1 《公文高速录》软件自身的特点,可满足用户的需求。

  1.1 对兼容TWAIN接口的扫描仪有很好的支持。

  1.2 可对公文图像进行全文识别,饼子动提取关键字段信息。

  1.3 可对识别结果进行校对,提高识别结果的准确性。(虽然在使用角度,本系统中的正文不需要太高的准确率,但是依赖用户的需要,识别结果的准确率可以尽可能的高)。

  1.4 对公文图像进行处理,在保留红头、红章等信息的前提下,提高其显示质量,使其在显示时更加清晰。

  1.5 图像保存为双层PDF文件,这种格式的优点有:在浏览时可以方便的进行翻页浏览;用户看到的是公文的图像,但是可以方便的提取位于图像下层的文字。文字的位置与其在图像上的位置相同;所有图像页保存在一个文件中,便于浏览时进行翻页。

  1.6 识别的结果保存在XML文件中,可方便的提取并汇入到系统中。

  1.7 提供图像的导入功能,可对旧的公文图像进行加工。

  2 本方案对于系统结构的修改很小。由于PDF文件可存放在系统中原来存放JPG文件的位置,而系统库结构不需要做任何改变。所做的只是添加一个程序进行将公文信息和图像汇入到系统中(Archives Agent)。

  3 本方案在技术上已经成熟,与系统以及用户需求耦合度也较高,因此不需要进行太大规模的开发即可实现,从而使项目周期大大缩短。

  本方案由《公文高速录》、扫描仪、生成的XML文件和PDF文件共同组成公文的录入环节。并配合OA系统中新增加的《公文汇入代理》将公文信息汇入系统,供用户检索和浏览。

  在本录入方案进行部署时,需要在每一个下属单位的收发室(进行公文录入的部门)安装《公文高速录》软件和扫描仪,进行公文的扫描和加工,并将结果汇入OA系统。

  3.2 待解决问题

  3.2.1 Lotus Notes系统中显示PDF的问题

  在Lotus Notes系统中不能直接支持PDF文件的识别和显示,拟采用借助OLE控件对PDF进行显示。目前杭州颐和正在致力于解决这个问题。

  3.2.2 《公文高速录》生成双层PDF

  目前《公文高速录》只能生成只包含图像的单层PDF。需要在此基础上开发能够生成双层PDF的版本。由于此技术我们已经在TH-OCR2000中实现,所需要的就是将它移植到本软件中。但是其间尚有一些问题较不明朗,预计这是此方案中最关键的部分,也是最难解决的部分。

  3.2.3 公文汇入代理的开发

  这个软件的开发需要对客户的OA系统有相当的了解,因此需要杭州颐和方面协调此系统的开发人员进行实现。

相关文章
  • 本文关键字:
  • 解决方案(1567)
  • OA(199)
  • 清华紫光(75)
  • 工商(83)
  • 工商管理(10)
  • OA系统(41)
  • 浙江省(50)
  • 频道最新更新
    点击排行
    推荐专题
    更多
    论坛热贴
    更多
    博客精选
    更多
    视频推荐
    更多
      TMG

      Copyright (C) 1999-2008 Chinabyte.com, All Rights Reserved 版权所有 天极网络

      渝ICP证B2-20030003号 商务联系、网站内容、合作建议:010-82657868

      版权声明 在线提交意见反馈 Powered by 天极内容管理平台CMS4i

      经营性网站备案信息 网警备案 中国网站排名