CGEDT是文献资料加到信息库之前要经过预处理。文献的预处理包括转码、整理和标引等。这些工作都需要人工完成,工作量大而且是很容易使人困乏的重复劳动。因此,文献预处理经常成为信息库建设的瓶颈。
文献辅助标引编辑器CGEDT是数据库信息采集加工的前端工具。文献辅助标引编辑器提供两个版本:普通版和新闻报刊版,其中新闻报刊版提供了大样版面文件转换辅助标引与文献编辑器一体化操作功能。
一、强大的数据转换功能
目前不少的信息源都来自排版系统、字处理软件和带有一定格式的文件。CGEDT的文件合并和转码功能能自动把以下格式的文件合并转换成CGRS文本格式。
(1)MS-OFFICE、ISO2709、*.DBF格式文件自动转为CGRS格式。
(2)北大方正和华光激光照排系统生成报版和书版格式的大样文件S2、PS2、PS直接转换成CGRS格式。大样文件转换时,可以直接整版转换,也能在版面还原的基础上选择转换。
二、辅助文献标引
CGEDT以简化操作,提高标引精度和工作效率为目标设计的辅助文献整理、标引工具软件。它具有普通字处理软件的常用功能,又增添CGRS文献整理特殊功能。
1、辅助文献整理
(1)提供方便的多字段分类帮助选取与选值功能,提供日期选值帮助。
(2)提供多篇文献的字段置值功能,提供多篇文献查找与替换功能。
(3)提供分篇与多篇合并功能,提供界面格式调整功能。
(4)提供多媒体信息文件的标引与浏览功能。
(5)提供查错功能,提供按字段内容排序与还原功能。
2、版面大样文件转换与辅助标引
(1)版面转换后的文献直接进入编辑器界面。
(2)提供在版面中直接用鼠标分篇与多段(篇)合并功能。
(3)提供版面多篇转换、全部转换和选块转换功能。
(4)提供版面直接鼠标拖动图片实现图片标引。
三、查错
信息系统向用户提供的产品是信息。信息的准确性是系统是否有生命力的关键。为了保证入库之前原始文献的正确性,CGEDT提供了文献正确性、准确性检查功能。检查项目包括:
(1)文献有否遗漏内容(如标题);
(2)文内是否有非法码(如半个汉字等);
(3)时间是否有效;数据类型是否正确等。
(4)检查结束将列出错误清单,光标自动定位到错误的位置。
四、联机加载功能
(1)授权用户登录CGRS数据库服务器。
(2)联机加载当前标引文献与标引完成文件到CGRS数据库中的功能。