一 系统概述
在21世纪,计算机技术和网络技术的飞速发展,使得我们的时代逐步成为一个信息的时代、网络的时代、数字的时代和知识爆炸的时代。随着一次文献的数字化加工信息的大量膨胀,二次文献的标引著录深加工工作也已日益提上日程。
结合当前的社会二次文献深加工的需要,北京金信桥网络技术有限责任公司运用本公司多年来致力于数字资源应用技术的研究和产品开发的经验,推出了TBSMDS元数据加工管理系统。
TBSMDS元数据加工管理系统用于对在信息资源加工处理过程中产生的元数据进行多种形式的深加工,以产生用于对外发布或对外提供服务的各种产品数据库和专题数据库。在深加工过程中,提供各种对元数据和对象数据的编辑、管理、校对等操作。
二 系统结构
1 系统整体架构
TBSMDS元数据加工管理系统主要由三大部分构成,即:服务器软件、管理员软件、操作员软件。三者之间的关系图,如下图所示:
服务器软件的各个组成部分及功能描述
| 软件模块 |
功能描述 |
| EBSServer |
统一认证服务器:用户管理、资源管理、权限管理、模块管理和日志统计 |
| FTSServer |
文件传输服务器 |
| MNGServer |
任务调度服务器:任务分配、监控工件状态等 |
| SQLServer |
数据库服务器,存储流水线、工序、工件状态等信息 |
2 系统软、硬件部署
TBSMDS系统主要包括五个部分: EBS认证服务器、FTS文件服务器、MNG任务调度服务器、MSSQLServer 数据库服务器、TBSMDS管理端和操作端。
EBS统一认证服务器、FTS文件服务器、MNG任务调度服务器和MSSQLServer 数据库服务器可以安装在一台服务器上,也可以安装在多台服务器上,例如:EBS/FTS/MNG服务安装在一台机器上,数据库安装在另外一台机器上。系统也可以挂接多个磁盘阵列(通过FTS服务器来访问)。另外,TBSMDS管理端、TBSMDS操作端器可以安装在同一台个人电脑上,也可以根据需要分开部署在不同的机器上。
三 功能及特点
1 系统功能
1.1 管理员软件模块
- 元数据加工:
1) 可建立并管理多条流水线,各条流水线分别配置,互不干扰;
2) 流水线的工序可任意配置,可根据每条流水线的具体情况配置工序;
3) 在每个工序可以自由定制不同的工作单,提供多个Marc模板可供选择;
4) 可以添加Marc字段、子字段,并可对这些字段配置属性,如必备性、重复性、代码库支持、合集导入、下拉菜单选值、字段内容属性、连接字段等;
5) 基于Marc总表,建立Marc模板,并可复制和编辑;
6) 提供元数据任务管理,可以对各流水线下工件的工件信息(如,工序、操作状态、用户、库标识、内部批次)进行查看和修改;
7) 提供批处理功能,可批量删除字段、追加字段、和更新字段内容;
8) 提供按条件(工序名称、馆藏号、母体题名、文献类型、文献语种、内部批次、员工、操作状态和分配类型)查询;
9) 可根据时段、文献语种、文献类型、文献载体、记录类型进行统计,并可进行员工工作量统计。
- EBS管理:
1) 用户管理对员工进行分组管理,使员工的管理更有条理;
2) 资源管理提供对资源的管理,给各条流水线配置工序;每道工序的员工可任意配置,每个员工可以属于多条流水线、多道工序,员工登录时,给员工列出员工所在的所有流水线、工序,员工选择某一流水线下的某一道工序,开始工作;
3) 权限管理可对任意员工进行操作权限的配置,保证系统的安全、稳定;
4) 模块管理可对模块类型、模块ID、是否为内置模块、模块的显示类型(嵌入方式、弹出方式和其他方式)、模块功能、调用方式(工具栏、右键菜单和其他)等进行编辑;
5) 在线管理提供对在线用户的管理;
6) 用户统计提供对用户和用户组的日统计、周统计、月统计、时段统计,并可把统计信息导出到Excel中。
- TBS词表管理:
1) 可无限制的创建多个词表;
2) 对创建的词表分布式导入范畴表、叙词表和自由词文件;
3) 并提供对词表的管理,可设置词表的分项显示级别、根据所选择的词库和检索类型进行有条件的检索;
4) 支持导出词表。
1.2 操作员软件模块
- 操作员加工界面:
1) 操作员通过帐号、密码登录系统,自动获取任务,并提交完成结果等;
2) 员工可以查看自己在任意时段的工作统计,帮助员工了解自己的工作进度,从而更好地安排自己的工作;
3) 服务器消息处理采用队列式管理,消息的处理可以同步,也可以异步,从而使服务器运行更加可靠、稳定;
4) 操作员软件非正常退出时的现场保护,即使没有上传工件,工件信息也不会丢失;
5) 操作员软件的任务列表功能,使员工轻松了解自己的任务信息;
6) 提供按“流水线---员工---工序---流水号”进行本地备份功能;
7) 提供Marc模板功能,且员工若具有一定权限可以对模板进行编辑,使用本地模板进行加工操作;
8) 可无限次的在新窗口中打开多个文献记录,能够在该窗口进行编辑操作、且该窗口可以最小化;
9) 每个环节都可进行文献语种和文献类型统计;
10) 支持光盘文件接口;
11) 申请任务和提交任务的条件化和多样化。
- 数据导入:
1) 支持导入Marc数据和2709数据;
2) 能够从其它系统,如订购系统和加工系统导入数据;
3) 支持本地XML数据导入和本地对象数据的导入;
4) 支持大套数据导入。
- 著录:
1) 具有数据库查重功能;
2) 对数据库中元数据进行对象文件挂接;
3) 含有对象文件的著录数据进行分篇,产生析出文献,可画框识别著录字段内容;
4) 可预览现有环节中的母体文献和析出文献,有条件的输出TXT文件,并可以自定义输出文件的输出格式;
5) 能够查询历史数据,并且可以定位数据;
6) 支持批量修改;
7) 添加母体文献和析出文献,系统可定义缺省值;
8) 提供时时校验和上传工件校验。
- 标引:
1) 支持多词表系统,能够根据需要选择相对应的词表系统;
1) 支持智能标引。
2 系统特点
- 系统具有良好的兼容性,不仅可支持多种数据格式的导入,导入的方式也有很多种;
- 支持当前国际流行的MARC(CNMARC、USMARC等)和其它数据格式的数据库;
- 支持通过拷贝工作单和显示格式定义新的工作单和显示格式的功能;
- 系统具有灵活性,不同的用户可使用统一的工作单,也可根据需要自定义工作单;
- 系统支持批量操作,可批量下载、批量上传,也可批量更新、追加和替换;
- 根据规范的设置,系统可进行自动校验数据,防止不合格的数据上传;
- 可根据需要随机定义某个字段的隐含值,尽可能多地自动生成数据内容,大大减少了工作量;
- 色彩的多样性和丰富性,可通过数据本身的颜色标识来区分数据所具有的状态。
四 工作流程
五 典型页面
操作端著录界面
操作端标引界面
管理端任务管理界面
六 运行环境
1 服务器端
软件环境:windows 2000(SP4)/2003(SP1) 服务器版
硬件配置:CPU:Intel Xeon 2.0 GHz以上,RAM:1 GB以上,硬盘:120G,网卡:100/1000M自适应
2 客户端
软件环境:windows 98/2000/xp/2003,IE 6.0以上
硬件配置:CPU:Intel Pentium 4 1.6 GHz以上,RAM:512 MB以上,硬盘:80G,网卡:100M
七 典型用户
中国航空工业发展研究中心
中国核科技信息与经济研究院
中国航天工程咨询中心
中国兵器工业集团第210研究所
中国船舶重工集团公司第714研究所
中国船舶工业综合技术经济研究院
信息产业部电子科学技术情报研究所
八 联系方式
地址:北京市海淀区中关村东路66号世纪科贸大厦B座2306室
邮编:100190
总机:(010)62670903/62670700
传真:(010)62670877
客户服务:(010)62670903
邮件支持:tbsinfo@sohu.com
公司网站:http://www.tbs.com.cn
|