|
|
|
| |
| TBS·USP 资源整合检索系统 |
| |
一 系统概述
近几年来,国内科研单位、政府机关及高校图书馆等通过引进和自建数据库,已使电子资源的建设具有相当规模,电子文献在文献服务中所占的比重也在不断增加。在继续加强电子资源建设的同时,各单位更加关注电子资源的管理工作,如何整合已有的资源,将不同类型、不同结构、不同环境、不同用法的各种异构数据库纳入统一的检索平台,以便于用户更方便、更高效地检索获取信息,已成为了各单位共同面临的一个新问题。
北京市金信桥网络技术有限责任公司多年来致力于数字资源应用技术的研究和产品开发,在积淀了多年的技术储备和应用实践后,推出了TBSUSP资源整合检索系统。
TBSUSP资源整合检索系统是以元搜索引擎为原型,将已有的B/S结构检索系统(包括搜索引擎、数据库检索系统等)作为目标资源,在其基础上构造一个通用的检索平台,允许用户选择不同的目标资源来同时进行检索,并将检索结果以统一的形式显示出来,从而达到异构资源整合检索的目的,具有跨平台、跨数据库、整合检索及异地调度等功能。
二 系统结构
1 系统整体架构
2 模块结构图
整个系统各个模块之间的相互关系如下:
3 系统软、硬件部署
TBSUSP资源整合检索系统的软、硬件部署主要包括二部分:元搜索服务器端/元搜索客户端。元搜索服务器端部署在一台能够连接各个现有检索系统(包括互联网搜索引擎、自建数据库、购买电子资源)的服务器上来提供异构检索服务;元搜索客户端在实际应用中一般与元搜索服务器端部署在一台服务器上,用来接收用户通过IE浏览器发出的查询命令,并将查询命令发送至元搜索服务器端,最终将查询结果反馈给用户。
三 功能及特点
TBSUSP资源整合检索系统基于元搜索引擎而存在,同时元搜索引擎又依赖于其它独立搜索引擎,元搜索引擎集成了不同性能和不同风格的搜索引擎并发展了一些新的查询功能,查一个元搜索引擎就相当于查多个独立搜索引擎,可以达到事半功倍的效果。
1 系统功能
1.1 系统管理
- 资源管理:
系统管理员通过智能化模板管理,包括可检索的数据源、通用检索字段、数据源的详细配置信息。实现对信息资源的增加、修改和删除操作,达到对异构数据库资源的智能化整合管理。
- 数据库管理:
数据库指的就是每个元搜索任务。负责元搜索请求信息的处理,将其“翻译”成满足不同检索系统“本地化”要求的格式,形成不同的子搜索任务,对所有的元搜索任务及其相的各个子搜索进行统一管理,包括数据缓存处理、数据过期处理、会话管理、任务状态查询、任务信息查询等。
- 服务器监测:
负责对每个元搜索任务进行监测,监测元搜索任务所检索过的内容及次数等等相关信息。
1.2 异构资源统一检索
用户可同时选择多个资源,从同一个检索入口对多个资源提交检索请求。请求将由系统进行多线程并发提交给各个资源的检索引擎,并统一报告各个引擎的检索结果数,为读者提供有指导意义的检索结果概览。
- 统一结果显示:
各个资源的检索系统返回结果,并对这些结果进行分析和提取,以统一的方式返回给用户。
系统提供列表的资源组织方式及多样的检索手段,辅助用户快速地找到需要的资源。
- 个性化的检索结果显示:
用户可以选择适合自己的检索结果显示风格,可以指定每页显示的结果条数。
系统支持关键词检索、多字段逻辑组合检索,检索界面友好,操作方便。
2 系统特点
- 检索界面友好,一目了然;以树型或列表方式显示可用的目标资源,允许用户一次选择一个或多个目标资源进行检索。
- 提供可视化的后台配置界面,可以方便地增加新的目标资源。
- 提供多种检索结果输出格式,检索结果的信息描述全面,包括资源名称、URL、源搜索引擎、源搜索引擎提供的摘要信息等,可设置每个目标资源返回的结果数量。
- 利用Cache技术保存检索结果,提高检索访问速度,有效利用网络资源。
- 对于目标资源的复杂检索界面,能够自动提交表单,如用户密码登陆、数据库选择、参数选择及隐含参数提取等。
- 支持会话管理,包括会话的维持、会话的共用、过期重建,最大限度地利用有限的账号资源,支持多个元搜索引擎的用户共用一个目标资源的账号。
- 对于采用负载均衡算法的分布式检索资源,能够自动跟踪变化的IP地址信息。
- 支持并发检索,同时对于并发的同一个检索条件共用检索线程资源,最大程度地利用网络和系统资源。
- 支持服务端任务信息全面监测,包括任务总数、元搜索信息、子搜索信息、下载进度等。
- 支持检索资源页面的多种编码格式,包括GB、BIG5、UTF-8、UTF-16(Unicode)。
- 多线程并发处理技术,大大提高了系统的检索速度与检索效率。
- 响应速度快,系统采用科学合理的Cache高速缓存机制,可有效缓解系统压力和网络流量压力,提高了系统性能及响应速度。
四 数据流
五 典型界面
简单检索界面
高级检索界面
检索结果界面
检索结果概览界面
六 运行环境
1 服务器端
软件环境:windows 2000(SP4)/2003(SP1) 服务器版
硬件配置:CPU:Intel Xeon 2.0 GHz以上,RAM:1 GB以上,硬盘:120G,网卡:100/1000M自适应
2 客户端
软件环境:windows 98/2000/xp/2003,IE 6.0以上
硬件配置:CPU:Intel Pentium 4 1.6 GHz以上,RAM:512 MB以上,硬盘:80G,网卡:100M
七 典型用户
国际关系研究院
中国石油勘探开发研究院
中国石油化工研究院
中国电科院
中国中医科学院广安门医院
华北电力公司
八 联系方式
地址:北京市海淀区中关村东路66号世纪科贸大厦B座2306室
邮编:100190
总机:(010)62670903/62670700
传真:(010)62670877
客户服务:(010)62670903
邮件支持:tbsinfo@sohu.com
公司网站:http://www.tbs.com.cn
|
|
|
| |
|