信息检索范文
时间:2023-03-20 13:02:22
导语:如何才能写好一篇信息检索,这就需要搜集整理更多的资料和文献,欢迎阅读由公务员之家整理的十篇范文,供你借鉴。
篇1
2、选择信息检索系统,确定检索途径。
3、选择信息检索系统的方法:(1)在信息检索系统齐全的情况下,首先使用信息检索工具指南来指导选择;(2)在没有信息检索工具指南的情况下,可以采用浏览图书馆、信息所的信息检索工具室所陈列的信息检索工具的方式进行选择;(3)从所熟悉的信息检索工具中选择;(4)主动向工作人员请教;(5)通过网络在线帮助选择。
4、选择信息检索系统的原则:(1)收录的文献信息需含盖检索课题的主题内容;(2)就近原则,方便查阅;(3)尽可能质量较高、收录文献信息量大、报道及时、索引齐全、使用方便;(4)记录来源,文献类型,文种尽量满足检索课题的要求;(5)数据库是否有对应的印刷型版本;(6)根据经济条件选择信息检索系统;(7)根据对检索信息熟悉的程度选择;(8)选择查出的信息相关度高的网络搜索引擎。
5、选择检索词。确定检索词的基本方法:选择规范化的检索词;使用各学科在国际上通用的、国外文献中出现过的术语作检索词;找出课题涉及的隐性主题概念作检索词;选择课题核心概念作检索词;注意检索词的缩写词、词形变化以及英美的不同拼法;联机方式确定检索词。
6、、制定检索策略,查阅检索工具。(1)制定检索策略的前提条件是要了解信息检索系统的基本性能,基础是要明确检索课题的内容要求和检索目的,关键是要正确选择检索词和合理使用逻辑组配。(2)产生误检的原因可能有:一词多义的检索词的使用;检索词与英美人的姓名、地址名称、期刊名称相同;不严格的位置算符的运用;检索式中没有使用逻辑非运算;截词运算不恰当;组号前忘记输入指令“s”;逻辑运算符号前后未空格;括号使用不正确;从错误的组号中打印检索结果;检索式中检索概念太少。(3)产生漏检的原因或检索结果为零的原因可能有:没有使用足够的同义词和近义词或隐含概念;位置算符用得过严、过多;逻辑“与”用得太多;后缀代码限制得太严;检索工具选择不恰当;截词运算不恰当;单词拼写错误、文档号错误、组号错误、括号不匹配等。(4)提高查准率的方法有:使用下位概念检索;将检索词的检索范围限在篇名、叙词和文摘字段;使用逻辑“与”或逻辑“非”;运用限制选择功能;进行进阶检或高级检索。(5)提高查全率的方法有:选择全字段中检索;减少对文献外表特征的限定;使用逻辑“或”;利用截词检索;使用检索词的上位概念进行检索;把(W)算符改成(1N),(2N);进入更合适的数据库查找。
7、、处理检索结果。将所获得的检索结果加以系统整理,筛选出符合课题要求的相关文献信息,选择检索结果的著录格式,辨认文献类型、文种、著者、篇名、内容、出处等项记录内容,输出检索结果。
篇2
桶排序法,先把被排数据所分布的区间[Dmin,Dmax](在这里Dmax,Dmin分别为被排数据的最大,最小值)划分成N个大小相等的子区间,称子为“桶”,然后将N个数据根据其大小分配入相应的“桶”内(桶[1],桶[2],…,桶[N])。借签桶排序中将数据根据其大小分配入相应“桶”的思想,我们在检索时将已排好序的数据也根据其大小将其分配入相应的“桶”内,然后再在“桶”内进行二分检索。假设按升序排列的N个数据已存放在data数组的元素data[0]~data[N-1]中,构造一个HASH函数为:
(式中Dmax=data[N-1],Dmin=data[0],N为数据个数)
二、基于HASH函数的二分检索算法HS
算法HS使用二个数组,data数组的元素data[0]~data[N-1]中存放按升序排列的N个数据,address数组的元素address[1]~address[N]中用来存贮经HASH函数转换后得到相同地址的数据个数。
算法HS
HS1[清address数组]将ddress[1]~address[N]都置0
HS2[Dmax中置最大值、Dmin中置最小值]Dmaxdata[N-1],Dmindata[0]
HS3[i置初始值]i0
HS4[求数据data[i]的HASH变换后的地址ad]ad
HS5[地址“碰撞”记数器address[ad]加1]address[ad]address[ad]+1
HS6[修改i]ii+1
HS7[比较i与N-1]若i<=N-1,则转HS4,否则转HS8。
HS8[address[0]置初值1]address[0]1
HS9[j置初始值]j1
HS10[求地址发生“碰撞”的数据在DATA数组中的首地址]address[j]=address[j]+address[j-1]
HS11[修改j]jj+1
HS12[比较j与N]若j<=N则转HS10,否则转HS13。
HS13[输入一个被检索的数据X]
HS14[对被检索数据X用HASH函数得地址ad]
HS15[确定“块”的下界low,上界high的值]lowaddress[ad-1],highaddress[ad]-1
HS16[在“块”内进行二分检索]在给定的下界与上界之间进行二分检索,若找到,则返“检索成功”信息,否则返加回“检索失败”信息。
HS17[本算法结束]
三、平均检索长度的分析
在本检索算法中,首先将被检索数据X经HASH函数转换出一个地址,根据这个地址将被检索的数据直接定位到相应的“块”中,然后在“块”中进行二分检索。因此通过对所有“块”内二分检索法的平均检索长度的计算就可求出本算法的平均检索长度。二分检索法的平均检索长度为:
下面我们来求本算法的平均检索长度。假设在N个数据均匀分布的情况下,经过本检索算法中HASH函数转换,每一个地址出现的概率相同,都等于1/N,因此,有m个数据转换得到相同地址的概率为:
(m=1,2,…,N)
参考文献[1]的附录中已证明:(1)
所以本检索算法的平均检索长度为(2)
由上式(1)和式(2)两个公式即可求得本算法的平均检索长度,其平均检索长度小于1.352(当N>100时)。
四、算法分析与实验结果
1.本算法的创新之处在于通过HASH函数可将被检索的数据X直接位置定位到相应的“块”(通过HASH函数转换后的地址相同的数据区间)中,再在“块”中进行二分检索。从而不再需要建立索引顺索表检索算法中的索引表,也就省去了索引顺索表检索算法中查找索引表确定所在“块”的平均检索长度。
2.此方法突破了HASH表的平均检索长度是装填因子(=(表中填人的记录数)/(哈希表的长度)的函数,而不是N的函数的弱点。
3.在理想情况下,即数据完全是均匀分布的情况下,本算法的平均检索长度可达理论极限值ASL=1。即使是在最坏的情况下,当N个数据经HASH函数转换后的地址均相同,所有数据均落在同一个“块”中,其平均检索长度ASL也只会下降到二分检索法时的平均检索长度。
4.本算法对于均匀分布的数据是极为有效的,通过计算得出其平均检索长度小于1.352(N>100时),因此检索效率很高。
5.本算法中的步骤HS1~HS12仅仅是为检索作的准备工作,相当于初始化的工作,只需在检索开始时做一次即可。
6.实验结果。为了对本检索算法的检索效率进行验证,我们用VB6.0编写了本算法以及二分检索法的程序,将二种检索算法的平均检索长度进行实际测定,实验中所用的数据由VB6.0的随时函数产生,数据的范围为(0~10000),实验结果如下表所示:
VB6.0程序二种检索算法平均检索长度对比表
我们在实验中测定平均检索长度时,通过程序对所有数据逐个检索,统计出检索完所有数据需进行比较的总次数再除以数据总数后得出。上表中当N=100时,本算法实际测定的值(1.38)与理论计算(1.352)略有误差,原因是我们用VB6.0中的随机函数产生的随机数在数据量较小时分布不一定很均匀。从表1中可以看到:当数据量稍大一些(N>100),本算法的平均检索长度的实测结果完全与理论分析一对致,并且远小于二分检索法的平均检索长度。本算法的平均检索长度随着数据量N的增加几乎不变。
篇3
科学文化素质,它是指个体学习和掌握系统的科学文化基础知识,尤其是现代科学文化的最新成果,形成合理的知识结构;获得基本技能、发展智能和能力(具备观察能力、记忆能力、想象能力、思维能力、自学能力、表达能力、组织协调能力,尤其是创造能力和动手操作能力),不仅乐于学习,而且形成会学习,具有求知欲望和勇于探索的精神。通过信息检索课程教育,授予“鱼”与“渔”,使其具有独立的思考能力与创新能力。努力全面培养受教育者的科学精神与人文精神,使二者密切结合,相互促进。[5]在着眼于基本素质的整体培养和发展,立足于更加综合、多元、全面的教育因素的同时注重共性和个性的辩证统一。
我国在2010年的《国家中长期教育与改革发展纲要(2010-2020年)》中强调了因材施教,鼓励个性发展,不拘一格培养人才,强调素质教育。提高受教育者的个性素质是素质教育的重要内容,培养个性素质的最佳途径是实施主体性教育,开展个别化教学。通过信息检索课程教学的差别化引导,促使个性由量变到质变的突破,与思想道德素质、科学文化素质并举。
图书馆信息检索课是获取和培养全面的信息素养的重要途径。使信息检索课程教育从辅、零重视到普遍性、基础刚性需求地位的转变;以教师为主到以学生自主、教师为辅的教学互动的模式的转变;从枯燥的技术技能教学向多元的教学内容转变;力争使接受教育者从被动学习到主动学习、创造性学习的态度的转变。受教育者每个人都是独立的个体,在身体和心理素质、遗传、兴趣等方面都各不相同,所表现出来的接受能力、学习能力也不尽相同,因此要注意学生间的个体差异。在教学中,应坚持“以人为本,因材施教”,避免“一刀切”的传统教育模式,进而引导受教育者的兴趣、激发学习和创造热情,从而充分发挥各自潜在能力与特长。
信息检索课程教学是培养学生掌握一定的信息检索知识、技术与方法,以及利用计算机解决本专业领域中问题的能力。它是促进国家科技进步的动力和源泉,是社会和谐稳定的基石。在信息检索课程学习中不仅要掌握知识、技术和方法,同时要带着兴趣学习,更重要的是使受课者具备在自己相关领域中发现问题、解决问题的能力,同时具有敏锐的信息嗅觉的能力和信心,从而推动社会的进步。科学技术是第一生产力,人类的劳动分为两种:一种为创造性劳动,一种为重复性劳动。在21世纪,我们置身于竞争日益激烈的市场经济环境中,归根结底是人才素质的竞争,是创造性的竞争。在提高学生全面素质中,要重视培养学生的创新精神和创造才能,以及独立获取知识并运用知识解决实际问题的能力。信息检索课程教育体系是一个开放性强,具有良好的发展空间的体系,创新是计算机教育的本质特征。信息检索课程体系的确立,要充分注重对受教育者兴趣的引导,通过对外部信息的感知和判断,形成内化的创造力。通过在教学中运用发现法和对非智力因素的引导,进而培养学生的创新能力和创新素质。
篇4
>> 化学化工科技查新信息检索新形势及策略研究 科技查新报告检索策略撰写格式探讨 浅析利用网络信息资源如何加强科技查新检索工作 试论科技查新中专利文献及检索 医学科技查新与文献检索 化学化工课题科技查新质量的控制 浅谈STN系统应用于化学化工查新检索 浅谈科技查新与文献检索之间的关系 基于SOA架构的交通科技项目查新检索系统的设计 科技查新检索服务工作的优化问题探讨 科技查新中专利文献的检索与对比分析 国防科技查新质量优化策略研究 科技查新质量的优化策略探究 工程硕士文献检索课与科技查新相结合的案例教学探索与实践 化工科技成果简介 化工科技成果介绍 化工科技创新成果简介 科技检索查新工作若干问题研究 从科技查新信息解读其地方科技创新的特点 科技信息检索的技巧 常见问题解答 当前所在位置:)、《化工品物性数据库》(http://.cn/search/template/chemcalwx-tmpl_index.htm)、《化工产品物性辞典》等。再次是进行项目分类分析。若是化工产品,初步判定是属于无机化工、石油化工、化肥与农药、涂料与油漆、聚合物、化学试剂、染料及颜料、食品和饲料添加剂、中间体、医药与生物化工、日用化工、香精与香料、催化剂及助剂、化工设备等产品类别中的哪一类。化工项目类别范畴相当广泛,其学科、专业分类方法很多,有针对各种文献管理的《中国图书馆分类法》、《国际标准分类法》、《国际专利分类法》,有用于政府部门和行业协会经济管理的《国民经济行业分类与代码》,有针对教育、科技统计、学科建设制定的《学科分类与代码》,有针对化工行业产品分类管理的《中国化工产品目录》,等等。对于化工类产品,可以利用《中国化工产品目录》了解分类,从中还可以了解某产品的名称、商品名、英文名称、产品代码、CAS登记号、类属名称号、产品用途、产品类别等。通过项目分类分析,可以知道研发项目主题范畴,还可以知道是侧重于产品还是方法,是产品性能的提高,还是产品工艺的改进。三是进行项目技术新颖性分析。根据项目资料,结合检索到的研究综述,可以初步了解研发项目的技术进展,国内外同类项目技术水平,进而了解其技术特点、技术创新。项目技术新颖性分析伴随着查新检索全过程,直至完成查新报告。
2 检索用信息源选择
随着计算机技术、网络技术的发展,数字化的信息源越来越多。为防止密切相关文献信息的漏查,也避免盲目搜索的劳命伤财,必须确定最基本、最低限度的科技查新检索用信息源。这些信息源范畴除了有科技、教育、医疗卫生等管理部门相关政策规定外,国内各科技查新机构都有自定的必检系统要求。查新员要针对具体化工科技查新项目做出判断,考虑其相关文献、相关信息主要贮存于何信息空间,选择合适的检索用数据库、信息源。
对于基础理论、工艺研发类化工科技查新项目,可以选择以期刊、专利文献数据库为主的检索系统。因为理论研究、工艺技术研究成果大多于期刊论文、会议论文、专利说明书上。笔者近日受理了一项题为“2-氯烟酸闭环法生产工艺”的科技查新委托项目。通过咨询项目委托人、阅读项目研制报告书、检索《化工辞典》等数据库后,分析判定,该项目是属于化工领域的工艺技术研发项目,并了解到项目产品属医药和农药中间体。可以初步选择CNKI、维普、万方期刊文献型数据库,会议论文数据库,专利文献数据库,科技成果类数据库等信息源。
对于查找以产品自身特征信息为主的化工产品,则应以Web搜索引擎和Web产品数据库为主,前者包括通用搜索引擎、专业搜索引擎、站内搜索引擎。因为网上产品信息大多以网页HTML文件形式贮存于各产品生产经营企业网站Web服务器中,作为网上产品广告和产品说明书,而这些网页HTML信息大多被Web搜索引擎索引。此外,还要充分利用网上Web产品数据库。
3 检索策略制定
检索策略的制定是理解课题内容、选择检索系统、设计检索结构式、考量检索结果相关性这一过程的反复循环过程,是不断调整检索式的检索过程。检索策略的具体体现是检索式,它控制着检索过程,关系到能否检索到最相关的信息,关系到查全率和查准率,还关系到信息查询速度和工作效率。设计合理的检索式成为控制和提高检索质量的关键。
在基础理论类、工艺研发类化工科技查新中,主要使用文献型数据库检索系统。由于大型期刊文献数据库有完善的检索功能,应充分应用布尔逻辑检索方法,选择利用各种检索入口,设计合理完善的检索式。例如,上述“2-氯烟酸闭环法生产工艺”项目,其查新点:(1)以烟酸为起始原料,闭环法生产2-氯烟酸;(2)采用专用闭环催化剂;(3)废水封闭循环使用,实现废水零排放;(4)产品总收率≥90%。分析项目内容认为,这是工艺方法类项目,应主要采用期刊文献、专利文献和科技成果类数据库等信息源作为主要检索系统。在试查中发现同类研究少,相关文献少。因此决定重点使用CNKI的《中国期刊全文数据库》,因为该库有全文字段,特别适用于难检和要求查全率高的检索项目。设计检索式:
#1.(2-氯烟酸+2-氯尼酸+2-氯-3-吡啶甲酸)
#2.#1*烟酸*闭环法
#3.#1*闭环催化剂
#4.#1*(废水零排放+废水封闭循环)
上述检索式的设计,针对了三个查新点。其中,第一检索式采用题名字段检索入口,其余采用全文字段,应用复合检索方式,即快又准又全。结果找到了几篇相关文献,其检索结果很满意。最后给出查新结论:
检索结果表明,河北亚诺化工有限公司等生产厂家、大学研究机构进行了2-氯烟酸合成工艺研究。其中,河北亚诺化工有限公司以2-氯-3-甲基吡啶为原料,通过高锰酸钾的氧化来制备2-氯烟酸,产率提高到65%。西安近代化学研究所、陕西师范大学用烟酸经双氧水氧化后再用POCl3/PCl5氯化得到2-氯烟酸。氯化时不加水,先加入POCl3,于100℃~110℃反应1h后再加入PCl5回流反应,收率95%,总收率87.5%。
综合分析相关文献可知,目前国内主要氯烟酸生产方法:氰基乙酸乙酯氯化后,与丙烯醛迈克尔加成,成环后水解制得;烟酸氮氧化-氯化-水解法;氰基吡啶氮氧化-氯化-水解法等。与国内同类项目相比,本项目技术特点是:采用闭环法生产2-氯烟酸;以氰基乙酸乙酯计,总收率≥90%;废水封闭循环使用,实现废水零排放。上述采用闭环法实现废水零排放的2-氯烟酸生产工艺技术,国内未见有文献报道。
在化工产品类项目的科技查新中,除了使用期刊、专利文献数据库外,还要重点使用Web搜索引擎等检索系统。譬如,笔者在接受查新委托项目“电子级异氰脲酸三缩水甘油酯(TGIC)”时,首先考虑项目产品属性,是强调工艺方法还是产品技术参数,具体的查新点,以及国内有无专利等问题。因此首先选用文献型数据库,设计检索式:
#1.(异氰脲酸三缩水甘油酯+异氰尿酸三缩水甘油酯+异氰酸三甘油脂二聚物+三异氰尿酸酯+TGIC)
#2.#1*(电子级+99%纯度+超细+氯含量)
#3.#1*(粉末超细比+深冷粉碎)
采用上述检索式首先在期刊、专利文献数据库中检索查询;再在诸如化工产品搜索、中国化工搜索、中国化工网、中国化工信息网、中国商品网等网站上的产品数据库中查询;最后用google、百度WEB搜索引擎查询,设计检索式:(“异氰脲酸三缩水甘油酯”OR“三异氰尿酸酯”)intitle:“有限公司”。最终检索筛选获得数篇相关文献,检索结果满意。
总之,国内有生产厂家研制生产出异氰脲酸三缩水甘油酯,但多为普通级TGIC。而本项目通过改进合成、环化工艺,采用深冷粉碎、无水工艺分离盐等技术,实现了电子级TGIC;产品纯度提高到99%以上,氯含量小于650ppm,粉末超细比≤10μm。目前,除本项目产品外,国内尚未见有生产厂家研制生产出电子级异氰脲酸三缩水甘油酯产品的文献报道。
4 结语
综上所述,制定化工科技查新信息检索策略,需要对化工科技查新项目进行技术分析,理解项目主要概念、分类归属、技术特点、技术创新等。据此,考量选择相应信息检索系统,进而统筹考虑检索步骤,应用所掌握的检索技巧,设计出科学合理的一系列检索式,并不断在信息检索过程中加以调整,直至查询获取满意的检索结果为止。
参考文献
[1] 谢新洲,等.科技查新手册[M].科学技术文献出版社,2004.
篇5
【关键词】 GPU 信息检索 CUDA
前言
多媒体技术与多媒体网络,为当前信息时代提供文字、数据、语音、图形、图像和音乐等多种信息方式,计算机在处理信息时所面临的主要问题是如何合理提高检索速度,实现多媒体信息流的结构化,方便检索。人们曾经将图形、视频等需要大量运算的功能都交与CPU完成,但用户对图形计算方面的需求不断的超出了CPU在计算能力方面的发展速度,需要一个专门的图形的核心处理器。GPU的出现填补这一空缺,它是相对于CPU的一个概念,GPU英文全称Graphic Processing Unit, “图形处理器”。 GPU是显示卡的“大脑”, GPU具有强大的计算能力,它将能处理的问题由图形领域扩展到了通用计算领域[1]。使可编程图像处理器发展成为计算技术领域的主力,与CPU上的串行算法相比,采用基于GPU平台检索算法最高可获得百倍以上的性能提升。已经冲击并超越CPU独霸的地位。
1. GPU的计算方法
在绘制图像时,GPU首先接收宿主系统以三角顶点形式发送的几何数据。这些数据由一个可编程的顶点处理器进行处理,该处理器进行几何变换、亮度计算等任何三角形计算。然后,这些三角形由光栅器转换成能够显示在屏幕上的单独“碎片”,所有碎片都通过可编程碎片处理器计算最终颜色值[2]。由于GPU具有高效的并行性和灵活的可编程性等特点,越来越多的研究人员和商业组织开始利用GPU完成一些非图形绘制方面的计算,并开创了新的研究领域:GPGPU(通用计算图形处理单元),实现如何利用GPU进行更为广泛的科学计算[4]。借助这些软件和GPU,软件开发人员可以基于CUDA平台开发计算软件,用户可以用比以往少得多的时间完成很多计算任务。能够基于GPU平台排序及线性方程组求解,实现并行的搜索算法[5],离散优化等科学计算。GPU在处理大尺寸图像时具有绝对的优势。例如在8192×8192尺寸图像的直方图生成中,排除内存分配、读回的时间和数据加载后,GPU的核心时间消耗仅为19ms左右,计算效率是CPU的17倍还多。
2. 基于关键词的Web图像搜索
信息检索技术是现在计算机领域的重要内容,而图像检索技术又是其中的重要内容之一。图像搜索是通过抽取网页中存在的图像信息并建立索引供用户查询的技术。基于关键词的图像搜索是指从信息页中抽取出图像的文字性语义描述,利用分类器进行计算所述图像集合中每幅图像与所述待检索语义之间的相关度,并进行加工整理和建立索引的搜索方式。
3. 基于GPU平台的检索方法
GPU作为一种加速工具不但应用到高性能通用计算领域,也可应用于Web图像搜索领域。 在文本索引中两有个关键算法:排序和查找。GPU上都能实现。对于排序算法,首先通过CPU的快速排序方法把等待排序的数据分成多个子序列,然后根据文本索引中数据结构的特点,在GPU上对子序列进行局部排序。完成在共享存储器和显存上的归并过程。GPU上的查询主要利用GPU的SIMT的特点实现多数据并行查询。 基于GPU平台的信息检索过程为:一 通过分析图像搜索系统中模块的执行流程,在CPU-GPU集群服务器上可以构建基于内容的图像搜索系统。 二 利用GPU上的图像文本语义抽取功能把信息分成多个块, 利用信息子块的视觉局部特征和属性提示来进一步精确提取图像的文本语义信息。三 对GPU上数据处理流程及编程模型在显存中构建层次型数据。四 以数据流控制降低CPU相对GPU的数据处理速度的落差。五 利用GPU的优化特性,采用自适应线程分配的方法完成由线程到数据的映射。基于GPU的信息抽取算法方法,能够使图像的文本语义信息描述更加细致完整,系统的功能和性能获得很大提升。
4. 结论与展望
GPU已经突破了很多技术屏障,在信息检索、数据挖掘计算机病毒码匹配和生物基因技术领域中都有应用。相对于CPU,以同样的市场价格选用更高计算能力的GPU是可行的。支持CUDA的GPU可以成为是由若干个向量处理器组成的超级计算机。GPU 的架构还会不断优化,被越来越多的大型计算采用,在以后的研究中还要对GPU的分支预测能力进行分析,建立简单的GPU性能模型,对于复杂的分支预测、控制流、数据流等方面,开发适合GPU的算法,以此来充分发挥GPU在图像搜索领域的检索能力。
基金项目:吉林省教育厅“十二五”科学技术研究基金资助项目(吉教科合字[2012]第371号)
参考文献:
[1] Macedonia M. The GPU Enters Computing's Mainstream[C]. IEEE Computer. Michael Macedonia,2003, 36(10):106~108.
[2] 吴恩华.图形处理器用于通用计算的技术、现状及其挑战[J].软件学报,2004,15(10):1493-1504.
[3] Mark W R,Glanville R S,Akeley K.A system for Programming Graphics Hardware in a C-like Language[J].ACM Trans Graph,2003,22(3):896-907.
[4] John D. Owens1, David Luebke, et al. A Survey of General-Purpose Computation on Graphics Hardware [J].Computer Graphics ,2007,26 (2) : 80-113.
篇6
一、前言
计算机的日益普及和计算机技术日益成熟,使得计算机在工业控制监测中的应用渐渐深入。但工业应用不同于其它方面,它要求有较强的实时性。现在有很多的DOS软件在运行过程中通过挂接外部中断方式实现DOS应用软件与外设的实时通信,这种方法实现起来十分简单。而在Windows中应用程序能否也能够利用外部硬中断实现外设与Windows应用程序的实时通信呢?答案是肯定的。这里的关键是要解决好中断代码与Windows应用程序相互之间交换信息的问题。
从外设发送异步的硬中断,通过中断处理程序传递一条信息给Windows应用程序。这时可以初始化相关端口,准备好数据,然后进行数据传送,从而做到实时通信。
实现Windows应用程序响应外部中断的方法有很多,如Microsoft公司自己开发的SDK、DDK软件包,使用嵌入式汇编等等。本文将介绍一种在BC++3.1的基础上利用Windows3.1拥有的一些功能实现Windows实时通信的实例。
二、中断代码的位置
在Windows中,几乎所有的异步事件都是由中断处理程序来管理的。中断处理程序包含在设备驱动程序中,由Windows在环境初始化中安装。例如,KEYBOARD.DRV、MOUSE.DRV和COMM.DRV均含有中断处理程序,以处理相应的键盘、鼠标和串行口的异步中断。可以仿照标准设备驱动程序,编写中断处理代码,以响应外设的通信请求,从而完成一次实时通信。
中断代码既可以包含在应用程序的可执行代码中,也可以包含在动态连接库(DLL)中。包含在应用程序中的代码只能在一个程序中使用,而在动态连接库中的代码则可以在Windows系统中所有的应用程序所共享。这样不仅在整个Windows系统中只有一个中断代码的副本,提高了内存的使用效率,更重要的是可以防止由于同时存在多个中断代码的副本而发生冲突。本文将在DLL中编制中断处理程序。
当动态连接库被装入时,要调用DLL库的入口点LibMain(),利用这一点可以执行一些初始化工作,可以分配一些内存块,可以初始化一些全局变量或者静态变量,可以安装中断服务程序的代码等等。例如:
voidinterrupt(oldIsr)(--CPPARGS)
/*旧的中断服务程序地址*/
LibMain(HANDLEhInstance,WORDwDataSeg,WORDcbHeapSize,L
PSTR
lpszCmdLine)
{
…
oldIsr=getvect(IRQNum);
/*IRQNum指中断号*/
setvect(IRQNum,newIsr);
/*newIsr指新中断服务程序代码*/
return(1);
}
函数setvect()既可在实模式下,也可在保护模式下设置中断处理向量。
上述代码也可以放在一个由用户设置的引出(export)函数中,在应用程序中用户可以调用此引出函数来安装中断服务程序代码。
由于中断可以在任何时刻发生,中断代码必须驻留在内存中,并且在应用程序运行的过程中一直处于某一固定内存中。这一点无论是在实模式还是在保护模式下都是一致的。
在DLL的模块定义文件中应注意:
1.CODE语句为固定代码段,即FIXED;
2.EXPORTS语句要引出被应用程序和其它DLL用作入口点的函数。
三、通信机制
编写实时通信例程关键在于必须认识到,异步事件对应用程序的触发是异步发生的,不在Windows的消息处理机制和多任务范围内。为了使通信例程能够正确地工作,通信例程必须通知Windows有异步事件发生,且不能打断应用程序的任务管理或消息流。要作到这一点,通信例程必须通过调用PostMessage或PostAppMessage函数向应用程序的消息队列中加入一条消息。
需要注意的是,在DLL中调用PostMessage(HWNDhwnd,…)时,必须先确定hwnd的实际值,可以通过使用引出函数的办法来实现,如下所示:
staticHWNDhWndApp;
voidFARPASCALSetIsrWin(HWNDhwnd)
{
hWndApp=hwnd;
}
然后在应用程序的窗口函数中,对WM-CREATE消息进行处理时调用此函数来初始化DLL中的静态变量hWndApp:
CASEWM-CREATE:
…
SetIsrWin(hwnd);/*hwnd指应用程序窗口句柄*/
定义一个在应用程序中使用的消息:
#defineISRM-RUPTWM-USER+255最后在DLL中的中断服务程序代码中,调用PostMessage即可完成Windows应用程序和中断服务程序代码相互的信息交流:
voidinterruptnewIsr(--CPPARGS)
{
…
PostMessage(hWndApp,WM-RUPT,wParam,lParam);
…
}
四、程序实例
篇7
关键词:高校图书馆信息检索检索服务
0引言
随着网络技术的迅猛发展,通过互联网提供的数据库及种类日渐增多。使得人们对于文献信息的查询、加工、存储、利用等方面有了更新的要求。作为高校图书馆以组织加工数字化信息及技术为广大读者提供有效信息服务,信息检索服务一向是高校图书馆重要工作的组成部分,尤以为教学科研课题的检索服务尤其显得重要,提供的文献信息对保障科研工作顺利进行起到不可忽视的作用。信息检索服务就是把图书馆的馆藏资源和网络资源通过整合和有序化,进行全方位、多途径为教学科研及广大读者提供快、精、准的信息服务和信息导航服务,来满足广大用户的信息需求。
1信息检索服务对教学科研的保障作用
图书馆作为教学科研的重要基地以及文献信息中心,是高校办学的重要支柱。高校图书馆信息检索的服务对象是教师和学生两大用户群。而高校图书馆的文献资源建设要依据高校的教学任务、教师和学生的信息需求,以及设置的专业学科和所承担的教学科研任务相适应,满足特色专业、教学科研建设的需要。信息检索是科研创新的基础。科研工作者要想进行某项科学研究,必须了解国内外科技发展水平的新技术、新动向。随着科学技术的高度发展,学科之间出现的交叉渗透越来越多,只有深入了解研究科学发展规律与相互作用,才能提高科研工作的知识创新点,才能更好得为教学科研提供保障服务。
当今网络技术的发展。通过互联网提供服务的数据库种类日渐丰富。信息量大、分布广、信息的自由性强,而用户面对浩如烟海的信息海洋,感到茫然无措,对网络与数字资源利用能力准备的不足,这就需要图书馆馆员通过信息服务为读者进行信息导航,为读者提供细致、周到、全方位的信息检索服务。由于教学科研工作者的精力相对有限,对学术研究的规范性要求较高,而获取准确、有用的信息需占用大量时间和精力,这将成为制约网络信息有效利用的瓶颈。高校图书馆开展信息检索服务正是为教学科研工作者了解各国同行的研究现状,进行科技追踪起到导航作用。
2信息检索的基本方法
高校图书馆信息检索的服务对象是教师和学生两大用户群。要为用户提供高效、准确、权威的信息资源,图书馆馆员需要充分利用自已的专业知识和长期积累的实践经验,依靠丰富的信息资源和强大的搜索引擎,灵活运用各种检索方式、技巧,来满足用户对信息的需求。针对用户需求进行分析是开展信息检索服务的基础。当图书馆馆员接到检索课题时,首先要和课题人进行交流探讨,对检索课题的主题结构、专业范围进行全面、正确的分析,弄清课题的内容实质及所涉及的主要概念及用户需要信息的具体内容。如用户需要的是文摘、索引还是全文等,以此来确定检索的范围。在掌握基本信息需求以后,还要对检索信息进行深度确定,只有这样才能确保检索信息的质量精准、到位。同时也是检索信息服务能否取得成功的关键。只有真正理解和把握用户的需求,信息检索服务与用户需求才能达到完整同一。
通过借助于网络检索工具查找信息,如较成熟的跨库检索系统CALIS统一检索平台、清华同方USP等重点学科导航库。利用搜索引擎进行信息检索。搜索引擎作为主要的网络检索工具,在信息检索中具有重要的地位。搜索引擎能提供用户进行关键词、词组或自然语言检索的工具。用户提出检索要求,搜索引擎就代替用户在数据库中进行检索,并将检索结果提供给用户。利用搜索引擎查找信息省时省力,简单方便,检索速度快、范围较广,能及时获取新增信息。但也存在不足,如利用计算机软件对信息进行加工、处理,其检索软件的智能性不高,检索的准确性不是很高,与人们的检索需求及对检索效率还存在一定偏差。通过在线数据库查询,利用在线进行数据库查询。访问网络数据库是用户获取学术性信息的最有效方法。网上数据库有很多,比如:超星数字图书馆、万方数据库资源系统、中国期刊网、中国维普数据库等。主题指南与搜索引擎结合使用,主题指南将信息系统地进行归类,使用户能方便地查找到某一大类信息,它的搜索范围要比搜索引擎小许多。搜索引擎查询较为全面充分,提供最全面、最广泛的搜索结果,但所提供的信息不如主题指南那样层次结构清晰,显得繁多杂乱。由于主题指南与搜索引擎各有优势,各有特点,通过对两者合理运用,取长补短以达到产生最佳结果。总之,针对不同目的的检索,选择合适搜索引擎是至关重要的一步。通过缩小检索的范围,①采用恰当的检索表达式。就是采用把一个短语作为一整体进行查询的办法。②限定检索范围,当检索的范围过大时,可对检索词的年代、语种、数量等检索范围进行限定。③采用进阶检索功能,就是利用前一次检索的结果作为后一次检索的依据,逐步缩小检索范围。④力求搜索具体化,在检索时明确检索课题的要求,限定查询范围,选择确切的检索词,使其检索要求具体化,有利于提高信息检索的准确率。还可通过其它方式如利用组合搜索关键词,利用强制搜索通过添加英文双引号来搜索短语词,这对查找名言警句时显得格外有用。模糊搜索即用*号通配符代替不确定的字或词等方式对文献进行信息检索。总之,只有采用多种方法的综合使用,才能获得较好的检索结果,才能更好地为教学科研及广大用户提供满意的服务。
3提高检索技术向知识服务发展
随着信息技术的发展网络信息资源的剧增,其分布性、异构性和动态性给信息检索带来了新的挑战。传统的检索服务已不能满足科研对文献信息检索日益增长需求,对新问题求解为目的的检索已成一种趋势,面对这种检索需求的转变。需要馆员对信息检索提供的深度要求有了更大幅度的提高。要求馆员在信息检索技术上进行资源整合。采用局部资源整合、文献资源深层次整合、数据库存资源层次的整合、异构数据库的同构化整合、基于文献内容层次的整合等。通过整合从而大大提高检索效率和资源利用率。高校用户在对信息内容综合性要求的同时,对所提供的文献信息及信息服务的深度要求也有了更大提高,因此在对用户提出的某一专业性较强课题时,这就要求馆员积极参与到课题的研究中去,从课题所属的专业角度出发,对其进行一系列的分析,并挖掘其深层含义,从而将分散在本领域和相关领域的专门知识与信息加以集中组织并有序化,从中提炼出有利于用户需求,具有创新思路的“知识因素”。向用户提供潜在内容知识、预测分析具有超前性领域的知识和成果,这将有利于检索质量的提高,也是高校图书馆今后进行信息检索服务的发展趋势。
总之,高校图书馆作为高校教学科研和读者服务的部门,必须进一步明确自身的定位,加强服务意识和创新服务举措,凭借自身在文献信息资源特有的行业优势,充分利用图书馆丰富的馆藏文献信息资源、特色数据库等资源,为教学科研工作提供优质、周到的服务,推动高校教学科研工作进一步的向前发展。
参考文献:
[1]杨玛萍.数字图书馆服务质量初探[J].科技情报开发与经济.2006(16).
[2]杨晓红.高校图书馆文献信息资源开发与服务创新[J].科技情报开发与经济.2005(21).
[3]刘芳兰.高校图书馆服务创新的探讨[J].湘潭师范学院学报.社会科学版.2005.(2).
[4]张玉峰.论知识检索与信息检索[J].中国图书馆学报.2003(5).
篇8
关键词:计算机;信息检索;应用;研究
中图分类号:TP391 文献标识码:A文章编号:1009-3044(2011)27-6688-02
1 计算机信息检索特点分析
随着信息社会的到来,计算机的检索在各方面得到了有效的应用,信息服务行业已成为推动经济发展的重要行业和主要的组成部分,信息检索作为利用信息资源的有效手段,为管理和决策提供了有效的依据,与传统的手工检索相比,计算机信息检索:
1)查找迅速,反馈及时,资源共享。计算机的信息检索过程中,联机系统中的中央主机采用分时技术,系统对用户的响应只需要几秒。检索反馈较快,响应的系统还能根据反馈信息,进行检索策略的调整,网络检索实现了信息资源的共享,用户能通过互联网与各种文献信息进行连接,从而获取所需要的信息资料。
2)检索全面,主题广泛,实时性强。计算机的联机检索一般能提供数十个到数百个数据库的检索,涉及的范围较广,覆盖了人们社会生活的各个领域和各方面。而互联网的信息检索则能通过数量庞大的、且处于不断更新状态下的信息资源的检索获得自身所需要的信息。计算机联机系统的信息查询中,大多数数据库的更新为数周,而金融、科研、社会动态等方面的数据库则能实现实时更新,从而满足用户多样化的信息需求。
3) 检索便利,功能完善,灵活组配。计算机的信息检索采取了逻辑运算模式,在信息检索过程中,能通过不同类型检索词之间的组配实现多样化的信息检索。同时还能对检索位置关系以及短语进行全文查找,建立多途径多样化的信息检索体系。通过使用网络web浏览器以及搜索引擎的利用,从而快速查找了互联网上的各种信息,检索便利。计算机信息检索过程中也存在不足,数据库的回溯实践段短,一般只回溯1970年以后的文献。信息检索系统的可靠性需要加强,应避免计算机信息检索过程中由于设备故障造成的信息检索过程中的障碍,造成时间上和经济上的损失。计算机信息检索的费用较高,检索费用高,对信息检索人员的知识水平、语言表达能力以及数据库的了解和掌握情况要求较高。检索的适应性在一定程度上不均衡。计算机信息的检索在用户能明确表示信息需求时具有较高的质量和效果,然而当用户的信息需求不明朗或是表达不准确时,则难以获得较好的检索效果。互联网上的信息检索,受到相应检索技术等各方面的影响,致使计算机检索的质量也不高。
2 计算机信息检索的途径
2.1 联机信息检索
联机检索服务是当前信息产业的重要组成部分,目前已形成了新兴发展的产业,也就是联机检索工业。联机检索是指用户通过终端设备的利用,实现信息需求按照一定的规范上的查询语言和检索语句进行组织并投入信息检索,并实现了检索信息的有效反馈。实现人机之间的实时对话,从计算机系统的数据库中查找出用户所需要信息的过程。连接检索系统通常由中央主机、数据库和国际通讯网络等部分构成。联机检索系统开发与之配套的联机检索软件,并利用中央主机对信息进行储存、处理和检索,以及整个系统的运行和管理。计算机的联机系统具有多台主机,从而保障信息检索的稳定性。联机数据库则以特定的方式实现了信息是搜集、整理加工和存储,并数据库则以某一特定的方式对信息进行收集、整理、加工和存储, 含有多种纪录类型的数据组合, 是联机检索操作的直接使用对象,联机检索系统是通过为用户提供数据库进行信息的搜索服务。数据库中的数据信息包括数据的记录、聚合与数据项之间的关系。具有以下几个特点:
首先,存储的数据之间存在着一定的逻辑关系,首先,联机检索中的数据库之间的数据是相互关联的,各数据集或数据项支架存在不同层次的逻辑联系,由此,数据库在信息的存储过程中,不仅仅存储了信息数据本身,同时记录了各数据项之间的逻辑关系。其次,联机系统中的数据具有独立性,联机检索中的数据库存储了大量数据及其具有复杂逻辑关系的数据集合体,然而其存储方式与应用程序相比是独立的。当对数据库中的数据进行修改时,不会对应用程序造成影响。第三, 数据实现了集中化控制。数据库可对数据的增加、删除、修改、检索进行集中控制和管理, 去掉重复数据, 提供多种保密性能。如可设置不同级别的通行字, 使机密数据库或私人数据库受到严格保护。联机的检索系统建立了与外界体系相隔的防护体系,从而在各企业的发展过程中起到了重要的作用。
2.2 网络信息检索
随着计算机技术和网络技术的迅速发展和广泛推广应用,世界范围内的信息交流和知识资源共享成为了可能,同时也给图书馆信息组织、信息检索以及信息 的获取方式造成了较大的冲击和影响。计算机互联网成为了最大的信息获取基地。互联网不仅为人们提供了数量巨大且处于不断更新发展中的信息资源,同时也提供了信息资源的搜索和服务的工具。据统计,全世界已有186 个国家和地区与互联网相联,网上有数亿网站和主页,联结了数千个大型图书馆、学术数据库、100 万个信息网和几千万主机,上网人数达1 亿。计算机互联网信息共享模式也为电子商务的发展创造了良好的平台,数字认证、基于Web 的语言翻译等技术的发展致使计算机互联网上的网民迅速增加。相应技术的发展为信息的检索和发展模式提供了有效的技术支撑,为用户提供可靠、简单而快捷的信息服务。网络信息资源的利用和检索能有效地提高信息的利用和共享程度,通过多种方式的检索实现了信息资源的有效交流和发展。
互联网的发展在很大程度上改变了信息检索、信息获取的方式。网上动态信息,也就是结构化信息,已成为互联网上最为常见以及应用最为广泛的信息资源。用户通过信息搜索,建立了满足自身发展需要的信息资源。新的网络信息检索工具便应运而生。互联网上信息检索方法有几种:
1)浏览,即在日常的网络阅读、漫游过程中,意外发现有用信息。浏览方式的信息获取不具有较强的目的性,由此也难以获得有效的信息检索模式。
2)沿着超链接进行浏览和检索,也就是利用超文本文档的链接从一网页转向另一相关网页,在转换网页的过程中不断扩大信息检索的范围,但沿着超链接的检索方式能在短期内获得与主题相关的信息,也可能偏离信息检索的目标。用户可在信息的浏览过程中创建书签或热键记录常用站点地址,建立常用的信息检索目录,缩小信息查找的范围。
3)网络资源指南, 专业人员对网络信息资源进行采集、整理、过滤控制等手段, 开发出可供浏览检索的网络资源主题指南,尤其是针对各学科专业的网络信息资源的指南。
2.3 网络信息检索特点
网络信息检索有如下特点:
1)扩宽了信息检索的空间。检索范围得到了有效的扩展,网络信息检索以互联网上是所有网络资源为检索范围。具备了其他信息检索方式不具有的优势。
2)实施交换式的作业方式。所有网络信息检索工具都具有交互式作业的特点,能够通过对用户命令的分析中了解用户的信息需求,反馈给用户需要的信息,计算机的网络检索还具有良好的信息反馈的功能,用户可以在检索过程中及时调整检索策略以获得更好的检索结果。
3)具有良好的用户界面友好和便利的信息检索和操作方式,网络检索采用交互式作业,系统透明、通用的Windows 界面和符合大多数用户检索习惯的用户接口都使检索变得简单易行,网络用户不需要太多培训就能上手操作,使用自己熟悉的方式输入查询提问,就可以实现对各种系统数据库的访问、检索。而联机检索则需要学习和记忆一系列检索指令和规则,一般用户只能借助专业人员的帮助才能使用。
3 结束语
计算机信息检索与传统的手工检索相比,具有良好的适应性,实现了高效的信息检索和利用模式,从而在企业、教育、政府的电子政务建设、电子商务的兴起和发展过程中奠定了有效的发展基础。计算机信息检索在各方面的应用反映了用户的多样化信息需求,而相应计算机检索的应用则在一定程度上反映了政府、企业以及各行业的发展需求,计算机检索体系为其发展创造了良好的技术支撑。
参考文献:
[1] 魏海霞.计算机信息检索的方法、策略与技巧[J].情报探索,2009(5).
[2] 蔡妍.当前高职院校图书馆读者工作的问题与对策[J].桂林航天工业高等专科学校学报,2010(2).
[3] 朱宁贤.计算机信息检索技术与学生信息素养培养[J].科技信息:科学教研,2007(22).
篇9
[关键词]多语言信息检索 信息可视化 界面设计
[分类号]G354.4
1 引言
在网络上收集不同语言的资料会面临一些困难:在检索不同语言资料时若将不同语言的检索结果混合排列,很容易互相覆盖检索结果或造成混乱。多语言检索的理想界面设计要能整合多语言检索结果,并注重多语言检索用户的满意度。如果尝试在搜索引擎上查询不同语言的信息,用户常用的方法是在各语言的检索界面中分别输入不同语言的关键词,在得到不同语言的检索结果之后再自行整理与分类。这样的步骤既复杂又没有效率,研究者设计新的检索界面要能针对用户需求,设法解决目前使用上的不便。目前已经有许多关于整合检索信息、信息可视化系统以及不同语言检索界面设计的研究,但是将多语言检索与信息可视化概念相结合在搜索引擎的研究上还比较少见。多语言检索是在网上搜索多种不同语言的资料,而信息可视化系统的运用能帮助用户分析资料并藉由和系统的互动得到更精确的检索结果。若能将两者结合并应用于检索系统界面的设计上,不但有助于让用户得到来自更多方面的信息,也能够运用图像帮助让检索结果更易于了解。本文的研究目的主要是依据用户的需要将多语言检索和检索可视化相结合,运用可视化技巧协助多语言检索的进行,并系统化地显示检索结果,让用户能够更有效率地得到需要的资料。
2 多语言信息可视化研究综述
本文首先将与多语言检索系统界面设计或可视化相关的研究文章进行整理。Chung讨论多语言检索的盛行对于系统设计以及用户行为的影响,文中检视现存的中文,西班牙文及阿拉伯文搜索引擎,并依据各搜索引擎的特色、功能与设计做整理与比较。他的研究利用实验测试了各双语检索网站与用户需要的检索界面并做可用性比较,透过用户测试发现网站设计理论是成立的。这篇文章中发表的网站设计概念包括了检索页、结果页以及分类、摘要还有可视化的功能。研究者在这篇文章中多次提及多语言界面设计必须要符合用户的使用习惯,也建议未来的研究能够将信息可视化与检索界面相结合。儿童数字图书馆(ICDL)是一个多国家多语言界面设计的范例,ICDL在设计界面时不做国际化或是地方化的设计,而主要依据网页的呈现和功能需求。这个研究所带来的启发是:图形的运用能够增加用户对系统的了解,并且无论对于不同年纪或是不同国籍的用户都有帮助。虽然本研究的系统用户族群和ICDL并非完全相同,但同样是提供不同语言用户的界面设计,因此可以从他们的研究中获得一点心得。
Zhang and Lin在发表的文章中做了三个搜索引擎的评鉴,并且列出了5个评鉴多语言检索系统的标准:搜索引擎的检索语言数目、多语言支援功能、翻译能力、协助功能和界面设计。他们设计出一套测试方式来检验搜索引擎的多语言服务,并做进一步的分析和比较,从而找出不同搜索引擎的优缺点。这个研究显示,大部分的搜索引擎还没有提供检索翻译功能,然而对于一个成功的多语言搜索引擎最重要的两个要点就是提供检索的语言数目以及翻译质量。Chau以及其他学者讨论了非英语搜索引擎的使用,并将研究测试结果与英语搜索引擎相比较,发现:有50%的检索只使用一个关键词,有90%的检索使用小于七个的关键词;因为字词的组成方式不同,每个检索词的字数会比英文检索还要多;中文检索中最常用的运算子是逻辑与“+”。此外,他们也讨论了中文检索的字元使用以及运算子运用议题。这个研究结果提醒其他研究者,不同语言的区域对用户的网络检索行为会产生影响,而信息可视化或许是一种可以用来消除语言隔阂的方法:在不同语言的检索界面上可以利用图标和颜色来帮助用户熟悉界面,再融入依照不同语言用户习惯设计的可视化技术如分类、阶层以及群聚。多语言检索能够藉由翻译功能来帮助用户查询。何大庆和吴丹使用相关反馈(relevanee feedback)来辅助多语言信息获取时的翻译,这种方式不但能帮助系统在翻译中摘录相关文件并且也能将这种方法应用在查询的翻译上。实验证明这是一种有效的方法,而翻译技术的发展也有助于使多语言检索系统在使用上更加便利与实用。
多语言检索也能藉由用户友好的界面设计来满足用户需要,Petrelli设计了一个以用户为中心的多语言信息检索系统(cross-lingual information retrieval sys-ten)模型,并要求用户对模型提出更改建议,然后根据用户的建议将检索系统重新设计一次。通过这样的使用测试他发现用户的一些偏好,包括:①虽然显示翻译过程可以让用户更容易修改查询词,但是他们还是比较希望能直接看到检索结果;②不同文化背景的用户会用不同的检索词,对结果也有不一样的期待;③对语言的了解可以增进检索结果的精确度。这个系统在设计时与用户互动,透过结果可知道了解用户需求对系统设计者来说是很重要的,而且除了文化背景、语言程度及用户的其他特性之外,界面设计也能影响系统的好用与否。Petrelli的研究突显出了解用户意见的重要性,在没计系统界面的同时也必须收集用户资料、了解用户习惯,并且在设计用户界面时考虑这些信息,此外,其他研究者整理出的用户需求也能作为系统设计的参考。下面总结以上几种多语言搜索研究的成果,如表1所示:
3 多语言信息检索系统可视化设计
本研究的系统设计结合信息可视化和多语言检索。研究之中所运用的理论包括信息可视化概念以及满足不同语言检索界面的设计需求。本研究的目标包括:信息可视化;设计合适的用户交互界面;支持双语的呈现。
信息可视化是一种结合图形、动态图像以及用户交互系统的信息表达方式,也是一种将对专业知识的了解与人类对电脑图像的认知结合的科技。所以在展示数量较多或是较为复杂的资料时,可以用信息可视化技术来协助用户了解信息。Shneiderman把信息可视化的资料形态分类成一维、二维、三维、时间、多面向、树状以及网络资料;并将信息可视化的功能分类为概观、放大缩小、过滤、随选详细资料、相关、历史资料、萃取信息。在检索可视化上比较常用的功能包括树状以及网络状的资料呈现,并搭配概观、放大缩小以及随选详细资料这些功能来与用户互动。信息可视化不仅能够运用图像将资料用合适的方式呈现,更可以将功能与资料呈现整合。许多搜索引擎都提供多语言检索功能,但是现有搜索引擎执行多语言检索时常常发生以下几种问题:多个语言的检索结果可能因为条
列式的排序方式而分散在大量的检索结果之中,或是因为不同语言检索结果交互出现而产生混乱。以谷歌检索为例,就算在语言偏好处设定检索结果的语言,和检索词相同语言的检索结果还是会自动排序在靠前位置。如果将语言也当做检索结果排序或呈现的一种选项,应该能更符合用户的需求。此外,对于不同语言的支持也是影响检索结果的另一个重点。
本文的研究将检索界面的设计加入信息可视化技术,让检索结果能够更有组织地呈现出来,也更能够满足多语言检索的需要。而要达到这个目标需要满足下面三个要点:①在界面设计上必须同时满足多种语言的使用习惯,并且考虑到多种语言不同的使用特性。例如英文是一个词一个词分开,中文却是每个字都有自己的意思,而且中文字的构造比英文相对复杂,如果字型太小会难以辨识。②要提供翻译或是语言选项来支援多语言服务,让用户可以选择查询词的语言和检索结果的语言。③将检索与合适的信息可视化系统结合,但要考虑到使用的便利性,不要过于复杂。此外,系统的信息检索与分类功能也是很重要的一环。要完成这样的研究必须将检索引擎的多语言检索结果使用图形化展示,让用户能够自行调整检索结果,并且使简洁的界面产生最大的功能。此外,未来也可在这样的系统里结合翻译以及检索优化的功能。
4 多语言信息检索系统可视化界面原型
综合以前学者所做的研究分析,并且依据多语言检索和信息可视化的概念,多语言检索要具备多语言使用的翻译与协助功能,并结合图像与资料,本文设计了一个多语言检索可视化界面见图1。
这个设计是以容易理解与使用便利性为优先考量的界面,且拥有以下的特点:①将不同语言的检索结果呈现在同一个界面上;②能将检索范围依据检索结果延伸或是缩小;③将检索结果做简易的整理;④引导用户做进阶检索。
4.1 将不同语言的检索结果呈现在同一个界面上
本界面尝试把中文和英文的检索结果同时显示,因此用户可以同时得到中英检索结果,将中英文的检索结果互相比较,并依序浏览或是从中选择最适合的信息,节省了重复检索的时间。
4.2 能将检索范围依据检索结果延伸或是缩小
将检索结果以信息可视化方式呈现也能将检索结果延伸,并且在显示关联性的同时提供用户可能需要的关键字,这种功能不但能协助用户探索更大范围中英文的相关资料,也能让用户将检索范围集中并提高检索结果的相关性。
4.3 将检索结果做简易的整理
多语言检索的结果资料笔数会更多,种类也会更繁杂,因此界面的简洁与容易了解是很重要的。本界面设计不仅能清楚地列出中文和英文的检索结果,也将检索结果做了概略的分类,增加用户浏览时的效率。
4.4 引导用户做进阶检索
在界面上可以看到关键字的翻译,例如输入检索词“春天”时也会同时显示英语翻译(spring)的检索结果,因此用户能够把关键字修正得更符合他们的想法。例如用户其实想知道关于春天酒店或是春天旅游的资料,也可以藉由可视化显示看到各个检索结果之间的关联性,用户可以借此让检索更符合他们的需求。
在使用上首先输入英文或是中文关键词,另一个语文也会自动进行关键词搜寻,并以图像表现各个主题词之间的关系,如果滑鼠按下与搜寻有关系的关键词,便能将相关的搜寻结果展开。这个界面延续了其他多语言界面的特性,然而清爽的界面让使用者更容易使用,图像也能辅助使用者使用双语思考,是其他双语系统所没有的设计。
5 未来发展方向
本研究为用户设计了一个可以简易整理与探索多语言检索结果的界面,也提供用户更多可以自行更改的选项。在将来的检索系统界面以及信息可视化设计中,研究者还可以将此系统界面设计朝以下几个方向发展:①将双语可视化技巧应用于不同检索结果中;②与翻译或是摘要功能相结合;③依据用户研究结果改进设计等。
5.1 将双语可视化技巧应用于不同检索结果中
目前只将同一个检索系统中的中英文检索结果在同一个界面整合,并且使用信息可视化技巧呈现。这种做法不但可以帮助用户整合检索结果,也便于比较和深入了解检索结果。未来更先进的系统设计可以提供更多的语言选项,也能与更多检索系统合作,让用户能自订检索引擎,将多语言检索界面应用到符合他们需求的检索结果之中。如此,不但可以扩大多语言检索界面的应用范围,让检索结果更符合用户需求,也让此设计的使用更具灵活性。
5.2 与翻译或是摘要功能结合
将多语言检索结果展示在同一个界面上之后,用户能借此机会对比双语检索结果并修正关键字,不过对于非母语的多语言检索不只需要展示和简易的分类功能,更需要翻译和语言方面的协助。此外,翻译功能也能协助用户了解不同语言的网页内容,进而将检索范围做适当的延伸或缩小。多语言检索在信息爆炸的现在是一种趋势,然而用户对于其他语言的了解可能无法满足他们对于多语言信息的需求。因此翻译或是简易的摘要功能都会有所帮助。
篇10
>> 浅谈网络时代的信息安全 试论网络时代多媒体技术在图书馆信息检索中的应用 网络时代下的音乐检索方法初探 信息时代医学信息资源检索的研究 浅谈网络时代的网络阅读 网络时代的信息构建 网络时代的信息规则 网络信息检索浅谈 浅谈网络时代的编辑素养 浅谈网络时代的学校建设 浅谈网络时代审计的变化 浅谈网络时代的作文训练 浅谈网络时代的营销变革 浅谈网络时代的受众观 泛在网络时代文献检索课如何培养学生的学习力 网络时代文献检索课教学内容的创新 浅谈信息网络时代的思想政治工作 浅谈信息网络时代城建档案价值鉴定工作的发展 网络时代的强制性信息传播研究 网络时代的信息与监管 常见问题解答 当前所在位置:l) GenBank是美国国立研究院(NIH)、美国国立图书馆(NLM)、美国国家生物技术中心(NCBI)于1982年建立的核酸序列数据库,免费提供所有公开发表的核酸和蛋白质序列及其生物学注释和书目文献等信息。它与日本DNA数据库(DDBJ)、欧洲分子生物实验室(EMBL)合作,形成国际核酸序列数据库协作体,每天交换数据,实现数据共享。基因库的数据来源有:从科学出版物中搜集核酸序列;科学家直接发送数据;测序中心以ESTs成批发送的数据;与其他核酸序列数据库之间的数据交换。GenBank提供了Entrez浏览器(Entrez Browser),用户可以检索GenBank、EMBL、PIR、SWISS-PORT、PDB等数据库的序列信息以及Medline中与序列有关的文献信息。
3因特网上查找医学信息的其他途径
目前常用的中文通用搜索引擎有:①百度搜索(http://)它是目前全球最优秀、更新时间最快、数据量最大的中文搜索引擎。它拥有目前世界上最大的中文信息库,总量超过8亿页以上,并且还在以每天几十万页的速度快速增长。②Google搜索(http://)它是目前最优秀的支持多语种的搜索引擎之一,也是万维网上最大的搜索引擎,现能搜索80多亿网页,课用多种语言进行搜索。③搜狐公司搜狗搜索(http://)到目前为止,搜狗搜索收录的中文网页近20亿,并且实现了4~5d全部网页更新,重要网站和链接每日更新,大大降低了死链接,空链接。④雅虎中国(http://.cn)曾是纯粹的分类列表时搜索引擎的代表。目前已经实现搜索全球38种语言网页并抓取10亿中文网页。
通用搜索引擎提供的是包罗万象的查询,为了快速、准备的获得所需的医学信息,需要选择适当的检索策略。如选择合适的关键词,缩小或扩大检索范围等。
网络信息的多样性、分散和无序,影响了网络信息的检索质量。2001年出台的MPEG-7国际标准解决了多媒体信息描述的标准问题,实现了快速有效的搜索。标准化是网络信息检索的根本性技术保证。[1]智能检索是基于自然语言的检索形式,它把现代人工智能的技术与方法引入信息检索系统,机器根据用户提供的以自然语言表述的检索要求进行分析,而后形成检索策略进行搜索,使信息检索系统具有一定程度的智能特征,在更高的层次上完成其功能。[2]因此,网络医学信息检索将向着规范化、智能化的方向发展。
网络与数据库的应用与发展,为医学的快速发展提供了条件。在网络时代,充分利用信息资源是实现医学事业快速发展,提高医疗水平的关键因素之一。了解现存的信息获得途径,并掌握合适的医学信息检索方法,对医务工作者具有重要意义。
参考文献:
相关期刊
精品范文
4信息简报