首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 31 毫秒
1.
双语机读词典是基于查询翻译的跨语言信息检索中的常用资源,但是传统的手工构建词典的方法费时费力,本文利用统计方法从英汉句对齐平行语料库中自动获取翻译词典,以用于查询翻译过程中。  相似文献   

2.
本文分析了跨语言信息检索的现状,介绍和描述跨语言信息检索的主要问题,并针对万方数据和NSTL的现有资源,构建出基于科技文献的跨语言信息检索原型系统,此原型系统通过字典查询得到检索词翻译,应用Google在线翻译进行标题、摘要翻译,并预留中国科学院自动化所提供的翻译引擎扩展.跨语言信息检索强调检索结果翻译的可读性,帮助用户理解基本大意,不刻意追求准确性,力求在应用过程中促进机器翻译技术的进步和发展,辅助科研.  相似文献   

3.
从检索方法、结果展现和评估方法三方面分析跨语言信息检索的现状,引出翻译检索一体化的跨语言信息检索方法,把翻译、检索结合在同一检索模型中.一体化将翻译和检索中的不确定性组合在一起,从而做出更全局的优化,减少跨语言信息检索与单语检索之间的差距,从而充分利用单语检索中的有用方法;并针对万方数据现有资源,构建出面向科技文献的跨语言信息检索系统框架.  相似文献   

4.
桂思思  张晓娟 《情报科学》2021,39(12):39-45
【目的/意义】查询意图歧义性对检索模型提出了挑战。针对查询意图歧义性程度,探讨了基于歧义程度的 多样化检索模型的检索效果。【方法/过程】将查询意图歧义性程度的表示方式分为序数变量或连续变量两种方式, 在此基础上,提出了基于三种排序策略的面向序数变量查询意图歧义性的多样化检索模型、基于查询重构的面向 连续变量查询意图歧义性的多样化检索模型,从而使得检索结果列表同时具有较高的覆盖率与新颖性。【结果/结 论】在公开数据集上,四个检索效果测评指标 α-nDCG@5、α-nDCG@10、α-nDCG@20 及 NRBP@20 表明,本文 提出的多样化检索模型优于基准实验,且获取准确的查询子主题能有效提升检索效果。【创新/局限】区分了查询意 图歧义性程度的两种表示方式,据此提出并验证了面向查询意图歧义性程度的多样化检索模型;然而限于实验运 行复杂程度,生成初始检索结果列表数据略少。  相似文献   

5.
【目的/意义】全面分析中外科技文献可以把握当前某个领域或主题的研究热点和研究趋势,为了应对机器 翻译在分析海量外文科技文献时存在的科技术语翻译“领域不一致”问题,需要对科技术语信息匹配进行研究。【方 法/过程】提出了一种基于领域知识库的科技术语信息匹配模型,通过利用领域知识库构建领域多义术语词典,为 科技术语匹配更多翻译候选,并结合语言学特征、领域信息以及LSTM语言模型来挑选最合适译文。【结果/结论】用 化工领域的数据进行测试,验证模型的有效性,为深入分析外文文献中的技术理论提供了可靠又便捷的方法。  相似文献   

6.
李莉 《情报科学》2018,36(5):90-93
【目的/意义】文章将智能代理 Agent 技术引入高校数字图书馆个性化信息检索服务中,通过建立基于多 Agent技术的数字图书馆个性化信息检索服务模型,以期改善高校图书馆用户获取信息资源准确度低的现状。【方 法/过程】文章首先阐述了现如今数字图书馆个性化信息服务面临的问题,然后对高校图书馆用户群信息需求加以 分析,提出了基于多 Agent的个性化信息检索总体结构和检索模型的设计原理,最后在此基础上,结合高校数字图 书馆的具体情况,构建了基于多 Agent的数字图书馆个性化信息服务检索模型。【结果/结论】此检索模型在提高数 字图书馆智能化、查询精确化、服务人性化及提高用户满意度等方面是很有意义的。  相似文献   

7.
跨语言信息检索的知识图谱研究   总被引:1,自引:0,他引:1  
在ISI的WebofScience中以“跨语言信息检索”为主题进行检索,利用共引分析、共词分析、信息可视化等方法和技术,借助CiteSpace1I信息可视化软件绘制跨语言信息检索研究领域的文献共引网络图谱、热点词汇图谱以及前沿词汇图谱,直观地展示和分析不同时期跨语言信息检索领域的代表人物及代表文献,揭示其研究热点,探测其研究前沿及发展趋势。  相似文献   

8.
目前大多数机器翻译和跨语言检索系统都是基于通用语料,对外文科技资料的翻译效果不理想,本文结合科技文献的加工方法,研究面向科技文献的跨语言信息检索系统的模型。首先对跨语言信息检索的概念和特点进行简单的概述,从3个角度介绍跨语言信息检索的研究方法,然后讨论构建跨语言信息检索系统的必要性,在此基础上设计出一个面向科技文献的跨语言信息检索系统模型以及主要功能结构。  相似文献   

9.
桂思思  徐健 《情报科学》2021,39(11):90-95
【 目的/意义】针对查询意图歧义性自动识别,探讨特征有效性及采用不同分类算法识别三类查询意图歧义 性的分类准确率,以期对后续研究提供借鉴与指导。【方法/过程】首先提出了一个面向查询意图歧义性的查询表达 式分类体系;随后,构建了查询表达式特征及相关文档特征共六类;最后,分别采用决策树算法、神经网络算法及k 最邻近算法,探讨采用不同特征组合的有效性及不同分类算法的分类准确率。【结果/结论】①分类准确率较基准实 验提升比例为49.5%;②使用查询表达式特征分类优于使用相关文档特征;③决策树的分类准确率略高于其他两类 分类算法。【创新/局限】构建了一个面向查询意图歧义性的查询分类体系;完成了面向三类查询意图歧义性的分类 任务;然限于数据集获取途径,仅对200数据验证。  相似文献   

10.
郑伟  侯宏旭  武静 《情报科学》2018,36(6):136-141
【目的/意义】贝叶斯网络是描述随机变量之间依赖关系的图形模式,被广泛应用于不确定性问题的智能求 解。【方法/过程】文章介绍了信息检索领域中基于贝叶斯网络技术的三种检索模型-推理网络模型、信任度网络模 型、贝叶斯网络检索模型,详细地分析了其工作原理、论述了国内外研究者使用贝叶斯网络在信息检索领域的研究 现状,探讨了每种模型的优势与不足。【结果/结论】指出了贝叶斯网络技术在信息检索领域的发展趋势.  相似文献   

11.
跨语言信息检索的理论与实践   总被引:13,自引:0,他引:13  
郑敏 《情报理论与实践》2003,26(3):223-225,212
在利用因特网进行信息检索时 ,有一块巨石已经越来越明显地阻碍了人们对于信息的获取和理解 ,那就是语言障碍。也就是说 ,人们现在所能够理解和利用的信息只是整个网络信息资源中的极少一部分 ,很多信息由于是用人们所不能理解的语言来表达的 ,因而不能被人们所利用。针对这种语言障碍 ,人们相应地提出了不少解决方案 ,如提供在线翻译的词典、对网页进行在线翻译、建立跨语言信息检索系统、构造跨语言搜索引擎等。本文将试图从理论和实践两方面对跨语言信息检索的研究现状进行展开和分析 :理论方面主要介绍了跨语言信息检索领域的 4次重要会…  相似文献   

12.
基于改进KS方法的食品安全追溯信息检索模型   总被引:1,自引:1,他引:0  
针对Web网络环境下的食品安全追溯信息检索存在的问题和KS方法的不足,建立了基于改进KS方法的信息检索模型,该模型采用改进KS方法的关键技术,利用元搜索引擎结构,提取领域标引词并设置标引词权值,生成反映食品安全追溯信息领域文献特征的查询扩展式,进而对搜索引擎返回结果排序,最后通过实验表明,该模型取得了较好的检索效果,为管理机构提供了有价值的食品安全追溯信息。  相似文献   

13.
跨语言信息检索研究与应用   总被引:2,自引:0,他引:2  
本文在介绍跨语言信息检索(CLIR)的相关概念、实现步骤和方式的基础上,重点阐述CLIR的关键问题和对策以及相关翻译技术,并就其在元搜索引擎中的应用进行探讨,将CLIR的技术平台与元搜索引擎的系统结构相结合,设计出基于CLIR的元搜索引擎系统模型.  相似文献   

14.
【目的/意义】大数据背景下,优良的多媒体信息检索系统是提升数字图书馆交互性,促使其知识服务升级 的关键。【方法/过程】调研主流数字图书馆的多媒体信息检索系统,发现主要存在“未充分利用跨模态相关性”、“未 有效组织多媒体资源”等问题。从“跨模态相关性分析”、“层次化知识推理”等方面提出优化方案并实证分析。【结 果/结论】系统检索性能提升,这表明:运用深度学习、知识表示学习等理论优化多媒体信息检索系统,可更好地满 足用户知识需求,进而提升数字图书馆知识服务质量。  相似文献   

15.
刘东亮  岑丹  赵浩宇  刘伟 《情报科学》2021,39(12):80-86
【目的/意义】文献信息资源是人类进行跨时空交流,认识和改造世界的基本工具,但是在实际应用中存在 着信息相对滞后、部分信息尚待证实的现象。【方法/过程】以本市某高校图书馆为实验对象,对全校文献信息资源 进行数字编目、信息整理和加工处理,以此构建文献信息资料数据库,在校园网中提供流通和信息检索服务,实现 文献信息资源的共享、共建以及共知。利用最小化目标函数,对文献信息资源进行优化分配处理,按照不同调度目 标对信息资源服务的顺序进行指定,最终实现了信息生态链动力机制下文献信息资源的集成管理。【结果/结论】测 试结果显示,本文方法在对文献信息资源集成管理的过程中,文献信息资源内的集成耦合度和文献信息资源间的 耦合度均较高,有利于提高信息资源利用率,实现资源共享,由此验证了本文方法具有良好的性能。【创新/局限】从 信息生态链动力机制视角下,对文献信息资源集成管理,有效提升了文献信息管理能力,但是实际应用过程中的系 统延时能力、CPU使用率、数据丢包率等方面仍有较大提升空间。  相似文献   

16.
文章从跨语言检索的概念、类型、理论、实现方法以及关键技术这几个方面简要对跨语言信息检索技术的发展进行总结与展望。  相似文献   

17.
针对如何从丰富的网络信息资源中进行准确、快速检索有用信息的问题。介绍了基于词条空间矢量搜索的基本理论,设计了基于词条空间矢量搜索的Web信息检索系统模型,并采用Java语言完成了基于词条空间矢量的Web信息混合搜索引擎的设计,应用实验证明,该方法比单一搜索引擎具有更深入、更细致的站内全文搜索能力,比关键词标引具有更准确的文档内容表达能力,在基于内容的查询和信息过滤等方面有很好的应用前景,为实现网上信息检索的个性化服务、主动信息服务,为进一步提高Web信息查询的查全率和查准率提供了一种新的思路和方法。  相似文献   

18.
李春杰  马建玲 《情报科学》2019,37(4):157-164
【目的/意义】图情领域在数字资源发现、组织与应用中越来越多使用到信息抽取技术,本文将对该领域在 信息抽取技术方面的研究进展及应用情况等进行分析,为本领域相关人员提供参考。【方法/过程】以国内图书馆 学、情报学领域中国核心期刊和国外33种图情期刊为信息源对其中刊载的信息抽取相关研究成果进行计量分析, 检索过程不设置时间限制,并利用CNKI、EndNote、Excel、Python分析工具对主题相关的165篇中文文献和35篇外 文文献进行年度趋势分析、期刊发文量分析、机构分析、作者分析以及论文主题分布研究。【结果/结论】得出图情领 域信息抽取研究的发展趋势、重要的信息源、重要作者、主题研究以及信息抽取技术在图情领域的具体应用。  相似文献   

19.
[目的/意义]旨在探讨解决原英日文献检索分析中存在的不足,实现以中文为检索语言的中、英、日文献资源的统一检索。[方法/过程]介绍了一种通过机器翻译技术实现以中文为检索语言的中日英文献资源的统一检索系统。[结果/结论]该系统基于MASH-UP技术将检索结果整合进行统一的内容分析,帮助用户跨越语言的障碍,方便地查询和使用外文文献。  相似文献   

20.
基于面向主题和面向分类相结合的搜索引擎   总被引:2,自引:0,他引:2  
李树青 《情报杂志》2005,24(10):69-71,74
搜索引擎已经成为互联网信息检索的主体,然而,它的查全率,特别是查准率却比较低,原因主要在于两方面,一个是技术原因,另一个是搜索引擎和用户的接口界面设计上存在障碍,使得用户无法有效地根据搜索引擎的提示调整检索策略,搜索引擎也无法以一种方便用户操作的合理方式来展示查询结果。分类目录和主题检索的联合方法是在现有技术条件下解决此问题的有效途径。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号