首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 264 毫秒
1.
基于主题图的英汉跨语言检索模型构建   总被引:4,自引:3,他引:1  
针对现有跨语言检索模型普遍存在的翻译准确性差、效率低、成本高等不足,在深入分析主题图技术在揭示语词概念之间的语义关系和多语言支持等方面的优越性能的基础上,提出一个基于主题图的英汉跨语言检索模型,该模型采用索引翻译的策略来实现跨语言检索。该模型的突出特点是能够在提高翻译准确性的同时,有效降低翻译成本。此外,实现起来也比较简单。  相似文献   

2.
FCA中的概念语义相似度计算   总被引:2,自引:0,他引:2  
形式概念分析和领域本体是两种形式化方法,其目标都是构建概念的模型。提出一种计算FCA中的概念语义相似度的方法,实验结果表明,该方法对概念语义相似度计算是有效的。  相似文献   

3.
中国索引事业:当前格局与问题   总被引:4,自引:0,他引:4  
张琪玉 《图书馆杂志》2006,25(1):3-5,13
本文指出我国索引事业当前以网上文献数据库为主的传统索引、网上文献数据库和网络信息检索工具三分天下的新格局已初步形成,并说明网络信息检索工具、网上文献数据库、传统索引、索引语言、索引创新、索引知识普及、中国索引学会等诸方面的问题。  相似文献   

4.
阐述了索引的概念与功能,详细介绍了现代索引的类型,并指出我国索引业已形成以网上文献数据库为主的传统索引、网上文献数据库和网络信息检索工具为主的新格局。  相似文献   

5.
本文指出我国索引事业当前以网上文献数据库为主的传统索引、网上文献数据库和网络信息检索工具三分天下的新格局已初步形成,并阐述网络信息检索工具、网上文献数据库、传统索引、索引语言、索引创新、索引知识普及、中国索引学会等诸方面的问题。  相似文献   

6.
针对传统信息检索模型不能很好满足用户需求的问题,在分析现有相关研究的基础上,提出基于领域Ontology的知识检索模型。通过构建领域Ontology,对文档进行语义标注,对查询请求进行概念提取和语义扩展,从而得到语义索引项作为文档和用户请求的知识表达,进一步研究领域Ontology中词语间语义关系的计算模型。考虑到语义相似度与语义相关的内在关系,给出相关系数来衡量检索目标与候选者间符合程度。最后对提出的模型进行验证,结果表明检索性能有显著提高。  相似文献   

7.
识别不同学科间共有的研究内容是学科交叉知识发现的一种研究思路。学科间具有相似语义的研究内容,能够更好地体现学科之间知识的融合、交流现象。针对从科技文献数据中获取语义相似学科交叉研究主题的问题,本文提出了一种基于无监督对比学习的科技文献及关键词语义相似关系表示学习方法,构建了一种语义相似学科交叉主题识别模型。该模型将Spearman相关系数作为评价学科交叉主题的指标,解决了现有研究缺少学科交叉研究数据集的问题。研究结果表明,本文模型较好地获取了科技文献及其关键词之间的语义相似关系,能够较好地反映两个学科之间的交叉态势。  相似文献   

8.
基于文本的信息过滤模型   总被引:1,自引:0,他引:1  
信息过滤技术用于帮助用户在动态信息流中过滤出用户感兴趣的信息。通过对信息过滤概念的阐述,抽象出这类系统的一般模型。介绍了布尔模型、向量空间模型、潜在语义索引模型和神经网络模型等四种信息过滤模型,并就其特点进行了分析。  相似文献   

9.
经典向量空间模型中关键词相互独立的基本假设,造成了检索性能的限制.针对这一问题,本文介绍并分析了国内外学者对经典向量空间模型提出的改进研究.针对其研究的不足,通过分析经典向量空间模型的特点,构建领域本体以建立向量空间模型中关键词之间的语义联系,通过计算关键词之间的语义相似度,提出语义增量的概念,对关键词之间的语义联系进行量化分析.结合语义增量,对TF-IDF算法进行了改进,提出了STF-IDF算法,据此建立了语义向量空间模型,以期待提高经典向量空间模型在语义检索方面的性能.最后用实例验证了该模型在查全率和查准率方面均要优于原模型.  相似文献   

10.
生物医学文献的数量正在以爆炸性的速度增长,这些文献中隐含着大量有用的信息,挖掘这些文献可以形成医学假设.挖掘UMLS语义资源进行计算逐渐成为基于文献的知识发现的热点.Miyanishi等通过概念的语义相似度计算事件相似度取得了比统计方法如tf*idf更好的结果.本文在概念的语义相似度的基础上,加入了概念的语义关联度,避免了事件之间语义相似度高而缺乏语义关联度并导致发现的假设不合理的弊端.本文的方法充分挖掘了UMLS中的语义资源,合理地计算了事件之间的相似度.通过雷诺氏病和鱼油以及偏头痛和镁的实验证明,这种计算方法取得较好的效果.  相似文献   

11.
本体在跨语言信息检索中的应用机制研究   总被引:3,自引:1,他引:2  
解释多语本体的含义,指出其在不同语言中所对应的领域知识,分析多语本体在查询扩展、语义标注、基于概念索引3方面对改善跨语言信息检索的作用,并通过介绍EuroWorldNet和Cindor系统的多语本体概念的对应方法,探讨本体应用于跨语言信息检索最关键的多语本体库的映射方法,认为采用中间语言作为概念表示、并通过词典翻译对照与不同语种的词汇建立链接关系是多语本体映射的一种良好方法。  相似文献   

12.
知识组织系统是对传统情报检索语言及新型知识组织工具的统称。文章分析了知识组织系统产生的背景,归纳出网络环境中知识组织系统的主要特点,介绍了知识组织系统的元数据描述模型和术语描述模型,并分别从功能、内容和结构三方面提出知识组织系统的评价指标。  相似文献   

13.
康艳  张虹  侯汉清 《图书情报工作》2007,51(10):139-142
随着网络信息技术的发展和搜索引擎的兴起,传统情报检索语言在网络环境下存在的必要性受到质疑。用网络信息检索的大量实践回答检索语言能否适应网络信息组织这个问题。首先列举分类语言和主题语言在国内外网络应用的大量实例,然后以其自身的优势来说明检索语言存在的必要性,并分析他们在网络环境下表现出的强大生命力。  相似文献   

14.
基于受控词表互操作的集成词库构建研究   总被引:2,自引:0,他引:2  
目前,国内外信息领域都在致力于受控词表的互操作研究.本文以教育类数据为例,通过对检索语言互操作技术的研究,借鉴国内外实现不同受控词表之间互操作的经验和方法,建立一个以<中分表>为核心的兼容体系,即建立一个可以不断扩充的集成词库.为了便于浏览和使用词库数据,采用单机模式、XML格式及本体构建工具对词库兼容数据进行可视化显示,进而为用户提供各种服务.  相似文献   

15.
科技期刊论文分类标引的探讨   总被引:13,自引:7,他引:6  
讨论分类语言的功能、论文分类标引的意义和选择分类语言的原则.分析我国论文分类标引的现状,对更适用于我国科技期刊论文的分类语言及其标引方法提出了看法和建议.  相似文献   

16.
情报检索语言与主题网关   总被引:13,自引:0,他引:13  
论文以主题网关的典范——英国社会科学主题网关(SOSIG)为例,分析了主题网关利用情报检索语言的做法,包括对分类语言、主题语言和自然语言的利用。最后得出情报检索语言在网络环境中仍然可以发挥信息组织的有效作用;同时为了更好地适应网络环境,应当对情报检索语言进行必要的改造。  相似文献   

17.
18.
一种改进的余弦向量度量法文本检索模型   总被引:2,自引:1,他引:1  
付永贵 《图书情报工作》2011,55(19):115-119
针对用户对索引项要求的不同提出改进余弦向量度量法(ICVMM)文本检索模型,该模型将索引项分为主索引项和特征索引项,根据查询相关文本集中特征索引项相关性概率值来修改文本和查询特征索引项的初始权值;通过实例对传统余弦向量度量法(TCVMM)文本检索模型和ICVMM文本检索模型的查询效率进行对比,说明ICVMM文本检索模型的查询结果更接近用户的需求。  相似文献   

19.
Recent years have witnessed considerable advances in information retrieval for European languages other than English. We give an overview of commonly used techniques and we analyze them with respect to their impact on retrieval effectiveness. The techniques considered range from linguistically motivated techniques, such as morphological normalization and compound splitting, to knowledge-free approaches, such as n-gram indexing. Evaluations are carried out against data from the CLEF campaign, covering eight European languages. Our results show that for many of these languages a modicum of linguistic techniques may lead to improvements in retrieval effectiveness, as can the use of language independent techniques.  相似文献   

20.
[目的/意义]以公共图书馆、博物馆、美术馆和群众艺术馆数字资源整合为例,探讨通过赋予受控词汇"身份",提高资源检索的效率的方法。[方法/过程]定义多维坐标系统空间面、主题坐标轴和坐标点;通过为词汇概念赋予标识符,建立概念与词汇的关联,按一定规则为词汇赋予"身份",以概念优选机制、关联数据技术与索引表构建作为其辅助。此外,通过解析用户检索词语义,构建语义标识符,并对概念标识符进行拆分、组合,利用测算标识符点距的方法建立语义标识符与概念标识符之间的映射关系,实现检索维度优选。[结果/结论]多维坐标系统的坐标关系模型以"面-线-点"的坐标关系处理层次为基础,以"概念定位-词汇定位-资源定位"的检索层次为依据,并结合优选、关联与索引,拆分、组合与点距等相关实现机制,通过量化方法来处理词汇关系,能够提高机器对词汇的理解。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号