共查询到20条相似文献,搜索用时 46 毫秒
1.
2.
基于本体的文本信息检索研究 总被引:5,自引:0,他引:5
本文对如何构建基于本体的文本信息检索系统进行了探讨.并认为,利用反映概念之间关系的领域本体指导主题标引,利用反映实体之间关系的领域本体指导实体关系标引,并以本体的形式表示文档替代物和查询表达式,可以进一步提高文本信息检索系统的性能。 相似文献
3.
4.
5.
传统信息检索方法忽视了文档结构对信息检索过程的影响.本文提出了一种改进的基于文档结构的信息检索方法,该方法首先使用第一类特征域对检索文档集进行过滤,然后使用第二类特征域进行匹配排序;引入AHP方法动态确定各特征域的重要性权重因子;最后使用向量内积计算的方法合成总相似度值.实验结果表明该方法可以提高信息检索的查准率和检索结果的排序合理性. 相似文献
6.
目前,常用的全文搜索引擎都是基于关键词检索的,其查准率和查全率都较低,并且返回记录太多,重复信息过多,使得搜索引擎的查询效率很低。基于此,提出了一种基于本体的搜索引擎模型,通过提取的文档中概念,确定其所属的领域本体,以此归类,并用文档—概念匹配系数建立索引。搜索时,采用基于概念匹配的方式进行检索,对属于不同领域本体的文档,分类输出。提高搜索引擎的查准率和查全率,减少冗余信息,从而提高搜索引擎的查询效率。 相似文献
7.
8.
人们在利用搜索引擎进行信息检索时,较少的检索词难以反映用户真正的检索意图,因此对用户输入的检索词进行扩展尤为必要。对传统的查询扩展进行了改进,通过建立领域本体,借助本体及本体的推理机制,将用户输入的检索词从直接和间接两方面扩展为语义联系的查询关键词集合,以提高信息检索质量和效率。 相似文献
9.
基于本体的跨语言信息检索在数字图书馆中的应用 总被引:2,自引:0,他引:2
首先对跨语言信息检索和相关技术进行了介绍,了解当前跨语言信息检索技术的不足,然后阐述了传统跨语言信息检索技术在数字图书馆应用中的局限性,并由此引出了基于本体的跨语言技术。最后提出了一种基于本体的数字图书馆跨语言信息检索系统,并详细阐述了系统的流程,着重讲述了数字图书馆跨语言领域本体的构建。由于本体具有良好的概念层次和对逻辑推理的支持,对源语言和目标语言进行语义扩展,提高了数字图书馆跨语言系统的检索效率。 相似文献
10.
【目的/意义】使用人工或常用软件工具获取本体概念及概念间关系已无法满足自媒体环境下大数据的本
体构建及维护的要求,本文尝试用自动或半自动方式予以实现。【方法/过程】对电子商务领域原始语料进行分句、
分词等预处理,构建领域语料库;使用基于语言学以及统计学的方法提取电子商务领域本体概念,同时提出基于混
合策略的本体概念抽取方法;然后使用基于语言学、聚类的方法提取电商领域本体概念与概念之间存在的分类关
系,使用基于关联规则挖掘的方法抽取其本体概念与概念之间存在的非分类关系。【结果/结论】将文本挖掘与本体
构建结合起来,提出了领域本体概念及概念间关系自动抽取与本体构建方法,实验表明使用本体框架 Jena利用此方
法可以自动构建电子商务领域本体,并可将其应用到通用的语义检索系统中。 相似文献
11.
本体在信息检索中的作用及实例研究 总被引:5,自引:1,他引:5
在分析大量现有研究的基础上,提出基于本体的信息检索系统的框架,从五个方面阐述了本体应用于信息检索领域所起的作用,并分析一个典型的基于本体的信息检索系统———Textpresso。 相似文献
12.
13.
通过基于隐含语义的数据库检索实例,运用隐含语义检索思想和工作步骤将文档的词汇信息表示成具有潜在语义的组合,通过语义分析对得到的同义词和多义词进行检索,提高了信息检索的查准率和查全率,从而解决了关键词简单匹配方法中因词汇的语义不同带来的问题。 相似文献
14.
基金项目评审管理中智能交互式文档检索 总被引:4,自引:0,他引:4
讨论了非结构化文档信息的检索模型,分析了传统交互式信息检索方法,提出了面向基金项目文档查询的智能交互式信息检索过程和处理流程。基于用户评价项目文档的反馈信息,采用ID3算法、CLCC算法和SVM分类函数分别学习用户查询的潜在意图和目标,并应用所学习的规则知识或分类函数支持项目文档查询。以某基金评审管理中项目文档的查询为例进行了实验计算与分析。 相似文献
15.
基于科技文献检索的信息发现与信息检索,探讨VIP、CNKI、万方数据知识服务平台系统功能在课题检索中的应用。在信息发现方面,综合运用各数据库系统功能寻找检索概念的同义词、课题相关的分类号和所属学科类别、抽象检索概念的相关词、课题相关的研究机构和研究者。在信息检索方面,根据各系统的功能特点不同,制定相应的课题检索策略——主题 相似文献
16.
本文针对关键词检索无法反映出文章的语义信息及无法满足用户的个性化检索的问题,结合本体和智能Agent技术。提出了一种基于本体的信息检索智能Agent模型,研究并分析了在这种模型框架下检索信息的流程。 相似文献
17.
一种基于主题和分众分类的信息检索优化方法 总被引:1,自引:0,他引:1
本文针对目前搜索引擎存在的检索结果缺乏组织导致检准率不高的问题,提出一种基于主题和分众分类的信息检索优化方法.首先对用户检索主题进行获取和表达,然后以社会标签为聚类项,采用向量空间模型实现基于分众分类的文档主题聚类,并将检索结果按相似度和标签"受欢迎度"复合排序,达到提高检索准确率和优化检索的效果. 相似文献
18.
基于文本的本体学习方法研究 总被引:3,自引:1,他引:3
本文介绍了当前基于文本的本体学习主要方法,在种子概念的基础上,设计了一种基于文本的本体学习方法,同时分析了术语获取、概念分类、关系获取等基于文本的本体学习关键技术。实验表明,借助种子概念能够从纯文本中抽取概念,对概念进行分类,为本体开发提供基础。 相似文献
19.
20.
基于文本聚类与LDA相融合的微博主题检索模型研究 总被引:1,自引:0,他引:1
伴随着微博的日趋流行,对微博信息的检索逐渐成为人们获取第一消息的手段.其中文本聚类和主题发现是信息检索领域的有效方法,采用适当的方法是影响微博短文本信息检索质量的关键因素.文章针对文本聚类和LDA主题模型的互补特征,综合考虑了微博特殊文体和短文本聚类效率问题,提出了基于频繁词集的文本聚类和基于类簇的LDA主题挖掘相融合的微博检索方法,给出了针对微博文体的一种新的主题检索模型.实验表明,该方法不仅能有效地划分微博文本,并且能清晰地挖掘类簇中潜在主题. 相似文献