首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 15 毫秒
1.
基于Web挖掘技术的用户兴趣本体学习研究   总被引:2,自引:1,他引:1  
目前针对基于关键词的用户模型不能从语义上表达用户需求真正内涵,基于领域本体的用户模型多数忽略研究概念间非分类关系和语义应用环境较分散等缺陷。本文提出一种循环式的基于Web挖掘技术的用户兴趣本体学习模型,即综合应用统计分析、关联规则和聚类分析等技术进行电子商务领域用户兴趣概念及概念间分类与非分类关系学习,面对用户兴趣的迅速变化,还提出一种传递激活方法来实时更新本体或重新进行本体学习,以不断提高该本体的质量。经验证,基于该本体的用户模型在文本过滤等应用中能较上述两种用户模型满足用户个性化服务需求。  相似文献   

2.
交互式跨语言信息检索是信息检索的一个重要分支。在分析交互式跨语言信息检索过程、评价指标、用户行为进展等理论研究基础上,设计一个让用户参与跨语言信息检索全过程的用户检索实验。实验结果表明:用户检索词主要来自检索主题的标题;用户判断文档相关性的准确率较高;目标语言文档全文、译文摘要、译文全文都是用户认可的判断依据;翻译优化方法以及翻译优化与查询扩展的结合方法在用户交互环境下非常有效;用户对于反馈后的翻译仍然愿意做进一步选择;用户对于与跨语言信息检索系统进行交互是有需求并认可的。用户行为分析有助于指导交互式跨语言信息检索系统的设计与实践。  相似文献   

3.
基于Ontology的个性化检索   总被引:4,自引:0,他引:4  
目前检索工具的设计大都面向所有用户,而不考虑用户个人的特殊信息需求。本文提出一种基于Ontology的个性化检索方法,该方法自动学习用户查询的历史记录,构建用户兴趣模型,以此推导用户新提问的真正意图,满足用户特殊的信息需求。该方法适用于Internet特定领域或者特定用户群、企业网等智能信息检索。  相似文献   

4.
Searching online information resources using mobile devices is affected by small screens which can display only a fraction of ranked search results. In this paper we investigate whether the search effort can be reduced by means of a simple user feedback: for a screenful of search results the user is encouraged to indicate a single most relevant document. In our approach we exploit the fact that, for small display sizes and limited user actions, we can construct a user decision tree representing all possible outcomes of the user interaction with the system. Examining the trees we can compute an upper limit on relevance feedback performance. In this study we consider three standard feedback algorithms: Rocchio, Robertson/Sparck-Jones (RSJ) and a Bayesian algorithm. We evaluate them in conjunction with two strategies for presenting search results: a document ranking that attempts to maximize information gain from the user’s choices and the top-D ranked documents. Experimental results indicate that for RSJ feedback which involves an explicit feature selection policy, the greedy top-D display is more appropriate. For the other two algorithms, the exploratory display that maximizes information gain produces better results. We conducted a user study to compare the performance of the relevance feedback methods with real users and compare the results with the findings from the tree analysis. This comparison between the simulations and real user behaviour indicates that the Bayesian algorithm, coupled with the sampled display, is the most effective. Extended version of “Evaluating Relevance Feedback Algorithms for Searching on Small Displays, ” Vishwa Vinay, Ingemar J. Cox, Natasa Milic-Frayling, Ken Wood published in the proceedings of ECIR 2005, David E. Losada, Juan M. Fernández-Luna (Eds.), Springer 2005, ISBN 3-540-25295-9  相似文献   

5.
Social tagging systems have gained increasing popularity as a method of annotating and categorizing a wide range of different web resources. Web search that utilizes social tagging data suffers from an extreme example of the vocabulary mismatch problem encountered in traditional information retrieval (IR). This is due to the personalized, unrestricted vocabulary that users choose to describe and tag each resource. Previous research has proposed the utilization of query expansion to deal with search in this rather complicated space. However, non-personalized approaches based on relevance feedback and personalized approaches based on co-occurrence statistics only showed limited improvements. This paper proposes a novel query expansion framework based on individual user profiles mined from the annotations and resources the user has marked. The underlying theory is to regularize the smoothness of word associations over a connected graph using a regularizer function on terms extracted from top-ranked documents. The intuition behind the model is the prior assumption of term consistency: the most appropriate expansion terms for a query are likely to be associated with, and influenced by terms extracted from the documents ranked highly for the initial query. The framework also simultaneously incorporates annotations and web documents through a Tag-Topic model in a latent graph. The experimental results suggest that the proposed personalized query expansion method can produce better results than both the classical non-personalized search approach and other personalized query expansion methods. Hence, the proposed approach significantly benefits personalized web search by leveraging users’ social media data.  相似文献   

6.
As the volume and variety of information sources continues to grow, there is increasing difficulty with respect to obtaining information that accurately matches user information needs. A number of factors affect information retrieval effectiveness (the accuracy of matching user information needs against the retrieved information). First, users often do not present search queries in the form that optimally represents their information need. Second, the measure of a document’s relevance is often highly subjective between different users. Third, information sources might contain heterogeneous documents, in multiple formats and the representation of documents is not unified. This paper discusses an approach for improvement of information retrieval effectiveness from document databases. It is proposed that retrieval effectiveness can be improved by applying computational intelligence techniques for modelling information needs, through interactive reinforcement learning. The method combines qualitative (subjective) user relevance feedback with quantitative (algorithmic) measures of the relevance of retrieved documents. An information retrieval is developed whose retrieval effectiveness is evaluated using traditional precision and recall.  相似文献   

7.
CALIS三期e得门户为高校图书馆进行文献传递与用户文献获取提供了一条便捷途径。基于CALIS三期e得门户构建区域文献传递“共享域”,在整合区域高校图书馆文献传递系统的基础上,来实现用户对文献的便捷获取。作为一个应用范例,通过对文献传递服务的几种模式进行分析,指出在e得门户上对区域各高校馆的文献传递系统进行无缝集成是可行的。最后,对区域文献传递共享域建构所面临的主要问题进行分析并提出相应的解决措施。  相似文献   

8.
信息检索扩展技术研究   总被引:1,自引:0,他引:1  
本文针对信息检索在查询扩展方面的不足,提出了一种结合本体理论和用户相关反馈技术的查询扩展方法。以FirteX作为检索平台, 选取WordNet作为本体扩展资源来验证本文所提出的查询扩展算法,实现结果表明该方法比基于余弦相似性的查询扩展方法在平均查全率、平均查准率方面有更大的优点。  相似文献   

9.
基于领域本体的数字图书馆动态用户兴趣模型的构建   总被引:1,自引:0,他引:1  
通过学习其他类型领域本体构建经验与教训,提出数字图书馆个性化用户兴趣领域本体的动态模型构建方案。通过分析用户的浏览方式和内容,实时获取用户兴趣信息,将用户兴趣信息与领域本体库进行反复匹配,不断修正,通过抽象总结得到用户的动态兴趣模型。  相似文献   

10.
面向语义Web的智能数字图书馆的实现很大程度上依赖于本体的建立,本体与数字图书馆中的数字资源采集、数字馆藏和用户访问网关都密切相关。在本体构建方面,目前存在的绝大多数本体都是手工生成的,该方法效率低、出错率高,更难以维护和更新。这对语义级数字图书馆的实现造成了巨大的障碍。为此提出了一种面向数字图书馆的本体学习方法GOLF,通过对各专业领域中大量的Web文档集和语料库进行挖掘来实现本体学习,并分别讨论了本体学习中本体概念的抽取、概念之间语义关系的抽取和分类体系的自动构建等关键技术。  相似文献   

11.
移动图书馆WAP和APP用户检索行为比较分析   总被引:1,自引:0,他引:1  
[目的/意义] 对比用户在使用WAP和APP这两种方式访问移动图书馆时的检索行为,为移动图书馆的服务创新提供参考。[方法/过程] 通过对某高校图书馆OPAC系统移动端日志数据进行统计分析,从搜索会话、查询式、高频关键词以及检索方式等方面展开研究。[结果/结论] 发现用户更多地是使用WAP访问移动图书馆,相比之下,在使用APP访问移动图书馆时,用户更倾向于在短时间内进行较少的查询来结束搜索会话;使用这两种方式查询的高频关键词所属领域有很大的相似性,中文检索多集中在数学、管理学、经济学、社会学等领域;简单检索是用户访问移动图书馆时使用的主要检索方式,通过WAP访问的用户选择其他检索方式的比率要大于通过APP访问的用户。  相似文献   

12.
基于学术文献构建领域本体对促进领域学科发展具有重要的意义。本文提出了一种以中文学术文献为数据源,半自动化抽取领域本体层次关系的框架方法。首先,构建了一个通用的领域本体层次关系的细粒度研究框架。其次,设计了一种新的概念表示方法,融合了深度学习方法得到的概念语义特征和上下文的时间序列词频。进一步结合了AP聚类、Prim算法和Web搜索引擎的查询数据,提出了基于规则推理的本体概念层次关系抽取算法(RROCHE),实现了半自动化概念层次关系抽取。最后,基于中文分词领域的中文学术文献数据,通过数值实验方法讨论了方法的可行性和有效性。本文提出的框架方法也非常容易推广并应用到各领域本体层次关系任务中。  相似文献   

13.
论文针对高校图书馆强大服务体系形成的知识流,所记录的海量图书馆用户知识,以及“有关用户的知识”“来自于用户的知识”“用户需要的知识”知识的类型,探讨建立高校图书馆集成用户知识管理框架,帮助高校图书馆将用户知识类型纳入到系统内扩展其功能,使图书馆知识工作者能基于本体用户知识管理系统发展新知识服务。  相似文献   

14.
检索词自动扩展词库构建方法的基本思路是:根据语料是否规范化处理进行词库分类建设,优化了系统的检索性能;结合学科类别,对词库语料进行领域划分,引导科技人员对技术领域的准确把握;建设以本体库为基础,将与规范词具有关联性、相似性的语料通过关系表与关联库关联,把科技文献中的关键词组成一个有序的关系网,解决了传统检索系统中检索词无关联的不足;通过对检索词出现频率进行统计分析,进而更新词库,保证本体库、关联库语料的时效性,突破了人工对词库更新管理的受限性。  相似文献   

15.
.NET环境下跨库检索系统的设计与检索代理的实现   总被引:3,自引:0,他引:3  
讨论了跨库检索的产生原因和实现方式,并借鉴元搜索引擎原理,设计了一个跨库检索系统模型,并就其检索代理模块在.NET环境下的实现进行了详细阐述  相似文献   

16.
面向跨领域海量信息资源的元搜索引擎研究   总被引:1,自引:0,他引:1  
跨领域海量信息资源搜索是从事交叉学科和跨学科研究的重要前提.元搜索引擎不仅可以避免独立搜索引擎覆盖面较低的局限性,而且还可以充分发挥不同独立搜索引擎之间的互补性.基于元搜索引擎的跨领域海量信息资源搜索需要解决四个关键问题,即协助用户准确表达搜索意图、消除检索词的"一词多义"和"多词一义"现象、设计自动调整检索范围的机制以及发挥用户价值.面向跨领域海量信息资源的元搜索引擎采用多领域本体、语义web和web2.O技术,较好地解决了元搜索引擎的上述四个关键问题.相对于传统元搜索引擎,面向跨领域海量信息资源的元搜索引擎在基本思路、框架设计、流程设计、关键技术四个方面发生了重要变化.  相似文献   

17.
针对当前OPAC网站缺少搜索引擎与用户体验优化而造成用户流失的现状,对OPAC优化的背景、现状与需求、搜索引擎与用户体验优化概况、用户体验与访问质量及优化策略进行研究.通过采用简短域名、提高系统访问速度、设计简洁大方的页面布局、编写简单明了的网页源代码、使用规范的Html标签、放置科学合理的关键词、设置尽量短的内部链接及提升用户体验等优化策略,并对OPAC与搜索引擎、活跃用户与流失用户、优化的影响与评价等关系进行详细分析,呼吁重视OPAC的搜索引擎与用户体验优化工作,以增加活跃用户,实现OPAC的核心价值.图3.表2.参考文献16.  相似文献   

18.
Blog feed search aims to identify a blog feed of recurring interest to users on a given topic. A blog feed, the retrieval unit for blog feed search, comprises blog posts of diverse topics. This topical diversity of blog feeds often causes performance deterioration of blog feed search. To alleviate the problem, this paper proposes several approaches based on passage retrieval, widely regarded as effective to handle topical diversity at document level in ad-hoc retrieval. We define the global and local evidence for blog feed search, which correspond to the document-level and passage-level evidence for passage retrieval, respectively, and investigate their influence on blog feed search, in terms of both initial retrieval and pseudo-relevance feedback. For initial retrieval, we propose a retrieval framework to integrate global evidence with local evidence. For pseudo-relevance feedback, we gather feedback information from the local evidence of the top K ranked blog feeds to capture diverse and accurate information related to a given topic. Experimental results show that our approaches using local evidence consistently and significantly outperform traditional ones.  相似文献   

19.
基于领域本体的文献模糊相似度算法研究   总被引:1,自引:0,他引:1  
利用分类主题一体化的主题词表构建领域本体,并通过概念间的关系定义及语义相似度公式,引入调整因子,确定概念相似度算法,再通过余弦系数法进一步得到文献间的相似度。对于本算法的结果,与领域专家预测的相似度进行比较,结果证实该算法有效。  相似文献   

20.
区分文档过滤、信息过滤和文本过滤并介绍文档过滤技术的研究现状;提出基于Ontology的文档过滤的设想,认为其优势在于灵活、共享性好、有利于进行个性化服务等;讨论基于Ontology的文档过滤的实施过程,包括构建准备、本体构建、本体调用,重点阐述公共本体、用户本体和文档本体的构建方法以及实施过程中涉及的技术体系;最后指出今后的努力方向。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号