首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 343 毫秒
1.
文章通过对个性化推荐和数据建模理论研究,分析了普通的Web日志格式采集到的数据无法满足个性化用户分析、预测和推荐精度需要的局限性。提出定制Web日志数据建模的过程及方法,建立了定制Web日志模型原型。通过应用数据挖掘技术的关联分析、分类和聚类实验,实验结果表明,通过定制Web日志的方式采集的数据质量能够很好地满足发现关联规则、内容分类和用户聚类的需求,从而提高个性化推荐的精度。同时,定制的Web日志数据还具有简化数据预处理、多用途的优点。  相似文献   

2.
采用数据挖掘技术中的关联分析和聚类方法,重点研究Web日志兴趣发现的理论和方法,指出普通日志记录方法的局限性,提出过滤用户偏好的定制Web日志方法,实验结果验证通过该方法采集的数据,可以发现隐藏在日志数据中的关联规则,同时找到相似用户的兴趣和偏好,并且能够提高过滤用户兴趣偏好的精度。  相似文献   

3.
搜索引擎用户日志分析对信息检索学术研究和搜索引擎优化都有重要意义,文章对约20G的新浪爱问搜索引擎(http://iask.com/)日志进行了系统的分析.发现了很多中文搜索的特点,并针对这些现象提出了一些问题.这些内容对于掌握用户搜索行为,完善搜索引擎系统和中文信息检索研究都具有重要的意义.该文为2008年第七期本期话题<用户查询的理解>的文章之一.  相似文献   

4.
电子资源日志统计系统分析与设计   总被引:2,自引:0,他引:2  
电子资源日志统计能够提供电子资源评价体系中数据库利用与效用方面的量化指标。设计一种电子资源日志统计系统ERLS,解决其中日志预处理、电子资源统计指标与统计方法、用户定制的动态报表生成等关键技术,并设计开发了原型系统。  相似文献   

5.
数字图书馆个性化信息检索模型研究*   总被引:3,自引:0,他引:3  
结合向量空间技术、Agent技术、Web日志挖掘等技术提出了一个基于概念的数字图书馆个性化信息检索模型。该模型根据用户主动提供的初始信息建立基于概念的用户兴趣模型,利用用户对文档的主动评价和用户的访问行为更新用户兴趣模型,并将用户兴趣模型用于检索结果的相关度排序和最新信息的推荐以及合作推荐。最后给出系统的实现方法。  相似文献   

6.
杨秀丹  李皓 《图书情报工作》2012,(19):95-100,127
对物理信息检索系统进行用户情境的实地研究,结合情报学认知观理论,分析信息检索系统中的认知要素。在此基础上,设计认知信息检索系统模型——主要在信息标引和信息检索与匹配阶段加入认知要素,最后介绍认知信息检索系统模型的构建过程和模型组成。  相似文献   

7.
基于因特网的个性化信息服务研究   总被引:54,自引:0,他引:54       下载免费PDF全文
个性化信息服务 ,是针对不同用户采用不同服务策略和方式提供不同信息内容的服务。它具有以用户为中心、对用户需求进行挖掘、灵活多样和主动将信息推送给用户的特点。其类型有 :个性化内容定制服务 ;个性化信息检索定制服务 ;个性化界面定制服务。用户个性化需求可通过用户访问记录挖掘、Bookmark和Agent获取。个性化信息服务模型 ,可采用信息A gent自主学习法、信息过滤法、基于多Multi AgentSystem的合作法等方法构建。参考文献 14。  相似文献   

8.
讨论网络信息检索过程中发生的用户交互意图和信息检索策略的变更及相关概念,指出信息发现在网络信息检索中的特殊作用,揭示网络信息检索的本质,并对弥补目前网络信息检索系统的不足、建立适应性系统提出建议。  相似文献   

9.
基于Web挖掘技术的信息检索系统设计与实现   总被引:2,自引:0,他引:2  
王艳  张帆 《情报学报》2007,26(3):339-343
本文详细介绍一个基于Web文本挖掘技术的信息检索系统的设计与实现。基于Web文本挖掘技术的信息检索技术融合了文本挖掘的思想,它将单一的资源发现或者单一的信息提取的传统的信息检索方法结合起来,从而达到在WWW发现资源并将其中的信息提取出来进行处理的目的。  相似文献   

10.
图书馆个性化服务中的Web日志分析技术研究   总被引:1,自引:0,他引:1  
通过总结国内外日志分析研究,发现日志分析研究主要集中在应用研究领域。在明确日志分析基本概念、研究方法与工具、预处理技术、聚类与分析技术的基础之上,探讨图书馆个性化服务中日志分析的实现,并构建了图书馆日志分析系统模型。  相似文献   

11.
现有的CSSCI信息服务系统只能提供单一、线性的检索功能,检索效果不佳,主要原因在于后台数据组织的不合理。为此,提出使用基于本体的知识服务平台代替现有CSSCI检索服务系统的解决方案,提供知识层次的服务,以改善用户的检索环境。在提出基于本体信息检索系统一般模式的基础上,设计一个实用的基于CSSCI_Onto的知识服务平台KRSP_CSSCI_Onto,对该平台的基本功能和系统框架进行探讨,并据此开发一个试验性的知识检索系统,详细阐述本体在知识检索服务中的具体应用,包括用户检索式的语义扩展,查询结果的关联知识推荐,基于学术资源网络模型的知识导航以及基于规则库的知识关系检索等。  相似文献   

12.
为了满足检索用户对推荐服务日益迫切的需求,结合检索词推荐需求研究推荐理论。基于三种典型推荐方法:基于内容的过滤、基于规则的过滤和基于协作的过滤,提出一种检索词的混合推荐方法,并基于检索日志构建一种“脱机预处理和挖掘、联机推荐”的检索词推荐模型。最后,在NSTL嵌入式系统上进行实证研究。基于检索日志数据,以简单检索方式下的检索词推荐为突破口,设计一套原型系统,验证检索词的推荐效果并在原型系统上检验一种改进的BWP方法的效果。  相似文献   

13.
Significant progress has been made in information retrieval covering text semantic indexing and multilingual analysis. However, developments in Arabic information retrieval did not follow the extraordinary growth of Arabic usage in the Web during the ten last years. In the tasks relating to semantic analysis, it is preferable to directly deal with texts in their original language. Studies on topic models, which provide a good way to automatically deal with semantic embedded in texts, are not complete enough to assess the effectiveness of the approach on Arabic texts. This paper investigates several text stemming methods for Arabic topic modeling. A new lemma-based stemmer is described and applied to newspaper articles. The Latent Dirichlet Allocation model is used to extract latent topics from three Arabic real-world corpora. For supervised classification in the topics space, experiments show an improvement when comparing to classification in the full words space or with root-based stemming approach. In addition, topic modeling with lemma-based stemming allows us to discover interesting subjects in the press articles published during the 2007–2009 period.  相似文献   

14.
基于概率主题模型的文献知识挖掘   总被引:1,自引:0,他引:1  
对海量的科技文献资源进行知识挖掘能够发现大量有价值的、潜在的知识,有效地提高文献信息的可用性。作者前期研究验证了使用LDA主题模型进行文献知识挖掘的可行性。本文提出了一种新的概率主题模型:Topic-Author模型,该模型对文献的文本信息和作者信息进行联合建模,在分析文献主题同时,发现相关主题方向的研究者分布。基于Topic-Author模型,提出了多维度文献知识挖掘的方法,包括主题挖掘,专家发现,文献标注,重要文献挖掘,文献相似度分析,研究趋势分析和主题关系挖掘。基于教育技术学文献数据集,进行了实验研究。  相似文献   

15.
基于TAM及TTF模型构建一个学术信息搜索系统使用及绩效评价模型,并采用问卷调查和结构方程建模,以中国知网(CNKI)跨库检索系统、谷歌学术为研究对象进行实证研究,以探寻用户数字学术资源搜索行为及其对绩效的影响。研究发现,任务-技术适配与绩效期望之间存在显著的相关关系,使用与绩效之间没有显著的相关性。此外,任务-技术适配对用户感知易用性及感知有用性均存在着正向影响,而感知易用性及感知有用性直接影响着用户对于数字学术资源搜索系统的使用。  相似文献   

16.
2006-2007年国外对信息检索基础理论的研究主要集中于决策理论、隐含语义索引理论研究以及信息检索评价理论研究。关于信息检索基本原理的研究主要集中在信息检索中的分类、信息检索模型、信息检索类型和检索方式等方面。信息检索中的分类的研究重点包括有关分类器的研究;有关特征选择的研究;有关领域相关词的研究。信息检索类型的研究主要包括焦点检索、图像检索、视频检索、合作过滤、机器音译、无线网中网。检索方式的研究主要包括上下文检索、集成检索、问答系统检索以及用户查询处理等问题。  相似文献   

17.
声音与图象信息的存贮和检索研究   总被引:5,自引:0,他引:5  
本文首先分析了声音与图像信息的存贮处理, 接着分类阐述了声音、图像信息检索可以采用的方法和技术; 在此基础上, 对多媒体信息检索系统的数据模型进行了比较研究, 提出在目前技术条件下, 多媒体信息检索系统的设计可采用现有成熟的关系数据库系统作为基础, 并在关系模型里增加处理复杂对象与多媒体数据的能力, 以实现对声音、图像等多媒信息的存贮与检索。  相似文献   

18.
基于域加权词频法的XML文档级检索实现与评价   总被引:1,自引:0,他引:1  
利用BM25F模型,通过实验,在INEX 04数据集的基础上,实现了对多个域(元素)词频进行加权的XML文档级检索。XML文档结构的确蕴含了一定的语义信息。利用这些语义信息,可以提高检索性能。表2。图1。参考文献16。  相似文献   

19.
语言模型在信息检索中的应用   总被引:1,自引:0,他引:1  
基于语言模型的检索方法为信息检索领域开辟了一个很有前景同时也具有相当挑战性的方向。与传统检索模型相比,语言模型不仅具有良好的理论基础,而且非常灵活,经过简单的变换很容易推演出其他经典的检索模型。此外,大量的实验结果表明,该方法的检索效果优于其他检索模型,因而一经提出便受到了广大研究人员的青睐。然而当前语言模型方法的研究主要集中在单语检索任务中,很少有研究关注语言模型方法在跨语言检索中的应用,针对这个问题,本文在系统介绍基于语言模型检索方法的基础上,将语言模型方法扩展到跨语言检索任务中,介绍了两个跨语言检索模型:统计翻译模型和跨语言相关语言模型。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号