首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 203 毫秒
1.
[目的/意义]基于内容的过滤推荐中,针对向量空间模型表示文本时容易造成维度灾难的问题,提出利用余弦值r与匹配度值Sim相结合的方法对原有模型进行改进。[方法/过程]由文献资源和用户兴趣分别筛选出权重较大特征词的词向量,进而由公式计算余弦值r,结合对应的特征词权重进一步计算出匹配度值Sim,将其作为向目标用户推荐文献的依据,并利用河北工业大学图书馆的相关数据对改进模型、向量空间模型及LDA主题模型进行实验,最后利用查准率、召回率、F1值及运行时间等评价指标对3种模型的实验结果进行分析。[结果/结论]实验结果表明所提出的改进模型相比较于实验中的向量空间模型与LDA主题模型具有更高的应用价值与运行效率。  相似文献   

2.
基于文本的信息过滤模型   总被引:1,自引:0,他引:1  
信息过滤技术用于帮助用户在动态信息流中过滤出用户感兴趣的信息。通过对信息过滤概念的阐述,抽象出这类系统的一般模型。介绍了布尔模型、向量空间模型、潜在语义索引模型和神经网络模型等四种信息过滤模型,并就其特点进行了分析。  相似文献   

3.
VSM中词权重的信息熵算法   总被引:3,自引:1,他引:2  
刁倩  王永成  张惠惠  何骥 《情报学报》2000,19(4):354-358
本文提出一种基于Shannon信息熵的向量空间模型(VSM)中的词权重算法。同时结合词与文献的相关权重的经典计算方法IDF(InverseDocumentFrequency),进一步总结了向量空间模型(VSM)中两种词权重计算的具体公式。  相似文献   

4.
网络化制造环境下的信息服务平台研究   总被引:1,自引:0,他引:1  
从用户的个性化需求和信息服务的及时有效性出发,对信息服务平台进行研究,提出一种基于向量空间模型的支持用户定制的信息服务平台的构建方案。介绍平台的框架结构,对其关键技术进行研究,提出一种向量空间模型特征词权重的改进算法,然后阐述平台的功能模型和各模块的设计与开发。  相似文献   

5.
经典向量空间模型中关键词相互独立的基本假设,造成了检索性能的限制.针对这一问题,本文介绍并分析了国内外学者对经典向量空间模型提出的改进研究.针对其研究的不足,通过分析经典向量空间模型的特点,构建领域本体以建立向量空间模型中关键词之间的语义联系,通过计算关键词之间的语义相似度,提出语义增量的概念,对关键词之间的语义联系进行量化分析.结合语义增量,对TF-IDF算法进行了改进,提出了STF-IDF算法,据此建立了语义向量空间模型,以期待提高经典向量空间模型在语义检索方面的性能.最后用实例验证了该模型在查全率和查准率方面均要优于原模型.  相似文献   

6.
文章在分析信息过滤系统及用户模型相关问题的基础上,探讨了基于向量空间模型的信息过滤系统用户建模方法,提出了以系统与用户之间不断交互所形成的一系列用户阶段模型为基础,构建具有相对长期意义用户兴趣模型的方法,并采用实例阐述了所提出的建模方法,说明该法能够在一定程度上准确反映用户兴趣,提高过滤效率。  相似文献   

7.
搜索引擎的信息过滤技术   总被引:16,自引:0,他引:16  
随着网络信息数量的迅猛增长,“信息过载”、“信息超载”现象引起了人们的重视。信息过滤技术就是为了克服上述现象, 减少用户在获得信息过程中的负担, 向用户提供数量适宜、质量优良的信息。本文在略述了信息过滤技术的产生背景后, 介绍了两种比较常用的信息过滤模型——布尔逻辑模型和向量空间模型。SIFT 是一个著名的信息服务系统, 它的核心就是信息过滤技术。因此, 文章还详细地介绍了SIFT 的工作原理和其中所使用到的信息过滤技术, 并且对S IFT 的性能、特点进行了分析, 指出了它的一些不足。  相似文献   

8.
通过对国内10所高校图书馆的20位资深外文图书采访专家进行问卷调查,得到外文学术图书质量评价的5个重要指标及其权重系数值。通过评价指标向量和指标权重向量建立外文学术图书质量评价体系模型,并选择“数学”学科作为研究对象,以GBIP书目数据和ISI Web of Science中学术论文数据作为样本数据源,对模型进行实证研究。  相似文献   

9.
[目的/意义]针对基于内容的个性化推荐策略,提出资源特征选择与权值计算优化策略,从而改善个性化推荐的效果。[方法/过程]构建基于用户决策机理的个性化推荐模型,模型以用户决策机理为背景知识进行资源特征的选择、用户兴趣模型的构建与语义表示、用户决策函数构建。为验证模型效果,以4 748位用户的观影数据为例进行实验,实验以向量空间模型为参照模型,P@N为评价指标。[结果/结论]实验结果显示,在N取值为5、10、20、50、100、200的情况下,基于用户决策机理的个性化推荐模型效果都显著优于向量空间模型,从而验证模型的有效性。  相似文献   

10.
一个基于反馈的信息过滤系统的设计与实现   总被引:7,自引:0,他引:7  
随着互联网上信息的迅速增长 ,信息过滤技术得到越来越广泛的应用。本文论述了一个基于反馈的内容信息过滤系统的设计和实现。它采用向量空间模型 ,使用类重心分类算法来形成用户兴趣文件 ,采用余弦算法比较待过滤文档和用户兴趣文件的相似度 ,并使用Rocchio反馈模型来重建用户兴趣文件。实验表明 ,本文提出的策略和方法是切实可行的  相似文献   

11.
通过介绍公众通信平台的基本概念,分析公众通信平台的信息服务功能,从电话通信服务、移动通信服务、多媒体通信服务三个方面探讨如何利用公众通信平台应用于图书馆的信息服务模式。参考文献11。  相似文献   

12.
本文从理论上探讨了向量空间模型及其改进模型在专题文献过滤中的相关算法。概念扩充模型解决了词的同义现象,提高了召回率;潜在语义分析模型通过统计方法,提取并量化这些潜在的语义结构,进而消除同义词、多义词的影响,提高文本表示的准确性,从而使专题研究中文献过滤的召回率和准确率都有显著提高。  相似文献   

13.
基于向量空间模型的主动推送系统设计与优化   总被引:3,自引:0,他引:3  
主动信息服务是信息检索的发展方向之一,传统向量空间模型用于设计主动推送系统具有一定的优点,但仍不能克服检索结果不相关的问题。本文提出了一系列优化措施,设计了一个基于向量空间模型的主动推送系统原型,更好的满足网上信息检索效率的提高。  相似文献   

14.
When speaking of information retrieval, we often mean text retrieval. But there exist many other forms of information retrieval applications. A typical example is collaborative filtering that suggests interesting items to a user by taking into account other users’ preferences or tastes. Due to the uniqueness of the problem, it has been modeled and studied differently in the past, mainly drawing from the preference prediction and machine learning view point. A few attempts have yet been made to bring back collaborative filtering to information (text) retrieval modeling and subsequently new interesting collaborative filtering techniques have been thus derived. In this paper, we show that from the algorithmic view point, there is an even closer relationship between collaborative filtering and text retrieval. Specifically, major collaborative filtering algorithms, such as the memory-based, essentially calculate the dot product between the user vector (as the query vector in text retrieval) and the item rating vector (as the document vector in text retrieval). Thus, if we properly structure user preference data and employ the target user’s ratings as query input, major text retrieval algorithms and systems can be directly used without any modification. In this regard, we propose a unified formulation under a common notational framework for memory-based collaborative filtering, and a technique to use any text retrieval weighting function with collaborative filtering preference data. Besides confirming the rationale of the framework, our preliminary experimental results have also demonstrated the effectiveness of the approach in using text retrieval models and systems to perform item ranking tasks in collaborative filtering.  相似文献   

15.
[目的/意义]微博已成为大众情感表达的重要平台,微博的情感分析在舆情分析、用户体验、商机挖掘等方面有着重要的作用。[方法/过程]提出的情感倾向分类算法WE_SDAE使用单词嵌入的方式将微博表示成一个低维稠密向量,然后通过添加正则项和加噪处理的方式将基本的自动编码器算法优化成深层噪音自动编码器,并在顶层添加分类器,实现情感倾向分类。考虑到微博用词灵活,还从单字和词语两个粒度训练模型。[结果/结论]实验结果表明,基于单字粒度的模型表现优于基于词语粒度的模型。此外,对比实验显示WE_SDAE算法优于传统的SVM、Naive-Bayes、XgBoost等相关算法;单词嵌入的方式优于传统的向量空间模型表示方法,能在微博情感分析中取得较好的效果。  相似文献   

16.
本文以知识拓扑结构为研究对象,针对其在应用中的局限性及运行效率等问题,提出一种基于向量空间的知识拓扑结构模型.该模型将组织中独立初创性知识和派生知识的全体构成一个n维向量空间,并与其伴随向量空间中的向径相对应.从初创性知识到派生知识的过程就转化为n维向量空间内对应向径间的线性组合,对知识的正逆向搜索、知识动态变化等操作通过相应向径间的内积运算来实现.该模型能够清晰地体现知识间的内在联系,在搜索性能等方面得到了相应的改善.  相似文献   

17.
黄赟茹 《情报工程》2016,2(3):043-052
随着大数据时代的到来,数据挖掘分析已经渐渐应用到了各行各业。大数据分析能够获得隐藏在庞大数据中的关系,趋势信息等等。通过数据挖掘的方式对互联网信息进行深层次解读将会得到更重要的信息而为之后的工作服务。目前教育者们已经重视到数据分析在教育中的应用,尤其在教学平台中如何设计数据分析功能已经是当今教学平台发展的一个重要环节。本文通过对Sakai和Canvas两个世界知名的学习管理系统的数据统计分析功能的比较分析,从平台数据分类方式,展示方式,数据内容,以及特点四个方面的研究,期望能使网络教育者对于平台数据统计分析功能的开发有所启示,促进学习分析在学习平台的应用,为学习平台实现自适应教学做铺垫。  相似文献   

18.
将用户人格融入到信息推荐服务的过滤过程中,构建基于用户人格特征的信息过滤模型。运用凯尔西人格理论、概率论、人格分布理论以及统计推理,完成模型中的分段、学习、分类和过滤4个环节。根据用户模型或用户提供的关键词、人格特征为用户过滤或推荐信息单元,旨在更好地为用户提供个性化的信息服务。  相似文献   

19.
由信息过滤引发的基于知识的过滤机制构想   总被引:4,自引:0,他引:4  
宋媛媛  孙坦 《图书情报工作》2005,49(3):39-41,86
在分析信息过滤理论背景的基础上,指出目前信息过滤系统存在的主要瓶颈问题是:相关度过滤算法过于依赖文本统计分析方法;信息质量过滤算法严重缺乏;如何创建精确的用户模板以表达用户的信息需求。在此基础上,探讨借助信息过滤技术建立基于知识的过滤机制的必要性与前景,同时提出建立基于知识的过滤机制的关键技术与模式的设想。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号