首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 734 毫秒
1.
[目的/意义]为提高知识付费平台用户感知服务质量,文章构建了融合用户画像与协同过滤的个性化推荐模型。[方法/过程]首先根据用户特性构建画像标签体系,利用TF-IDF、熵值法、k-means等方法确定用户特征标签;其次分别基于用户画像与改进后的协同过滤算法计算用户相似度,通过调和权重得到用户综合相似度;最后利用Top-N进行个性化推荐。[结果/讨论]通过知乎live付费用户信息进行验证,发现本文算法在推荐结果的准确率以及召回率上,相比其单一方法均有较大提升,且满意度高于知乎live平台。  相似文献   

2.
[目的/意义]针对在线旅游平台,提出一种挖掘游记主题标签,以代表性游记以及其中相关内容进行旅游信息推荐的新策略。[方法/过程]在利用文本挖掘技术,构建LDA主题模型,形成游记文本主题标签的基础上,通过游记代表度算法,筛选出针对相应标签的高描述度与高忠诚度游记进行旅游信息推荐,以客观表达文本聚类结果以及主题词之间的语义关系,并以蚂蜂窝旅游网中的"杭州游记"为例,加以验证。[结果/结论]结果表明,这种方式能挖掘出旅游者在历史旅游经历中真实的旅游热点及重点信息需求,针对高相似度游记的识别与聚类具有良好效果,对旅游信息细粒度推荐具有指导意义与实践意义。  相似文献   

3.
社会标签系统是Web2.0中提出的概念,旨在更好地表达用户的兴趣和意愿。而标签聚类是社会标签系统的个性化推荐中一个重要的研究课题。本文研究了如何基于标签聚类与用户模型来进行个性化推荐的方法。通过计算标签的相似度进行标签聚类,结合用户模型,根据标签聚类结果做出推荐。通过采用CiteULike公布的数据集进行实验证明,与未采用标签聚类的推荐方法相比,本方法不仅可提高推荐的命中率,优化目标资源的排名,而且能为用户发现更多新的感兴趣的资源。  相似文献   

4.
针对政府门户网站标签系统中存在的标签组织混乱、信息描述精确度不高等缺陷,本文提出了一种基于K-means的标签聚类算法。实现了对标签的重新组织,为用户提供了更加方便的检索机制。  相似文献   

5.
本研究针对电子商务网站用户对商品概念认知与网站实际分类目录不匹配,导致检索效率低下的问题,提出了基于用户标签的电子商务网站分类目录改善方案,即将用户标签进行多层聚类,将聚类结果以层级结构的形式展示,并实现标签聚类结果和网站分类目录的映射,从而提高电子商务网站的分类检索效率和分类导航性能。  相似文献   

6.
陈氢  冯进杰 《现代情报》2019,39(10):24-31
[目的/意义]社交媒体网站的飞速发展为我们贡献了海量数据,通过对这些数据的进一步挖掘,可以实现个性化服务推荐。[方法/过程]本文利用地理标签中的丰富的元数据信息,结合基于密度的DBSCAN聚类算法和TF-IDF的统计方法,来提取和识别当地的景点区域,然后结合季节来计算景点的热度,最后运用基于混合过滤的推荐算法,为游客实现个性化旅游服务推荐。[结果/结论]通过Flickr网站爬取到的Geo-tagged数据集验证了本文提出方法的有效性。  相似文献   

7.
个性化信息服务中用户偏好的动态挖掘   总被引:2,自引:0,他引:2  
基于个性化信息服务中用户偏好随时间变化的特性,采用聚类、关联规则等技术,对用户偏好进行动态挖掘.通过追踪用户需求序列,最终产生Top-N产品推荐,旨在提高推荐系统的推荐质量.然后选取协同过滤算法作对照,并采用MovieLens站点提供的测试数据集.通过对召回率和精度两项指标的分析,表明该动态挖掘算法具有较高的推荐准确度和全面性.  相似文献   

8.
[目的/意义]学术用户画像是对用户访问使用学术资源行为的较全面的刻画。本文尝试构建图书馆学术用户画像的信息行为标签和研究兴趣标签,来准确定位学术用户的信息需求,以便推荐合适的学术资源。[方法/过程]具体方法是全面获取用户的访问日志并进行清洗处理,然后构建从学术用户信息行为出发的用户画像标签体系,进一步研究构建了基于研究兴趣关联的信息资源推荐服务。[结果/结论]本研究有助于提高用户信息获取效率,提高图书馆学术资源推荐服务的质量,并为结合其它资源全面构建图书馆学术用户画像提供一定的借鉴。  相似文献   

9.
在线健康社区用户信息需求的层级多标签分类研究   总被引:1,自引:0,他引:1  
[目的/意义]用户健康信息需求研究能够发现用户潜在需求,解决用户健康信息盲区,帮助用户实现更好的自我健康管理。研究目标为挖掘识别用户信息需求主题,提取用户特征,促进完善网络社区交互性与多元性发展,为更好地改善健康信息服务提出建议与意见。[方法/过程]针对在线健康社区的母婴群体,提出在线健康社区用户信息需求层级多标签分类模型。通过扎根理论提出在线健康社区用户信息需求主题体系,利用ALBERT对母婴健康需求类数据进行预训练,使用双向GRU与注意力机制构建基础分类器,以此来构建层级多标签分类模型Multi-BiGRU-Attention,实现在线健康社区提问数据的层级多标签分类。[结果/结论]实验对比发现,随着层级的增加,研究提出的模型相比于单层的基础分类器BiGRU-Attention在micro-Precision, micro-Recall, micro-F1等各项指标上均有所提升,说明该模型的层级结构信息能够一定程度上改善模型效果;相比于层级多标签相关模型,在各项指标上均有所提升,说明该模型存在一定的适用性与扩展性。  相似文献   

10.
[目的/意义]引入时间衰减因子与聚类系数对共词网络链路预测局部相似性指标进行优化改进,以期进一步提升共词网络链路预测的精确度。[方法/过程]从3个角度来提升局部相似性指标预测精确度:一是引入时间衰减因子计算连边权重,对不同时间段的连边进行区别处理;二是结合聚类系数改进已有相关相似性指标,即利用节点邻域拓扑信息进一步区分不同节点对相似性的贡献;三是同时融合时间衰减因子和聚类系数进行指标优化改进。再以图书情报学领域为例构建共词网络,利用多种分类算法(如朴素贝叶斯、决策树、随机森林、SVM)预测和评估所改进指标的预测精确度。[结果/结论]引入时间衰减因子,指标WCN、WAA、WPA、WRA的预测精确度均得到了有效提升;结合聚类系数,指标CN、AA、RA、WCN、WPA、WRA和SA的预测精确度均得到了不同程度的提升;同时融合时间衰减因子和聚类系数,WCN、WAA、WRA的预测精确度得到了进一步的提升。由此可知,引入时间衰减因子或聚类系数均能在一定程度上提升共词网络链路预测相关指标的准确度。  相似文献   

11.
张彬  徐建民  吴树芳 《情报科学》2020,38(4):147-152
【目的/意义】通过对大数据环境下的多源用户兴趣特征有效融合,缓解个性化推荐中用户兴趣偏好数据的稀疏性和准确性问题。【方法/过程】考虑到多域的数据权威度、内容质量及体系结构的差异化较为明显,提出了基于多源用户标签的跨域兴趣融合模型,首先把多个域中的用户兴趣进行标签化处理,然后利用跨域用户识别和标签权重归一方法得到多个域的用户实体-标签矩阵,最后使用域权重影响系数对标签进行融合,构造具有复合权重的用户兴趣标签集。【结果/结论】使用5个来源数据域进行实验与分析,融合模型能够有效提高标签用户覆盖效果,在查全率不断提高的情况,融合域能够保持较高的标签用户查准率,有效提高用户兴趣特征的描绘效果。  相似文献   

12.
田大芳  魏瑞斌 《现代情报》2018,38(8):125-129
[目的/意义]通过共词分析和聚类分析研究国外2017年信息科学与图书馆学领域的研究热点。[方法/过程]首先从Web of Science收集数据;然后利用HistCite统计关键词频次,确定高频关键词;最后利用VOSviewer对原始数据进行处理,最终得到9个聚类。[结果/结论]研究发现,国外信息科学与图书馆学的研究主题可以归纳为以下9个方面:图书馆管理与服务、用户研究和信息素养;社交媒体、电子商务、电子政务、智慧城市、信息技术和信息安全;文献计量学、科学计量学和替代计量学;开放数据、数据分析、数据质量和数据挖掘等;开放存取、数字人文、数字图书馆和信息检索等;医疗健康信息学;知识管理与开放创新等;公共信息、信息分享、社交网络和政治交流;图书馆情报学教育。  相似文献   

13.
一种基于主题和分众分类的信息检索优化方法   总被引:1,自引:0,他引:1  
本文针对目前搜索引擎存在的检索结果缺乏组织导致检准率不高的问题,提出一种基于主题和分众分类的信息检索优化方法.首先对用户检索主题进行获取和表达,然后以社会标签为聚类项,采用向量空间模型实现基于分众分类的文档主题聚类,并将检索结果按相似度和标签"受欢迎度"复合排序,达到提高检索准确率和优化检索的效果.  相似文献   

14.
黄立赫  石映昕 《情报杂志》2022,41(2):146-154
[研究目的]从视频弹幕的视角出发,挖掘网络舆情事件的话题漂移规律,提升网络舆情事件的视频情感检索精度。[研究方法]通过对视频弹幕进行主题与情感分析,提升网络舆情事件在线监测精准度,并在此基础上提出并构建弹幕迁移指数,建立一种基于弹幕迁移指数的情感监测方法,该方法首先基于BTM主题模型抽取视频弹幕的话题信息,并基于情感词典与颜文字词典计算不同时间窗口下的话题情感类别与情感强度,建立面向视频弹幕的网络舆情事件监测模型,再从话题内容的变化与视频兴趣热度两个角度构建话题迁移指数,并利用话题的情感强度变化,构建情感迁移指数。最终,基于话题迁移指数与情感迁移指数,得到加权后的弹幕迁移指数,实现网络舆情事件的在线监测。[研究结论]通过视频弹幕社区的真实数据,从逻辑层面验证了本模型的合理性,结果表明该方法能够较为准确地识别网络舆情事件迁移的关键时间窗口,为实现视频分享平台的情感可视化提供了切实可行的理论探索。  相似文献   

15.
16.
[目的/意义] 随着"互联网+"在医疗服务行业的应用与发展,积累了大量的医疗评价信息,利用情感分析技术可以对其进行有效地挖掘和利用,从而为医疗管理提供决策参考。[方法/过程] 基于框架语义理论建立医疗情感语义分类词典;采用词典和规则相结合的方法进行在线医疗评论的情感语义分析,标注情感类别、情感主题、极性和强度等信息。[结果/结论] 通过在线医疗评论数据测试,验证了研究方法的有效性和科学性,是情感分析向医疗健康领域纵深发展的一次有益探索。  相似文献   

17.
[目的/意义] 探索一种融入数据驱动思维的人文社科专题数据库建设主题选择方法,为相关主体在建库主题的遴选、比较和确定等工作提供决策参考。[方法/过程] 从政策、用户两个维度出发,提出基于政策文本与检索数据的人文社科专题数据库主题筛选框架。以Fulink平台为例,基于政策文本LDA主题分类建模和检索数据的词频统计归类,确定专题数据库建设备选主题,最后通过比对筛选将主题进行分类。[结果/结论] 本文构建的主题选择框架,能够有效提升相关主题选择工作的全面性、准确性、科学性,为人文社科专题数据库建设的项目规划等提供了良好的思路。  相似文献   

18.
分析了基于社会化标签的个性化知识推荐研究的现状与不足,结合组合推荐中的变换策略和混合策略,建立了社会化标签系统中基于组合策略的个性化知识推荐系统架构,探讨了组合推荐所涉及的社会化标签—评价矩阵、社会化标签网络、知识互动型社会网络的相关问题。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号