共查询到20条相似文献,搜索用时 31 毫秒
1.
2.
【目的/意义】针对图书馆用户群体聚类分群不稳定且错误率较高的问题,提出基于马尔可夫模型的图书馆
用户聚类分群方法,提升图书馆用户聚类分群精准度。【方法/过程】采用一阶马尔可夫混合模型构建用户动作序列
模型,通过模型产生用户行为聚类,体现用户动作的动态性,采用自适应自然梯度算法,依据用户行为分离状态自
适应调整自身步长,优化模型参数学习中模型自动选择问题,实现最佳图书馆用户聚类分群。【结果/结论】通过实
验结果能够证明,实际聚类数量小于L值时,提出方法能够实现参数学习过程中模型的自动选择。提出方法的分群
数量最多,能够划分出最大的取值区间,聚类错误率最低为0.22%,聚类性能比较稳定,分群结果更加精准,达到了
设计的预期。【创新/局限】采用一阶马尔可夫混合模型实现了图书馆用户聚类分群。后续将进一步研究可考虑用
户序列间关联的高阶马尔可夫分量模型,以提高分群算法的准确性和稳定性。 相似文献
3.
4.
【目的/意义】网络社会充斥大量负面网络舆情,负面网络舆情风险分级和研判对提高网络治理能力和网络
社会治理成效意义重大。【方法/过程】构建负面网络舆情风险指标体系,并采用熵权法计算风险指标权重;基于加
权GRA模型计算灰色加权信息关联度,在此基础上,运用k-means聚类算法构建负面网络舆情风险分级方案,据此
对负面网络舆情进行风险预测。【结果/结论】实证分析结果表明,所建负面网络舆情风险分级模型客观性强、可靠
度高,可为负面网络舆情风险精准响应提供有效决策依据。【创新/局限】以信息关联为视角,为负面网络舆情风险
分级与预测提供了新的研究框架,但典型案例数据库有待继续完善。 相似文献
5.
【目的/意义】数字期刊阅读在移动网络的推动下已成为互联网使用群体必不可少的活动,分析数字期刊 服务中的用户行为能够掌握用户阅读倾向,提高推送精确度。从用户行为感知的角度出发根据用户信息分析用户 行为轨迹,搭建推送模型,结合推荐算法和用户行为预测模型,实现数字期刊的用户个性化推荐。【方法/过程】本文 使用聚类算法和加权二部图算法计算用户相似度、寻找用户邻居簇,进而预测用户对数字期刊的评分,基于加权 Markov模型预测用户模型,生成数字期刊推送结果。【结果/结论】利用用户行为感知技术对数字期刊服务推送提 出了基本的研究理论框架,依照推荐算法设计对不同用户进行个性化推荐,增强用户信赖感,提高用户对数字期刊 阅读的满意度。 相似文献
6.
【目的/意义】网络用户在线评论是用户对某产品或服务机构体验感知的反馈,对网络用户在线评论的文
本挖掘是情报分析的重要内容。【方法/过程】为了更有效从海量网络用户在线评论文本中挖掘用户感兴趣的信息,
本研究爬取TripAdvisor网站四大城市的酒店用户在线评论,基于主题图谱理论和文本聚类算法构建网络用户在线
评论的聚类模型,通过图谱可视化揭示不同地区酒店用户观点差异,并分析不同图谱的社会网络特征。【结果/结
论】研究发现酒店用户最关注的是服务,其次是酒店的环境和位置。本研究能够快速挖掘酒店用户关注内容,对帮
助酒店管理者了解用户住宿需求并以此提高用户满意度具有重要价值。【创新/局限】本文结合主题图谱和文本挖
掘技术构建酒店用户在线评论主题图谱,在大数据文本主题聚类上显示出优越性。但本文仅分析TripAdvisor网站
四个城市中部分酒店的用户在线评论,数据面覆盖不够广泛。 相似文献
7.
8.
【目的/意义】构建基于用户动态画像的学术新媒体信息精准推荐模型是满足学术新媒体用户对学术信息
资源精准化、个性化与专业化的要求,同时也是提高学术信息流转效率以及价值增值的有效途径。【方法/过程】在
探究学术新媒体信息流转模型的基础上,进一步分析学术新媒体用户需求与分层画像,重构学术新媒体用户画像
步骤,构建基于用户动态画像的学术新媒体信息精准推荐模型。【结果/结论】基于用户动态画像的学术新媒体信息
精准推荐模型能够实现学术信息资源与用户的精准对接,提升用户忠诚度,更好地服务科研工作者的学术活动。
【创新/局限】从理论框架角度分析与构建学术新媒体信息推荐模型,后续将重点研究模型的技术实现与实践应用。 相似文献
9.
【目的/意义】提出基于Stacking集成学习的问答信息采纳行为识别策略,促进在线健康社区问答的精准化推送、助推数字化医疗服务高质量发展。【方法/过程】构建以集成学习方法和非集成学习方法为基学习器、以逻辑回归算法(LR)为元学习器的Stacking集成学习模型,比较单预测模型、同类预测模型组合、不同类预测模型组合的Stacking集成学习模型预测精度,选取“寻医问药”平台的慢性病问答构建数据集验证模型的优越性,并选取“快速问医生有问必答120”平台数据验证模型的可移植性。【结果/结论】Stacking集成模型相比于单预测模型能够更精准识别被采纳问答信息,模型具有较强的泛化性,可以适用于不同的在线健康社区。【创新/局限】本文基于Stacking集成思想构建两阶段预测模型,并借助机器学习构建最佳预测模型组合,显著提高在线健康社区问答信息采纳识别精度,但伴随问答信息积累,在线健康社区问答模式不断发展变化,考虑结合历史数据和每日更新数据的动态预测方法是未来研究工作重点。 相似文献
10.
【目的/意义】当前全球信息化时代下信息过载问题日趋严峻,在深度挖掘信息的基础上,结合用户行为特
征进行智能匹配显得尤为重要。【方法/过程】本文在基于潜在因子模型的个性化推荐算法的基础上,构建了结合时
间序列的语义信息挖掘及匹配模型。通过引入用户历史行为的时间序列语义信息,提高已有模型预测用户偏好的
准确性,结合因子分解机的思想实现对扩展模型的构建,并通过 movielens数据集对该方法的有效性进行验证。【结
果/结论】实验结果表明,新模型能够有效提高已有推荐模型预测用户偏好的准确性,从而实现了良好的数据挖掘
及匹配效果。 相似文献
11.
【目的/意义】当前微博已成为重要的舆论场,针对海量微博信息的舆情难以快速获取的问题,提出一种基
于云计算的微博舆情流式快速自聚类方法。【方法/过程】该方法首先设计舆情最小距离聚类算法,包括构建舆情相
似度计算模型,及构建舆情最佳聚类阈值确定方法;然后构建舆情流式自聚类模型,该模型利用云计算和最小距离
聚类算法在横、纵两个方向聚类舆情信息,得到各主题的舆情集合。在横向上,以云计算的多个计算节点为聚类起
始,同步并行聚类分配到其上的舆情信息。在纵向上,多个计算节点协同、流水线式聚类同一起始节点的舆情信
息;最后在纵向上聚类舆情集合,将同主题舆情集合聚为一类。【结果/结论】实验结果表明:该方法能有效加快微博
舆情获取速度,且具有较高的舆情获取准确率。 相似文献
12.
【 目的/意义】为探析研究前沿与发展趋向,突破现有跨学科科研协作研究在主题识别预测中的不足,本文提
出跨学科科研协作新兴主题识别及预测研究框架,实现新兴主题识别及未来发展趋势预测。【方法/过程】以时间切
片的形式对 SciTS 会议文本进行主题抽取,提出新兴主题测量指标,探测领域内新兴主题并构建新兴主题时间序
列;而后分别采取BP神经网络和SVR两种经典机器学习算法对新兴主题未来三年发展趋势进行预测分析。【结果/
结论】根据历史数据对跨学科科研协作新兴主题进行识别及预测有较好的效果,在识别出的五个新兴主题中,跨学
科交流与对话、跨学科协作社区搭建、跨学科教育与培训等主题未来发展状态将趋热。【创新/局限】选取美国SciTS
会议文本为典型案例展开探索性分析,丰富当前跨学科科研协作研究内容的层次性和多样性。 相似文献
13.
【目的/意义】为了协助商家和平台获取移动商务在线评论中的用户需求,解决在线评论过载导致用户需求
提取困难等问题。【方法/过程】本文首先获取原始在线评论数据集进行文本预处理和清洗;然后,深入语义层面基
于改进后的 Canopy-Kmeans算法实现用户需求聚合;最后,以聚合结果为层级指标设计 Kano问卷,用重要性判别
方法和用户满意度指数优化用户需求分类标准,实现用户需求的高效聚合和精准挖掘。【结果/结论】通过实验结果
对比分析发现与基于语义的传统聚类方法相比,本文设计的移动商务用户需求聚合与挖掘方法的聚类结果更清晰
合理,能够获取更精准和细化的用户需求。【创新/局限】借助Word2vec模型从语义的视角分析用户需求,提出基于
Canopy-Kmeans算法的用户需求聚合挖掘模型,但选取的研究对象和数据规模较为有限,下一步将扩大在线商品
评论的研究范围及实验数据规模。 相似文献
14.
【目的/意义】针对现有主题演化方法难以满足预测目的的需求,本文从知识动态发展的角度出发,构建知
识主题演化预测模型,为探究科学领域发展脉络与研究趋势提供方法。【方法/过程】通过Lda模型抽取知识主题,利
用马尔可夫和隐马尔可夫构建主题稳态与主题热度的演化预测模型。【结果/结论】以云计算领域的科学文献作为
实证分析对象,结果表明本模型可以根据历史数据来预测知识主题稳态分布情况与未来热度趋势,且在热度预测
精度上较灰色模型更高。【创新/局限】本文只考虑了横向主题内部的热度高低变化,没有进行纵向维度上各知识主
题间的对比。 相似文献
15.
【目的/意义】通过识别影响在线医疗信息服务质量的敏感因素,为互联网在线医疗信息服务企业实现技术与服务创新提供理论与实践依据,进而提升用户在线医疗信息服务质量。【方法/过程】以问卷调查法与专家访谈法等为基础融合信息增益理论分析各影响因素与在线医疗信息服务质量高低的关联程度,进而以提取的关键影响因素构建在线医疗信息服务质量关键影响因素模型,最后通过SVM构建在线医疗信息服务质量预测模型。【结果/结论】影响在线医疗信息服务质量的20个关键影响因素集中在信息生态的四个重要维度,即信息、信息任、信息技术与信息环境四个维度上,模型88.43%的预测精准度说明SVM对在线医疗信息服务质量具有可靠的预测能力。 相似文献
16.
【目的/意义】“信息过载”问题不利于用户快速准确获取目标信息,本文提出构建社交媒体基因图谱并应
用于信息推荐领域,为用户信息推荐提供新思路。【目的/意义】本文将社交媒体分解为社交媒体用户和社交信息内
容两大主体部分,借助生物学基因图谱概念,建立两大主体基因群并分别进行基因提取,构建社交媒体基因图谱,
并通过社交媒体基因图谱唯一辨识用户实体偏好进行信息推荐。【结果/结论】构建基于社交媒体基因图谱的信息
推荐模型,考虑用户内部及信息环境对基因图谱的影响,进行模型优化,为用户提供更加精准的信息推荐内容。【创
新/局限】基因的变异无法准确预估和控制,需要进一步研究引起基因变异的因素及变异方向,通过基因的可复制
性更加高效准确地对个人用户社交媒体基因图谱进行构建,进而实现其在信息推荐领域的应用。 相似文献
17.
【目的/意义】面对网络时代数据的海量性和无序性,为用户推荐个性化资源有利于增强用户间合作、提高
知识的共享速度,对新知识的发现具有深远意义。【方法/过程】基于具有相同兴趣用户的聚合优于单纯的信息聚
合,构建基于社会化标注系统的个性化推荐模型。通过引入社会网络中用户使用标签的频次来选择与用户关联显
著的标签,并通过加权派系发现和聚合“小众”凝聚组群和相似标签集,进而为用户推荐优质资源,使其真正契合用
户的个性化需求偏好。【结果/结论】结果表明模型能够有效实现信息的个性化推荐,消除单独聚类带来的粗糙数据
集,并通过抓取豆瓣上的数据进行实证分析。 相似文献
18.
【 目的/意义】在突发公共卫生事件情境下面向在线健康社区用户画像与分群,有助于提升社区服务质量,为
拓宽互联网疫情风险感知渠道作出贡献。【方法/过程】以“COVID-19”为例,结合社区数据特点从用户基本特征、
用户兴趣主题、情感倾向、用户问诊需求和用户交互网络角色五个角度出发构建画像标签并利用DBSCAN聚类实
现画像,根据画像结果呈现用户概貌;利用 AP算法在画像基础上实现用户分群,通过社会网络分析找到最具疫情
风险发现价值的用户类群。【结果/结论】实例分析表明,本文所构建的模型能够有效生成在线健康社区用户画像,
画像可以对社区用户进行概括、映射用户原貌;分群结果呈现出5类社区用户群:患者、疑似患者、医师、奉献者和社
区管理员;社会网络分析表明最具疫情风险发现价值的用户群体为疑似患者和奉献者。【创新/局限】实例分析数据
量尚达不到“大数据”标准,画像构建粒度仍有继续提升的空间。 相似文献
19.
【目的/意义】随着网络规模的持续扩张,加强公共卫生安全网络舆情的特征挖掘及走向预测,探索舆情预
警机制,已成为当前公共卫生安全治理领域亟待解决的关键问题。【方法/过程】本文基于对公共卫生安全网络舆情
预警特征的理解,采用弱关联挖掘方法构建了包括舆情黏合性、热力性、趋势性三个维度的公共卫生安全网络舆情
预警模型。基于此,以“长春长生问题疫苗事件”的舆情数据为例,对公共卫生安全网络舆情的影响要素进行了详
细分析;同时,综合运用K-Means聚类算法与灰色关联分析方法,对该事件的舆情发展时间进行预警分级,为后续
对策建议提供支撑。【结果/结论】结果表明基于 K-Means聚类算法的弱关联挖掘方法在公共卫生安全网络舆情中
具有较强的适用性。【创新/局限】本文基于公共卫生安全网络舆情特点,采用K-Means聚类算法与灰色关联分析方
法划分预警等级,实现了研究方法上的创新。但仍存在一些不足之处,如预警分级自动化触点的研究等,需要后续
更加深入的探究。 相似文献
20.
【目的/意义】用户在进行文档内信息搜寻时,根据自身需求和阅读深入程度的不同,呈现出两种不同的阅 读行为——深阅读与浅阅读。自动识别用户的深浅阅读有利于改善当前对深、浅阅读区分存在主观性强、耗时耗 力的问题,对于研究文档内信息搜寻用户的个性化认知机制,优化用户信息搜寻体验也提供了很好的帮助。【方法/ 过程】本文根据前人对深、浅阅读的研究,利用K-means聚类算法构建文档内信息搜寻用户深、浅阅读行为的自动 识别模型,并用实验验证模型分类的准确度。【结果/结论】实验结果显示,深、浅阅读在注视点持续时长、眼跳距离、 眼跳方向和相邻注视点中心纵坐标距离这四个特征上有很大的差异,同时经过专家验证,K-means聚类模型识别 深、浅阅读总准确率片段数为84.95%,片段时长为94.32%,达到了自动、准确识别文档内信息搜寻用户的深、浅阅读 行为的效果。 关键词:深阅读; 相似文献