首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 198 毫秒
1.
【目的/意义】为在线医疗问诊平台中的医生自动生成高质量标签,更好地服务于对医生资源的分类、检索和管理。【方法/过程】基于在线问诊文本信息,提出了结合时间周期特征与文本主题特征的医生标签自动生成算法。首先根据医生相关文本信息提取关键词生成候选标签,然后从患者问题文本和医生回答文本两个方面进行LDA主题模型训练,按时间周期挖掘出问题文本和回答文本的主题特征,对候选标签进行质量控制;最后经标签加权混合后得到最终的医生标签。【结果/结论】实验结果表明,该标签自动生成算法能够反映出医生标签生成的动态性,能够准确生成符合医生专业知识特征的高质量标签,具有较好的标签生成效果。  相似文献   

2.
张雷  谭慧雯  张璇  韩龙 《情报科学》2022,40(3):144-151
【目的/意义】构建高校师德舆情微博用户评论LDA模型,可以更精准识别舆情演化特征和分析关键主题传 播路径,帮助高校和相关部门更为有效地进行舆情监管和舆情引导。【方法/过程】本文以“天津大学一教授学术造 假”事件为例,基于 LDA模型构建高校师德舆情下微博用户主题生成模型,采用困惑度评价指标确定 LDA模型最 优主题数,采用信息熵确定每一主题在不同日期的主题强度,通过关键词共现知识图谱、词云展现舆情话题的演 变,最后基于主题相似度确定主题传播路径。【结果/结论】LDA模型和信息熵可以解析出网络用户群体关注的重要 主题热点,精准识别舆情演化特征,识别主题最优传播路径进行舆论引导,对爆发的舆情实现预测和管制优化。【创 新/局限】文章创新性地构建高校学术道德舆情的LDA主题模型,有效确定微博用户群体主题、识别舆情演化特征、 分析主题间传播路径,具有普适性;进一步扩大高校师德其他舆情分析及结合网络舆情情感分析为下一步的研究 内容。  相似文献   

3.
安璐  周亦文 《情报科学》2020,38(4):9-16
【目的/意义】构建用户特征指标体系,对恐怖事件情境下微博信息与评论用户进行画像并比较有助于掌握参与恐怖事件讨论用户的特点,加强反恐舆论引导。【方法/过程】以"#巴塞罗那恐怖袭击#"话题下的所有微博及评论数据为例,使用基于相关性的LDA主题模型提取微博主题,从用户特征和文本特征两个角度构建指标体系,并采用两步聚类刻画微博用户特征,分析发布微博用户和评论用户的异同。【结果/结论】以往活跃度、影响力较高的用户在该事件中不一定拥有较高的影响力;原始微博用户的平均等级略低于评论用户,但其在该事件中的影响力高于评论用户;原始微博用户类型多于评论微博用户类型。  相似文献   

4.
吴剑云  胥明珠 《情报科学》2021,39(1):128-134
【目的/意义】用户画像深刻地描述了视频用户的个体和群体行为特征,为视频的个性化推荐服务提供参 考。【方法/过程】通过文本挖掘对爬取的视频、用户及其观影数据分析,构建单个用户画像,并通过K-Means和LDA 模型对用户聚类并提取主题,挖掘群体用户特征。基于用户画像和时间指数衰减的视频兴趣标签,并结合视频喜 爱度和协同过滤,进行视频推荐。【结果/结论】考虑时间指数衰减的个性化推荐,提高了系统对用户兴趣的感知。 结合视频喜爱度和协同过滤,推荐视频评分达0.87,有助于提高用户对网站的忠诚度和活跃度。【创新/局限】基于用 户生成内容的文本挖掘结果,进行单个和群体用户画像,并创新性采用时间指数衰减构建用户视频兴趣标签,以捕 获用户兴趣的变化。由于网络爬虫的限制,实验数据量有一定的局限性,且特征提取兴趣范围有限。  相似文献   

5.
曾金  贺国秀 《情报科学》2019,37(3):136-140
【目的/意义】基于社交媒体用户分享的图像、博文及用户标签数据,为用户推荐潜在的好友,从而更好的为 用户做个性化推荐和精准化服务。【方法/过程】在获取微博用户分享的图像、博文及用户标签的基础上,通过使用 深度学习的方法利用图像、博文及用户标签数据来表达用户兴趣特征,基于这三类特征组合,通过计算用户之间的 余弦相似度来挖掘与目标用户兴趣最相近的若干个候选用户。同时,探讨了多模数据在无监督学习下的用户推荐 问题,并与单模数据进行比较。【结果/结论】实验结果表明,利用图像、博文和用户标签合成的多模数据对用户的兴 趣进行建模并进行好友推荐较单模数据效果好。  相似文献   

6.
【目的/意义】提出融合深层演化特征的情感分析方法,以提升公共安全事件微博情感分析精度。【方法/过 程】以红黄蓝幼儿园涉嫌虐童事件为例,使用LDA与爬虫软件提取演化特征中的主题特征、时间特征,结合传统浅 层文本词性特征与情感特征,应用于XGBoost以生成微博情感分析集成模型。【结果/结论】演化特征的融入使得 情感识别准确度Auc值提高4%,且XGBoost分类精度均优于SVM、随机森林。本文提出的情感识别模型能够在公 共安全事件微博情感分析方面取得较好效果  相似文献   

7.
梁珊  邱明涛  马静 《情报科学》2017,35(7):44-49
【目的/意义】考虑到使用LDA模型进行主题抽取时,抽取到的特征词是无序的,破坏了原有的主谓宾结 构,导致抽取效果不准确,可读性差的缺陷,构造了WO词序模型,并将LDA模型与WO模型结合,提出了基于 LDA-WO混合模型的微博主题有序特征抽取算法。【方法/过程】使用LDA模型进行主题建模,获得无序特征词, 然后通过WO模型对特征词进行排序,将特征词与原语料进行对比,构造特征词-语料位置矩阵,通过对特征词的 位置排序,构造特征词词序权值矩阵,最终获得有序的特征词,完成对话题特征的有序抽取。【结果/结论】本文以真 实新浪微博数据为实验对象,实验结果表明基于LDA-WO模型的特征词提取方法进行特征抽取,抽取到的特征词 可读性更强,可弥补传统LDA模型在话题可解释性上的不足。  相似文献   

8.
【目的/意义】由于信息总量的巨大和用户矩阵的稀疏,LDA模型在微博信息推荐过程中短文本处理能力 差的缺点被放大。【方法/过程】本文利用大数据技术处理海量信息的优势,探讨大数据与 LDA主题模型融合的可行 性,构建出了大数据技术与 LDA融合的推荐模型,实现在利用大数据技术对海量文本预处理的基础上基于 LDA模 型的微博信息推荐,解决微博信息推荐查全率和查准率差的问题。【结果/结论】通过 Hadoop平台上的实证分析表 明,融合模型可有效的降低混淆度和提升微博信息推荐精度,有利于实现信息的个性化和定制化推荐。  相似文献   

9.
王正成  袁竹星 《情报科学》2018,36(3):112-116
【目的/意义】在微博中,意见领袖对于消息的传播以及舆情走向起着关键的作用。然而,现有的意见领袖 研究大多忽略了意见领袖在特定话题下的意见代表性。【方法/过程】提出了面向主题的微博意见领袖研究的方法, 该方法旨在利用LDA主题模型挖掘出特定话题中的各个主题,根据主题划分结果对参与话题讨论的用户进行分 类,并结合用户自身属性,借鉴PageRank算法思想挖掘出该主题演化中的意见领袖。【结果/结论】实验证明,本文方 法更能体现特定话题的舆情走向,其针对主题挖掘的意见领袖也更具代表性。  相似文献   

10.
田园  宫婷婷 《情报科学》2021,39(9):110-116
【目的/意义】为了进一步提升学生评教信息的使用价值,构建在线教学用户需求指标体系,对在线教学需 求数据进行主题挖掘。【方法/过程】运用数据挖掘理论和LDA主题识别模型,从丰富的在线教学评价内容中挖掘潜 在的在线教学主题,针对教学主题特征向用户需求进行结构映射,最终形成在线教学需求指标体系。【结果/结论】 分析在线教学数据,从教师需求、课程需求、教学成果需求三方面构建在线教学用户需求指标体系,并提出针对性 的教学质量优化策略。【创新/局限】本文通过在线教学需求数据主题挖掘,为高校在线教学评教指标体系的构建与 完善提供了新的途径和方法,但样本数据仅为单一高校数据,未实现全覆盖,对领域研究的整体态势分析还存在一 定的不足。  相似文献   

11.
王静茹  陈震 《情报科学》2018,36(1):102-107
【目的/意义】目前LDA模型在文本数据挖掘方法中占有重要的地位,已成为数据挖掘领域的研究热点。 为了进一步提高LDA模型在文本挖掘中的应用效果,有必要对LDA模型文本主题提取效果进行对比研究。【方法/ 过程】本文提出了一种基于LDA模型的不同类型文本数据主题提取效果对比评价方法,先通过LDA模型对文本数 据进行主题挖掘;再通过定量的主题提取效果评价方法进行对比研究。【结果/结论】本文以期刊论文、网络舆情事 件话题、微博文本、调查问卷为文本数据源,实验结果表明LDA模型在处理语义信息明确逻辑关系合理的长文本数 据时,主题提取效果较好。这为提高LDA模型的挖掘效率提供了一定的理论依据。  相似文献   

12.
【目的/意义】以近两年(2018-2019)国内有代表性的四件负面公共安全突发事件为例,对其微博评论进行 聚类,并找出影响微博用户消极情感倾向的因素,为政府进行舆情应对处理提供建议。【方法/过程】结合社会网络 分析法与LDA主题模型对评论文本进行关键要素提取,得出评论归因维度,进而通过情感分析软件对各维度进行 情感倾向度分析。【结果/结论】研究结果表明:微博用户主要从事件主体、事件分析、事件处置、社会关系、新闻媒 体、同理心、个人经验七个方面对公共安全突发事件进行评论,其中,事件分析、事件处置、事件主体、社会关系是微 博用户消极情感倾向的主要影响因素,据此本文提出了相应的舆情疏导建议。【创新/局限】本文基于归因理论,创 新性的提出了影响微博用户情感倾向度的归因维度体系,但舆情事件集中数量有限且未进行更细粒度的情感分类 分析。  相似文献   

13.
李莉  林雨蓝  姚瑞波 《情报科学》2018,36(10):64-70
【目的/意义】挖掘出客服聊天记录中蕴含的主题,为客服自动问答系统的设计及优化提供指导方案。【方 法/过程】本文针对保险网站客服聊天记录这类交互式短文本,利用会话切分、分词提取以及词汇过滤等方法进行 文本预处理,通过名词短语提取、高频词汇提取以及外部数据集引入等方法进行特征选择,最终应用 LDA建模方法 获取交互式文本主题。【结果/结论】模型结果显示:用户主要关注保险详情、保险金额以及保险险种等主题。不同 主题之间的话题具有一定的独立性,主题和话题之间存在很强的相关性。LDA模型结果成功挖掘出用户关注的主 题,这为电子商务网站运营方进行自动问答系统的设计和优化提供了指导方案。  相似文献   

14.
吴树芳  吴崇崇  朱杰 《情报科学》2021,39(8):103-111
【目的/意义】微博用户画像的精准构建,可有效识别用户的需求,提高个性化推荐的准确率。针对现有微 博用户画像构建方法对用户特征提取不全面、不准确的问题,本文提出了基于兴趣转移的用户画像构建方法。【方 法/过程】首先,依据层次分析法确定不同兴趣行为的权重,并将其用于修订兴趣词权重,获得用户的初始兴趣词 集;然后,依据生命周期理论获得用户兴趣行为周期,构建兴趣转移的时间衰减函数,实现对用户兴趣词集的动态 更新和叠加;最后,将用户的静态属性标签与基于兴趣转移的动态兴趣标签融合构建微博用户画像。【结果/结论】 实验采用从新浪微博爬取的真实数据作为数据集,实验结果显示:与已有微博用户画像构建方法相比,本文提出的 方法在个性化推荐中具有较好的性能。【创新/局限】创新点为:借鉴生命周期理论刻画微博用户兴趣行为周期,构 造兴趣转移的时间衰减函数,实现兴趣标签的动态更新。局限是未对静态属性标签的重要性进行界定,且未对存 在异常波动的兴趣行为曲线进行深入探讨。  相似文献   

15.
【目的/意义】研究分析社交媒体平台中围观者对不同类型隐私泄漏事件的情感,以确定围观者对不同类型隐私泄露的态度,促进社交媒体平台在用户隐私安全的情况下为用户提供更好的服务。【方法/过程】基于隐私泄露事件的四种类型,构建百度情感倾向分析与LDA主题识别相结合的情感分析框架,分别在四种社交媒体平台上对四类隐私泄露事件典型案例中围观者的评论进行抓取和处理,采用LDA主题提取模型进行主题提取,通过百度情感倾向分析进行情感分类,最终进行情感对比分析。【结果/结论】总体而言,大约75%的围观者对隐私泄露事件持负面情绪,其中围观者对社会隐私泄漏的负面情绪占比最高达82%。具体到各平台的围观者,微信公众号和微博的围观者负面情绪较多,知乎中的围观者中性、负面情绪较多,抖音平台的围观者正面情绪占比较高。根据研究结果,提出了相应的建议。【创新/局限】本文创新性地探讨了四种社交媒体上的围观者对四类隐私泄露事件的情感差异,情感的情景与强度维度研究不够深入。  相似文献   

16.
【目的/意义】本文利用用户在健康信息问答过程中产生的真实数据,从网络结构和信息主题两个维度对网 络健康社区中的健康信息传播网络及主题特征进行研究,进而为社区的建设和维护提供建议。【方法/过程】首先, 利用社会网络分析法对不同时间阶段的健康信息传播网络进行指标测度和可视化呈现,探究其网络结构特征;然 后结合LDA和已有词表,对社区内健康信息进行主题识别和提取,分析健康信息主题的分布及其变化趋势。【结果/ 结论】本研究发现实验选取的网络健康社区内部的健康信息传播网络具有小世界效应,用户流动性大,关键节点变 更快;用户健康信息问答的内容集中在若干主题,且部分主题随时间呈现一定变化趋势。【创新/局限】网络健康信 息的生成和传播源于用户之间的信息交互。本文从网络结构和信息主题两个维度开展研究,更符合其内部机理, 研究更加深入和具象;网络健康社区种类众多,本文只选择其中一个社区进行研究,可能存在一定的局限性。  相似文献   

17.
【 目的/意义】研究从用户群体的角度出发,依据用户特征对社区用户进行群体划分,以了解不同用户群体的 主题差异,从而更加全面清晰的了解社区主题,更好的为社区用户推荐资源。【方法/过程】研究利用社会网络分析 和Topsis算法对用户群体进行划分,再利用LDA模型分别对不同用户进行主题挖掘,最后采用谱聚类实现主题优 化。【结果/结论】科学网情报学社区的核心用户与一般用户群体主题有相同的部分,也存在差异,核心用户群体的 主题专指性较强,一般用户群体的主题较为广泛。基于虚拟学术社区用户群体主题挖掘模型,可以更加全面展示 社区用户关注的主题,更好地为社区用户推荐资源。【创新/局限】研究从用户群体的视角出发,提出了虚拟学术社 区用户群体主题挖掘模型,更好的为社区用户推荐资源,但本研究在数据量、主题模型以及社会网络分析指标的选 取等方面还需要拓展与延伸。  相似文献   

18.
史伟 《情报科学》2018,36(4):27-31
【目的/意义】微博转发行为反映了微博用户对所感兴趣微博的一种行为表现,对微博转发行为的研究有助 于微博的深度挖掘工作。【方法/过程】本文从内容分析的角度,对微博转发行为进行了预测。量化分析了微博内容 中一组低水平特征和高水平特征,采用逻辑回归模型对微博转发概率进行预测,并在微博数据集中进行了训练和 验证。【结果/结论】基于模型中的参数学习,证实这些内容特征对于微博转发有着密切的联系,据此进一步推断微 博用户主要的兴趣点。  相似文献   

19.
申静  张璐  王若佳 《情报科学》2019,37(12):3-10
【目的/意义】以微博为代表社交媒体是智库利用新媒体提高社会影响力、扩大知识服务范围的重要渠道。 【方法/过程】以8家中国智库的新浪微博为例,采用Python爬虫工具共搜集到65209条智库微博数据,从微博活跃 度和社会关注度分析智库微博的基本特征;基于LDA模型,从主题类别、主题活跃度、主题传播力分析智库微博的 主题特征,并通过系统分析揭示中国智库微博内容的主题特点。【结果/结论】中国智库微博的内容原创性较强,但 对其应用的重视程度不够,社会关注度严重不足;微博的主题类别与智库的专业定位密切相关;“经济政策与创新 发展”是智库微博的核心主题;“一带一路与合作发展”是智库微博的热门议题;“会议资讯与成果发布”主题尚未得 到智库的广泛重视。新媒体时代,中国智库应高度重视微博微信等社交媒体的应用,以公众需求为导向提高社会 关注度,并通过树立智库专家的媒体形象和及时传播智库的知识成果,不断提升其社会影响力。  相似文献   

20.
曾金  陆伟  陈海华  贺国秀 《情报科学》2018,36(1):124-129
【目的/意义】通过社交媒体用户分享的图像、博文及用户标签进行数据挖掘,来判断和预测用户的真实兴 趣,从而更好地为用户做个性化推荐和精准化服务。【方法/过程】在获取微博用户分享的图像、博文及用户标签的 基础上,通过使用机器学习的方法利用图像、博文及用户标签数据来表达用户兴趣特征,基于三类特征使用SVM训 练得到分类器进行用户兴趣类别预测,主要比较单模数据和多模数据的分类指标,探讨多模数据在有监督学习下 的发多分类问题。【结果/结论】实验结果表明,利用图像、博文和用户标签合成的多模数据对用户兴趣进行分类识 别,F值达到77%,比最好的单模数据提升10%。实验结论证实,多模(图像、博文和标签)数据与单模数据相比,提升 了分类效果,同时为多模数据应用研究提供了一定的理论和技术基础。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号