首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 25 毫秒
1.
[研究目的]从热点主题的特征维度出发,基于LDA模型构建热点主题识别的指标体系,使识别结果更加清晰明确、具有更强的热点指向性,为热点主题的识别工作提供新的思路与方法。[研究方法]以中国知网2000-2020年我国制氢领域的期刊文献为数据源,利用LDA模型抽取研究主题;分析热点主题的影响力特征及关注度特征,并基于LDA的输出信息对其进行量化,从影响力特征维度和关注度特征维度构建热点主题识别的指标体系;最后通过指标计算确定热点主题并进行主题内容分析。[研究结论]以我国制氢领域为例进行实证分析,发现了光催化分解水制氢技术、甲醇制氢技术、光催化剂性能及其制备、光伏发电制氢技术这4个热点主题。通过与共词分析法的对比,验证了指标体系对于热点识别的有效性。  相似文献   

2.
[目的/意义]正确处理网络新闻带来的安全风险是保障互联网信息安全的关键。当前网络敏感信息研究主要基于网络评论语境,识别过滤以关键词形式出现的不良信息,对敏感信息的敏感程度不能进行精细计算。[方法/过程]针对现有方法的缺陷,文章从网络新闻敏感信息的语义内涵出发,通过传统敏感词方法识别出新闻中的敏感信息,然后将BERT模型方法和语义分析方法相结合衡量新闻的敏感程度,进而评估新闻的风险水平。[结果/结论]实验表明,文章实现了网络新闻敏感信息识别和敏感程度计算,能够根据计算结果对新闻进行风险分级,提出有针对性的风险处理策略,对于有效应对网络新闻带来的安全隐患具有积极意义。  相似文献   

3.
[目的]从海量微博舆情信息中准确、高效地发现和挖掘当下的热点主题,以期为政府和企业监控和管理舆情动态提供有价值的参考。[方法]研究首先从维度、特征和度量三方面综合考虑构建"帖子-主题"二模网络模型,其次选择词频、主题权重和词频增长率3个特征来抽取模型所需的有效关键词,然后选取社会网络分析法中的社区发现方法进行基于关键词的主题社区发现,最后综合考虑用户影响力和传播影响力两个属性,通过热度分析确立主题热度,识别热点主题。[结果]实验表明,该方法能有效挖掘网络舆情中的热点主题,检测出的主题结果均正确,验证了本文方法的可行性和有效性。在此基础上,研究还选取实例进一步对主题的热度迁移和情感倾向进行了分析,具备一定的预警作用。  相似文献   

4.
[目的/意义]针对技术功效图构建过程中的主要问题和薄弱环节,提出了一种基于SAO结构和词向量的专利技术功效图构建方法。[方法/过程]利用Python程序获取专利摘要中的SAO结构,从中识别技术词和功效词;结合领域词典与专利领域语料库,运用Word2Vec和WordNet计算词语间的语义相似度;利用基于网络关系的主题聚类算法实现主题的自动标引;采用基于SAO结构的共现关系构建技术功效矩阵。[结果/结论]实现了基于SAO结构和词向量的技术功效图自动构建,该构建方法提高了构建技术功效主题的合理性和专利分类标注的准确性,为技术功效图的自动化构建提供新的思路。  相似文献   

5.
刘冰  庞琳 《情报理论与实践》2021,(3):172-177,163
[目的/意义]从用户角度,通过用户评价内容挖掘构建形成网络学术信息资源评价模型,为网络学术信息资源评价提供一个新的视角,并为其更进一步深入研究奠定基础。[方法/过程]文章在利用爬虫工作自动抓取三个知名学术网站用户评论的语料库基础上,运用数据挖掘研究方法对评论数据进行分词、聚类,根据词间与词对关系,构建形成评价体系模型。[结果/结论]基于用户评论挖掘构建形成涵盖资源内容属性、资源外部特征、网络功能属性、获取过程、用户体验五个维度的网络学术信息资源评价体系模型。该体系模型反映出科学用户在利用新兴网络学术信息资源过程中对资源自身属性和平台规范性的关切,是用户与利用正式学术信息资源的本质区别。  相似文献   

6.
孙靖超  刘为军 《情报科学》2021,39(7):147-152
【目的/意义】舆情主题识别一直是舆情领域的研究热点,如今已有丰富的研究成果。现有研究对舆情信息 进行表征时多采用了传统的词袋模型、主题模型或词向量模型,只能对词语进行唯一的向量表征且传统模型需对 文本分词,可能会因分词错误、数据稀疏、出现集外词等情况影响识别效果。【方法/过程】本文构建了一种基于多采 样双向编码表示的网络舆情主题识别模型,在训练前无需对文本进行分词,针对文本过长的情况采用头尾结合的 方式进行截断,从字、段、位置三个维度提取特征嵌入,通过自注意力机制进行舆情表征,在训练过程中使用区分性 微调和多采样dropout的方法增强泛化能力,提升识别效果。【结果/结论】实验结果表明构建模型在舆情主题分类任 务中表现良好,可以在不对文本分词的情况下实现对舆情主题的准确识别。【创新/局限】创新之处在于构建了一种 新型的网络主题识别模型,局限之处在于算法复杂,如何进一步调参优化是接下来的研究重点。  相似文献   

7.
[目的/意义]专利关键词提取是专利挖掘任务中非常重要的前置子任务,基于图模型的关键词提取是目前最有效的算法。传统图模型只考虑了单词的局部上下文信息,为了捕获单词的全局信息,提出一种基于图神经网络的专利关键词提取算法,结合词向量与图模型实现专利关键词的提取。[方法/过程]首先,用专利数据集构建异构网络,以专利分类号为标签,训练图神经网络模型,使得同一主题下的单词具有相似的向量表示,获取包含主题信息的词向量;然后,根据专利摘要在滑动窗口内的单词共现关系和词向量相似度,构建融合了单词主题信息的文本图,利用词向量中的主题信息捕获单词的全局联系;最后,在文本图上使用PageRank算法,获取关键节点,构成专利的关键词。[结果/结论]与基线方法相比,该算法在提取专利关键词时,能够检测到新颖性与准确性更高的关键词。  相似文献   

8.
[目的/意义]在线社交用户的信息行为对网络舆论生态环境的构建具有重要的指导意义。[方法/过程]借鉴"用户画像"的思想,提出了在线社交用户舆情画像的概念,围绕人类动力学研究视角构建了在线社交用户的舆情画像模型,最后从舆情信息传播的时间间隔分布、活跃度分布、时间间隔重标度、交互热度、阵发性和记忆性等方面对在线社交用户信息传播行为特征进行了实证分析。[结果/结论]研究结果表明,在线社交用户"舆情画像"可全面揭示其网络信息行为特征,实现对用户基本信息与舆情传播信息的有效收集、有效识别与定量分析,从而为网络舆情生态环境的完善提供参考。  相似文献   

9.
黄立赫  石映昕 《情报杂志》2022,41(2):146-154
[研究目的]从视频弹幕的视角出发,挖掘网络舆情事件的话题漂移规律,提升网络舆情事件的视频情感检索精度。[研究方法]通过对视频弹幕进行主题与情感分析,提升网络舆情事件在线监测精准度,并在此基础上提出并构建弹幕迁移指数,建立一种基于弹幕迁移指数的情感监测方法,该方法首先基于BTM主题模型抽取视频弹幕的话题信息,并基于情感词典与颜文字词典计算不同时间窗口下的话题情感类别与情感强度,建立面向视频弹幕的网络舆情事件监测模型,再从话题内容的变化与视频兴趣热度两个角度构建话题迁移指数,并利用话题的情感强度变化,构建情感迁移指数。最终,基于话题迁移指数与情感迁移指数,得到加权后的弹幕迁移指数,实现网络舆情事件的在线监测。[研究结论]通过视频弹幕社区的真实数据,从逻辑层面验证了本模型的合理性,结果表明该方法能够较为准确地识别网络舆情事件迁移的关键时间窗口,为实现视频分享平台的情感可视化提供了切实可行的理论探索。  相似文献   

10.
[目的/意义]当前社交媒体中的虚假、劣质信息层出不穷,极大地干扰了正常的网络公共秩序。对发布异常信息、呈现异常行为的异常用户进行预测治理,能够有效实现网络公共空间的正本清源。[方法/过程]在既有研究的基础上,文章融合用户个体特征、行为、关系、文本主题和情感特征,构建社交媒体异常用户特征体系,并利用图注意力网络构建异常用户分类预测模型。[结果/结论]文章所构建的社交媒体异常用户特征体系具备完整性和普适性,且异常用户预测模型的分类准确率达到92.8%。相比其他分类模型,所构建的图注意力预测模型能够有效识别社交媒体中的异常用户。此外,关系特征、主题特征以及用户注册时间对预测异常用户的贡献度较高,在体征体系中具有较高的重要性。  相似文献   

11.
[目的/意义]针对现有基于文本挖掘的政策主题扩散特征研究中文本主题识别的随机性和高度依赖人工等不足,提出一套基于创新价值链理论的政策主题分析框架及对应的文本挖掘方法,从而更好地识别政策扩散过程中政策内容变化的特征以及背后潜在机制。[方法/过程]以我国人工智能政策为实证对象,在理论上构建了基于创新价值链的政策文本主题分析框架,在方法上基于依存句法和语义信息抽取政策文本关键短语结构,通过构建分析框架主题与短语结构词汇的一一映射关系词典来完成对政策文本主题扩散分布的计算。[结果/结论]采集了自2017年以来的110份人工智能政策文本,分析了人工智能政策扩散时间分布、空间层级、内容扩散程度特征和主题扩散分布特征,在此基础上将政府主题扩散倾向性与其发展阶段所处梯队作为定序变量,从而分析两者关系以及背后的潜在机制。由此证明了本文所提方法可有效融合文本挖掘方法和政策分析理论,有助于从对政策扩散特征的描述性分析走向对政策扩散机理的解释性分析。  相似文献   

12.
王松  骆莹  刘新民 《情报杂志》2024,(5):123-131
[研究目的]旨在优化虚拟社区中知识共创价值的识别方法,缓解因信息过载和关联复杂性等导致的高价值性知识资源识别效果不佳的问题。[研究方法]从知识共创的动态协同过程入手,构建集成双粒度语义与异质性网络的知识共创价值识别模型(DGSHAN)。首先利用BERT、Sentence-BERT并行获取词、句双粒度知识单元的语义信息,继而引入CNN、BiLSTM差异化提炼协同知识的局部内核特征与动态时序特征;同时采用HAN处理异质性关联网络,挖掘用户交互下多类型实体与拓扑结构中的关联规律,最后融合知识资源组合和用户行为互动双链路特征,实现知识共创价值的有效识别。[研究结论]经魅族社区Flyme数据验证,该模型的识别准确度、宏F1、加权F1分别为82.16%、73.56%、81.39%,相较于其他基线模型,各评估指标都有显著提高,可以有效提升知识共创价值的识别效果。  相似文献   

13.
[目的]为了克服传统视觉词袋方法(Bag-of-Visual-Words)中忽略视觉单词间的空间关系和语义信息等问题。[方法]本文提出一种与视觉语言模型相结合的基于LDA主题模型,并采用查询似然模型实现检索。[结果]实验数据表明,本文所提出的基于LDA的表示方法可以高效、准确地解决蒙古文古籍的关键词检索问题。[结论]同时,该方法的性能比BoVW方法有显著提高。  相似文献   

14.
[目的/意义]基于社交媒体用户的共同评论关系构建共评网络,综合运用社会网络分析与自然语言处理技术,探索高效挖掘社交媒体中主流网络民意的方法。[方法/过程]按阶段梳理社交媒体用户共评关系并构建共评网络,综合利用K核分解和核塌缩分析识别核心评论用户群;以核心评论用户群为目标分析对象,从主题和情感两个维度构建主流网络民意的表达,并分析网民讨论热点及情感分布的综合演化过程;利用新冠病毒感染疫情相关热门微博的评论数据进行实证研究。[结果/结论]共评网络分析可以准确识别出社交媒体中的核心评论用户群,其拥有结构稳定且联系紧密的共评关系;聚焦于核心评论用户群的评论内容,即可实现主流网络民意的高效挖掘,准确呈现出网民主要诉求和情感的变化特征;实证结果与我国新冠病毒感染疫情中的应对实情和网络舆论走势基本契合,证明了此方法的有效性。  相似文献   

15.
[目的/意义]面向大数据研究多个网络传播平台之间网络舆情信息交互模型,能够准确把握大数据环境下网络舆情演化趋势以及网络信息在多个平台之间的传播规律,为政府治理网络舆情提供参考依据。[方法/过程]定性分析大数据环境下网络舆情信息交互机理,通过定义交互系数,基于微分方程理论构建网络舆情信息交互模型,并应用差分回归法对各个媒体平台的网络舆情信息交互趋势开展预测。[结论/结果]经过理论建模和实证分析得出本文构建的信息交互模型及趋势预测方法是可行的,以上理论研究可为政府准确把握大数据环境下网络舆情演化规律,制定网络舆情治理对策提供参考依据。  相似文献   

16.
马雨萌  黄金霞  王昉  芮啸 《情报杂志》2022,(11):157-163
[研究目的]为实现科技政策文本内容的自动编码与多主题分类,探索一种融合BERT模型和多尺度CNN模型的多标签分类方法,得到更加丰富的政策语义特征信息。[研究方法]针对科技政策内容句的信息密度大、内涵分布不均衡等特点,通过BERT充分提取政策内容的上下文信息,增强文本的语义特征表示;然后利用多尺度、多通道的CNN-Inception模块提取更多尺度的特征,通过捕获文本的局部特征与组合不同尺度的语句特征,提升模型在多标签分类任务上的性能。[研究结论]对比实验表明,与单一BERT分类模型相比,文中提出的BERT-多尺度CNN模型的召回率与Micro-F1值显著提高,提升了科技政策多标签分类的效果。  相似文献   

17.
谭晓  李辉 《现代情报》2019,39(8):29-36
[目的/意义]面对科技创新演变的加剧和交叉融合加速的大环境,利用情报研究方法及其他学科方法准确识别科技前沿成为获取科技战略情报的重要任务。研究前沿不仅提供了对当前重点和未来趋势的预见,而且为政府决策提供了关键指标。[方法/过程]通过内容分析对当前研究前沿的识别框架、方法以及多元关系、深入内容层面分析方法的应用等现状进行总结,发现目前在研究前沿识别模型和方法中仍存在不足。[结果/结论]针对不足,结合多源数据进行知识融合初步设计了综合宏观和微观的前沿识别模型,将多实体和多关系融合应用到主题关联,利用图模型的社团结构识别和Clique所含信息进行主题表示;划分研究前沿类型并构建前瞻性指标体系,完成科技前沿的识别,以期更准确、高效、全面地识别科技前沿。  相似文献   

18.
丁浩  孔令圆  刘清  胡广伟 《现代情报》2023,(11):135-145
[目的/意义]本文针对农业领域提出一种基于融合多重特征词嵌入模型的农业命名实体识别方法,以提高识别准确度。[方法/过程]通过使用结合字符、位置语义、领域知识字典特征等多重特征向量作为嵌入层,充分考虑字符的位置信息和上下文语义信息,并根据农业领域的中文实体的特点改进了单一字符向量嵌入,获得更多的农业实体特征,同时采用双向长短时记忆网络BiLSTM和多头注意力机制来学习文本的长距离依赖信息,再利用条件随机场CRF获得全局最优标注序列。[结果/结论]本文在农业领域中文实体语料数据集中与9种基于基线方法进行对比实验,模型的Precision为92.2%,Recall为92.0%,F1值为92.11%,均优于其他基线模型,说明本文模型对于中文农业命名实体识别更精确。  相似文献   

19.
[目的/意义]探索突发公共卫生事件网络舆情发展周期中的主题和情感演化历程,研究影响网民情感波动的因素,为网络舆情有效管控提供决策支持。[方法/过程]结合博文数量的时序特征和生命周期理论进行周期划分,利用LDA模型、BERT-BiLSTM-Attention模型构建研究框架,探究不同周期的舆情主题差异及情感演化。[结果/结论]线下病毒变异演化和线上舆情主题与情感演化具有关联性。在新型冠状病毒变异语料库中,BERT-BiLSTM-Attention模型分类准确率为0.8817,F1值为0.8778,其在情感演化分析上具有优越性。构建的“数据采集预处理、舆情周期划分、主题演化和情感演化到获得策略输出”的全过程分析框架对相关部门有效引导网络舆情提供了决策支持和理论支撑,BERT-BiLSTM-Attention模型能更准确地进行情感分类。[局限]数据源单一,面向时间维度上的演化历程未进行时空结合的演化分析。  相似文献   

20.
[目的/意义]颠覆性技术对技术和市场具有双重影响,无论是对科技发展还是市场结构调整都起到十分重要的作用,准确识别颠覆性技术能够解决可能出现的技术壁垒,对国家和企业具有重要意义。[方法/过程]从技术主题的演化趋势和演化形式两个维度提出颠覆性技术识别框架。首先,利用LDA模型和基于全局和局部影响力的社区探测方法识别领域内的技术主题。其次,基于颠覆性技术的“突变性”和“融合性”特征,引入技术主题时序共现网络和主题引用网络对主题间的演化趋势和演化形式进行判别,实现颠覆性技术的识别。最后,以人工智能领域为例验证提出的颠覆性技术识别方法的可行性和有效性。[结果/结论]该方法能够准确实现颠覆性技术的识别,研究识别出人工智能领域的7项颠覆性技术,包括“机器人模块化设计方法及应用”“相关领域机器人技术及应用主题”“仿生机器人技术及应用”“自动无人智能系统”“自动驾驶技术”“服务机器人技术及应用”和“机器人部件优化技术”这有利于我国抓住科技创新主动权,加快颠覆性技术布局。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号