首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 519 毫秒
1.
[研究目的]新兴领域由于发展时间不长,相关研究的文本量不够充足,先切分文本后关联主题的演化方法可能会导致各时间窗主题重复等问题,因此提出一种先整体识别热点,后切片分析演化的方法,解决新兴领域演化分析中文本量不足的问题。[研究方法]以制氢领域的核心中文期刊文献为数据源,通过构建指标体系先对整体语料库进行热点主题识别,再进行时间切片。对每个时间窗口的文本进行LDA主题抽取,并利用Word2Vec训练词向量,通过相似度计算进行热点主题的子话题关联及其主路径的词汇关联,从而分析各热点主题的结构演化和内容演化。[研究结论]绘制了各热点主题的结构演化图,并以热点主题光催化剂性能及其制备为例,揭示了其在各时间窗内的热点转移关系;同时绘制了其内容演化图,揭示了其各时间窗内的研究重点。实现了演化研究方面的精细化表达,为文本量不够充足的新兴领域演化分析提供了有效可行的思路。  相似文献   

2.
朱光  潘高枝  李凤景 《情报科学》2022,40(4):127-137
【目的/意义】识别信息隐私研究领域的热点主题,梳理主题演化路径。【方法/过程】针对主题识别语义杂乱 等问题,提出时序关联与结构表征视角下的主题演化分析方法。首先利用LDA(Latent Dirichlet Allocation)模型识 别多时间窗口下的文献主题,进一步运用共词分析绘制语义更为独立的主题凝聚子群。在此基础上,从时序关联 维度计算相邻窗口下主题间的相似度,梳理演化路径;从结构表征维度,设计主题新颖度、中心性、影响力等计量指 标,探寻信息隐私前沿和热点主题的演化变迁。【结果/结论】实证分析结果表明,本文方法可以深度挖掘信息隐私 领域研究主题,从宏微观两个维度全面梳理主题的演化路径。研究有利于探测信息隐私研究的前沿。【创新/局限】 综合运用LDA主题模型与共词分析方法绘制主题凝聚子群,从时序演化和结构表征两个维度探寻主题演化路径。 未来研究中有待于引入多种数据源以对比主题差异,有待于引入多元组术语改善主题识别效果。  相似文献   

3.
张雷  谭慧雯  张璇  韩龙 《情报科学》2022,40(3):144-151
【目的/意义】构建高校师德舆情微博用户评论LDA模型,可以更精准识别舆情演化特征和分析关键主题传 播路径,帮助高校和相关部门更为有效地进行舆情监管和舆情引导。【方法/过程】本文以“天津大学一教授学术造 假”事件为例,基于 LDA模型构建高校师德舆情下微博用户主题生成模型,采用困惑度评价指标确定 LDA模型最 优主题数,采用信息熵确定每一主题在不同日期的主题强度,通过关键词共现知识图谱、词云展现舆情话题的演 变,最后基于主题相似度确定主题传播路径。【结果/结论】LDA模型和信息熵可以解析出网络用户群体关注的重要 主题热点,精准识别舆情演化特征,识别主题最优传播路径进行舆论引导,对爆发的舆情实现预测和管制优化。【创 新/局限】文章创新性地构建高校学术道德舆情的LDA主题模型,有效确定微博用户群体主题、识别舆情演化特征、 分析主题间传播路径,具有普适性;进一步扩大高校师德其他舆情分析及结合网络舆情情感分析为下一步的研究 内容。  相似文献   

4.
阿柔娜 《情报科学》2023,(5):153-160
【目的/意义】分析数据隐私风险的时序主题关联,理清热点主题的演化路径,探索有温度的数据隐私风险治理。【方法/过程】基于WOS核心合集和Scopus数据库收录的数据隐私风险领域相关文献,通过LDA主题模型将文本按照时间片切分,并识别各时间片的研究主题;再通过余弦相似度计算分析相邻时间片主题的时序关联,梳理主题演化路径并探索研究前沿。【结果/结论】数据隐私风险研究的关注点逐渐从对识别、评估和缓解数据隐私风险技术本身的关注,转向对平台、算法和场景整体性情境的关注,这需要通过数字伦理、法律和社会等方面共同助力形成负责任的技术,以期构建数字信任环境。【创新/局限】本研究对跨学科和跨领域的数据隐私风险研究的演化路径进行梳理,探索数据隐私风险治理的有效路径。未来可进一步细化不同时期的主题,并深入分析不同时间片的新兴技术对数据隐私风险的影响。  相似文献   

5.
【目的/意义】云计算的普及使得MI学科受到学术界的持续关注,对MI主题识别与演化的分析可以揭示历史演化,有助于发现人们关注的问题,预见该领域的未来发展。【方法/过程】本文利用潜狄利克雷分配(Latent Dirichlet Allocation, LDA)主题模型对web of science(WOS)数据库中与MI相关的主题进行识别和挖掘,并利用生命周期理论、变异系数法、Kullback-Leibler divergence(KL)等理论和方法绘制出MI研究主题的演化路径。【结果/结论】研究结果表明,MI的研究主题正逐渐向方法、技术和实践的研究方向发展,医疗数据分析、临床数据挖掘、健康信息技术等新兴技术和应用方向将成为未来MI学科的研究热点。【创新/局限】本文从生命周期视角对全球范围内医学信息学学科的主题演化进行挖掘和分析,为该学科未来的发展提供借鉴,但并没对各地区分别进行分析,因此存在一定的局限性。  相似文献   

6.
【目的/意义】随着网络社交媒体的发展,舆情文本中隐含的主题越来越能体现出人们的关注点所在及变化 情况,因此对其进行检测及演化分析具有重要意义。【方法/过程】为了解决OLDA模型存在的主题混合及权重定义 问题,本文提出了一种可变在线LDA模型(variable online LDA,VOLDA),通过构建主题相似度矩阵,明确主题变化 关系,在主题内容演化矩阵中剔除含有旧主题的时间片,从而构建变长的演化矩阵,并在此基础上设计动态权重计 算方法及先验参数优化方法。【结果/结论】基于论坛文本数据的实验结果表明,VOLDA模型能够有效减少新主题 出现后的主题混合问题,并且提高主题在演化过程中的表示能力。  相似文献   

7.
林丽丽  马秀峰 《情报科学》2019,37(12):87-92
【目的/意义】为了解近年来图书情报研究的热门主题及其演化趋势,利用LDA模型进行文本挖掘。【方法/ 过程】选取CNKI作为检索数据库,以2006年至2017年图书情报学领域10本核心期刊中的论文摘要作为研究数 据,借助开源工具JGibbLDA构建LDA模型,运用困惑度来确定模型主题数目,根据主题-词项分布文件进行主题 标识,根据文档-主题分布文件计算主题强度。【结果/结论】2006年至2017年图书情报学领域有20个研究主题,其 中比较热门的主题有7个; 8个主题的强度呈上升趋势, 9个主题的强度呈下降趋势, 3个主题的强度变化幅度较小。  相似文献   

8.
罗建  蔡丽君  史敏 《情报科学》2019,37(12):57-62
【目的/意义】基于专利的两阶段新兴技术识别方法能够帮助企业更精准的发现和识别具有变革潜力的新 兴技术,有利于企业洞察研发趋势,在竞争中抢占先机。【方法/过程】以图像识别领域为例,采用两阶段方法识别新 兴技术,第一阶段采用LDA对专利说明书全文构建主题聚类模型,以确定图像识别领域的各项子技术领域;第二阶 段采用新兴技术识别指标体系评判各子技术领域综合表现,最终识别出图像领域的新兴技术。【结果/结论】实验成 功识别出新型光波导纤维材料和计算机存储媒介两项新兴技术,实验结果与业界分析保持一致,说明两阶段新兴 技术识别方法能有效地对专利文献开展新兴技术识别。  相似文献   

9.
【目的/意义】从舆情客体视角探究医保欺诈事件传播周期中情感焦点及情感倾向两个维度的舆情演化趋势,对政府倾听民众诉求及舆情治理有重要意义。【方法/过程】依据生命周期理论划分舆情传播阶段,利用Word2Vec判断舆情客体,使用LDA方法挖掘评论主题进而识别情感焦点,同时使用SnowNLP进行情感倾向研究,最后基于认知-感情相符理论发现民众诉求。【结果/结论】能够挖掘出民众对不同舆情客体在各生命周期的情感焦点、情感倾向及二者演化趋势。研究发现民众态度从事件相关讨论过渡到事件本质探究,而后关心事件后果,最后提出建议,且情感焦点与情感倾向识别结果具有一致性。  相似文献   

10.
[目的/意义]针对技术功效图构建过程中的主要问题和薄弱环节,提出了一种基于SAO结构和词向量的专利技术功效图构建方法。[方法/过程]利用Python程序获取专利摘要中的SAO结构,从中识别技术词和功效词;结合领域词典与专利领域语料库,运用Word2Vec和WordNet计算词语间的语义相似度;利用基于网络关系的主题聚类算法实现主题的自动标引;采用基于SAO结构的共现关系构建技术功效矩阵。[结果/结论]实现了基于SAO结构和词向量的技术功效图自动构建,该构建方法提高了构建技术功效主题的合理性和专利分类标注的准确性,为技术功效图的自动化构建提供新的思路。  相似文献   

11.
【目的/意义】基于文献数据的领域知识图谱构建有助于探测某学科领域的主要研究内容及其发展方向,是 进行技术创新的基础情报工作,对于研究人员、企业都具有一定的意义。【方法/过程】提出基于交互式可视化技术 的知识图谱构建方法,首先基于经典LDA模型进行主题识别,然后基于社会网络分析方法构建领域主题网络识别 关键主题词;最后,基于JS(D3 工具)绘制可交互的关键主题词关联与检索知识图谱,发现关键主题词的隐含联系, 辅助进行领域知识挖掘与分析。【结果/结论】通过对我国医疗健康信息领域进行实证研究,验证了本文提出方法的 准确性和有效性。  相似文献   

12.
罗建  廖婷  史敏  蔡丽君  李维思 《情报科学》2021,39(12):98-104
【目的/意义】诸多知名企业由于没有意识到新兴技术的发展趋势,忽略了未来可能对自身造成威胁的潜在 竞争对手,最终陷入破产境地。目前缺乏从新兴技术视角开展的潜在竞争对手识别研究。【方法/过程】在文献调研 的基础上,对潜在竞争对手识别的内涵进行分析,并构建新兴技术视域下潜在竞争对手识别流程。识别流程涵盖 预处理专利数据、新兴技术识别和潜在竞争对手识别三个步骤,涉及LDA主题模型构建、新兴技术指标体系建立和 技术知识存量计算等关键问题。【结果/结论】以智能驾驶领域为例,证明了基于新兴技术开展潜在竞争对手识别具 有一定的可行性,期望本方法能够为领先企业识别潜在竞争对手提供决策支持。【创新/局限】创新性地将新兴技术 识别与潜在竞争对手识别相结合,丰富潜在竞争对手识别理论与方法。  相似文献   

13.
杨思洛  江曼 《情报科学》2023,(5):181-190
【目的/意义】对国内外新兴技术概念和识别方法进行梳理,总结对比各方法的特点和研究中存在的不足,为未来新兴技术识别研究提供多维视角和方法参考。【方法/过程】通过新兴技术与前沿技术、颠覆性技术概念辨析,明确新兴技术的内涵与特征;然后从数据源、识别路径、识别指标、有效性验证等四个层面梳理新兴技术识别方法的特点及优劣。【结果/结论】总结得出新兴技术识别的4方面数据源、2大识别路径、5类识别指标、4种有效性验证方法,未来可进一步探讨新兴技术形成机制、多源数据的融合,改进基于术语的新兴技术识别路径、更细粒度的自动化识别方法,加强识别指标与技术特征的关联解释,完善识别结果的有效性验证等。【创新/局限】全面系统对新兴技术识别方法进行归纳梳理,从主题和术语两类识别单元归纳新兴技术识别路径机理及方法模型,有利于为新兴技术识别提供不同维度的研究思路。  相似文献   

14.
李湘东  阮涛  潘练 《情报科学》2018,36(4):14-21
【目的/意义】使用聚类技术在话题分析之前对文本集中的噪声文本进行识别筛查,并采用文档相似度分布 及困惑度等对去噪和建模效果加以检验。【方法/过程】在提高文本集质量之后,借助LDA概率主题模型对新闻文本 集进行话题抽取,通过计算相似度为不同时间窗口下的主题建立联系,挖掘热点话题及其演化规律。【结果/结论】 将本方法应用于2014 年度电商类新闻,得到的结果与同年度新华网经由人工评选出的电商热点新闻主题相比较, 证明本方法的准确性。  相似文献   

15.
[目的/意义]从微观视角把握研究前沿主题在基金项目、论文数据中的关联关系,有助于准确把握科学知识生长中的研究前沿活动机理,对于研究前沿、新兴趋势识别和多源科技文献融合等工作具有一定的实践指导意义。[方法/过程]首先,利用LDA模型进行基金、论文研究主题探测;然后,综合新兴度、关注度指标和战略坐标图进行初始研究前沿判别,在主题扩散演化滞后效应测度结果基础上进行滞后修正的研究前沿识别;最后,利用ARIMA模型和Word2Vec模型进行研究前沿主题趋势预测分析。[结果/结论]以美国纳米农业领域为例进行了实证研究。研究发现,基金和论文在外部数量和内部主题特征两个层面都显示出一定的滞后性。文章对纳米颗粒在农作物代谢过程中诱导应激机制、用于绿色可持续环境及农业应用的纳米气泡技术、农作物吸收不同剂量下纳米材料的反应与机制等7个研究前沿主题发展趋势进行了预测分析。  相似文献   

16.
赵霞 《情报科学》2023,(5):34-41
【目的/意义】数字阅读给人们的知识与信息获取带来了巨大的变化,识别数字阅读领域的研究热点及其主题演化路径,有助于对数字阅读领域建立起动态的全景化视野。【方法/过程】文章以数字阅读领域的高水平论文为基础数据源,基于关键词共现关系构建领域知识网络,通过高频次与高度值关键词识别领域研究热点,采用SLM社团发现算法和主题密度图跟踪分析领域的主题演化路径。【结果/结论】研究结果表明,数字阅读领域已具有相对稳定的知识体系架构;从数字出版到阅读推广再到问题消解,领域研究逐渐走向成熟;从关注阅读形式到关注阅读效果,领域研究进入内涵式发展道路。【创新/局限】研究工作主要聚焦于国内学术界具有代表性的高水平研究层次,未来的研究工作将纳入更广泛的数据来源,进行更加全面细致地研究。  相似文献   

17.
【目的/意义】大数据时代文本主题挖掘在情报分析领域中的作用日趋重要,通过特征比较共词分析和 LDA模型分析两种主流文本主题挖掘方法,研究两者的具体特点,为相关人员合理地运用文本主题挖掘方法处理 数据提供一定的参考。【方法/过程】本文分两种情况对比研究:第一、两者挖掘不同时段同一种类文本数据的主题 分布信息和主题演化信息的能力;第二、两者挖掘同一时段不同种类文本数据的提取正确主题的能力。【结果/结 论】在不同时段LDA模型分析与共词分析相比挖掘主题分布信息的能力可不断提升,并且其可挖掘出更加细化的 主题演化信息;在同一时段LDA模型分析对语义关系模糊逻辑结构粗糙的文本提取正确主题的效果明显优于共词 分析。  相似文献   

18.
王静茹  陈震 《情报科学》2018,36(1):102-107
【目的/意义】目前LDA模型在文本数据挖掘方法中占有重要的地位,已成为数据挖掘领域的研究热点。 为了进一步提高LDA模型在文本挖掘中的应用效果,有必要对LDA模型文本主题提取效果进行对比研究。【方法/ 过程】本文提出了一种基于LDA模型的不同类型文本数据主题提取效果对比评价方法,先通过LDA模型对文本数 据进行主题挖掘;再通过定量的主题提取效果评价方法进行对比研究。【结果/结论】本文以期刊论文、网络舆情事 件话题、微博文本、调查问卷为文本数据源,实验结果表明LDA模型在处理语义信息明确逻辑关系合理的长文本数 据时,主题提取效果较好。这为提高LDA模型的挖掘效率提供了一定的理论依据。  相似文献   

19.
【目的/意义】基于Rao-Stirling 指数和LDA模型进行领域学科交叉主题识别,并以纳米科技为例验证将 Rao-Stirling 指数和LDA模型用于领域学科交叉主题识别的有效性和适用性。【方法/过程】基于Rao-Stirling 指数 测度领域文献学科交叉程度,设定阈值发现高度学科交叉文献。基于LDA模型对筛选出的学科交叉文献进行主题 识别,发现学科交叉点和学科交叉研究主题。【结果/结论】基于Rao-Stirling 指数从引文的角度进行领域文献学科 交叉测度可以有效地发现与某领域相关的学科交叉文献,且有利于大数据集的学科交叉文献发现研究的实现。基 于LDA模型进行学科交叉主题识别可以有效地发现学科交叉主题。两方法的组合应用为发现某领域学科交叉主 题研究提供一种新视角。  相似文献   

20.
朱晓峰  葛锐  蒋勋 《情报科学》2022,39(1):109-120
【目的/意义】数字时代“开放政府数据”热潮产出了丰硕成果,对其研究主题结构和演化脉络进行全面、精 准的可视化揭示,有助于进一步丰富和完善该领域研究,科学地指导我国实践开展。【方法/过程】以 2000-2019 年 WOS数据库中“开放政府数据”主题文献为基础,借助新型SLM算法探测主题社区,梳理研究主题分布;同时嵌入 SNA方法,引入“传导率”指标定量评估主题社区成熟度和内外部关联,并利用Cortext平台构建时序演进过程。【结 果/结论】国外开放政府数据研究已形成四类主题社区:健康社区、开放数据社区、管理社区以及安全社区,目前仍 存在“主题遍布粒度不够细化、新兴主题社区亟需成长、演化脉络断续明显”等问题。【创新/局限】嵌入新型算法 SLM 划分主题社区,结合 LDA 模型对国外 OGD 研究主题关联与演化进行了完整阐释。但本文仅选取 WOS核心 库的相关主题文献作为数据源,存在进一步扩充的空间。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号