首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 31 毫秒
1.
李静  徐路路 《现代情报》2019,39(4):23-33
[目的/意义]细粒度分析学科领域热点主题发展脉络并对利用机器学习算法对未来发展趋势进行准确预测研究。[方法/过程]提出一种基于机器学习算法的研究热点趋势预测方法与分析框架,以基因工程领域为例利用主题概率模型识别WOS核心集中论文摘要数据研究热点主题并进行主题演化关联构建,然后选取BP神经网络、支持向量机及LSTM模型等3种典型机器学习算法进行预测分析,最后利用RE指标和精准度指标评价机器学习算法预测效果并对基因工程领域在医药卫生、农业食品等方面研究趋势进行分析。[结果/结论]实验表明基于LSTM模型对热点主题未来发展趋势预测准确度最高,支持向量机预测效果次之,BP神经网络预测效果较差且预测稳定性不足,同时结合专家咨询和文献调研表明本文方法可快速识别基因领域研究主题及发展趋势,可为我国学科领域大势研判和架构调整提供决策支持和参考。  相似文献   

2.
【 目的/意义】为探析研究前沿与发展趋向,突破现有跨学科科研协作研究在主题识别预测中的不足,本文提 出跨学科科研协作新兴主题识别及预测研究框架,实现新兴主题识别及未来发展趋势预测。【方法/过程】以时间切 片的形式对 SciTS 会议文本进行主题抽取,提出新兴主题测量指标,探测领域内新兴主题并构建新兴主题时间序 列;而后分别采取BP神经网络和SVR两种经典机器学习算法对新兴主题未来三年发展趋势进行预测分析。【结果/ 结论】根据历史数据对跨学科科研协作新兴主题进行识别及预测有较好的效果,在识别出的五个新兴主题中,跨学 科交流与对话、跨学科协作社区搭建、跨学科教育与培训等主题未来发展状态将趋热。【创新/局限】选取美国SciTS 会议文本为典型案例展开探索性分析,丰富当前跨学科科研协作研究内容的层次性和多样性。  相似文献   

3.
【目的/意义】对大数据知识领域的研究前沿及未来发展趋势进行预测。【方法/过程】利用引文网络结构变 换模型方法,通过 CiteSpace信息可视化软件工具,对下载于 Web of Science检索平台的大数据研究领域文献进行分 析,绘制文献共被引和引文结构变换知识图谱,分别从共被引文献和施引文献的视角,对大数据领域的研究前沿和 未来发展趋势进行预测。【结果/结论】预测出了对学科发展具有潜在影响力、交叉属性最强、对中心度影响最大的 文献以及相关研究主题。这种分析方法,避免了从施引文献或被引文献的单一角度分析知识领域研究前沿的不 足,对系统地分析知识领域的前沿,预测未来潜在变化趋势具有一定的参考价值。  相似文献   

4.
闫盛枫 《情报科学》2021,39(9):146-154
【目的/意义】探测特定领域政策文本语义主题,揭示我国政策部署领域与未来发展趋势。【方法/过程】提出 一种融合词向量语义增强和DTM模型的公共政策文本时序建模与可视化方法,采用DTM模型实现政策文本的时 序切割和主题建模,利用深度学习Word2vec算法中Skip-gram词嵌入技术可以对上下文词汇进行有效预测,增强 其语义表达性和政策解释性,以更为准确地揭示我国公共政策的部署重点。【结果/结论】实验表明本文提出的方法 对于公共政策主题识别和政策文本量化具有更好的知识抽取和语义表达能力,对我国公共政策挖掘和信息揭示具 有良好的揭示。【创新/局限】提出融合词向量语义增强和DTM模型的公共政策文本时序建模方法,一定程度上提 升了政策文本的主题语义表达,未来考虑利用深度学习技术如LSTM算法、BERT模型等识别政策中的领域知识单 元和语法结构。  相似文献   

5.
罗建  廖婷  史敏  蔡丽君  李维思 《情报科学》2021,39(12):98-104
【目的/意义】诸多知名企业由于没有意识到新兴技术的发展趋势,忽略了未来可能对自身造成威胁的潜在 竞争对手,最终陷入破产境地。目前缺乏从新兴技术视角开展的潜在竞争对手识别研究。【方法/过程】在文献调研 的基础上,对潜在竞争对手识别的内涵进行分析,并构建新兴技术视域下潜在竞争对手识别流程。识别流程涵盖 预处理专利数据、新兴技术识别和潜在竞争对手识别三个步骤,涉及LDA主题模型构建、新兴技术指标体系建立和 技术知识存量计算等关键问题。【结果/结论】以智能驾驶领域为例,证明了基于新兴技术开展潜在竞争对手识别具 有一定的可行性,期望本方法能够为领先企业识别潜在竞争对手提供决策支持。【创新/局限】创新性地将新兴技术 识别与潜在竞争对手识别相结合,丰富潜在竞争对手识别理论与方法。  相似文献   

6.
王山 《情报科学》2019,37(10):164-169
【目的/意义】研究前沿探测目的是及时并准确发现研究领域前沿知识,为领域研究工作者提供情报支持, 为企事业、政府等单位提供决策支持。【方法/过程】文章基于文献综述法对研究前沿相关概念、研究主题探测、研究 前沿主题特性与研究前沿主题探测进行了系统的梳理,分析了现有研究前沿主题探测方法的优缺点。【结果/结论】 本文总结了目前研究前沿探测相关研究的不足之处及未来可能的发展方向,以期对领域相关研究工作者提供支持 与帮助。  相似文献   

7.
郭勇  罗敏  幸芮 《情报科学》2023,41(2):95-100
【目的/意义】挖掘药物筛选工作中的隐性知识,借助机器学习的预测能力替代生物实验方法,减少制药流程的研发时间和经济成本。【方法/过程】提出一种面向知识发现的ADMET情报预测理论框架,以4种传统机器学习方法和2种集成学习方法,分别构建6种分类预测模型,提取药物的隐性知识,比较不同模型的优越性,评估最优模型的经济价值。【结果/结论】以药物分子描述符信息预测ADMET具有可行性,6种模型性能表现综合排序结果为随机森林、梯度提升决策树、Logistic回归、支持向量机、K近邻、高斯朴素贝叶斯。前沿信息技术能够有效应用于药物知识发现,信息经济学分析可预见创造可观收益,是未来制药工艺降本增效的重要手段。【创新/局限】未来应融合专家知识、追加试验验证、丰富参考指标。  相似文献   

8.
【目的/意义】数据挖掘是从庞大数据中挖掘出有潜在价值信息的信息处理技术,它包括神经网络、遗传算 法、粗糙集、支持向量机和决策树等多门技术,其中神经网络法具有良好的自学习和含联想储存功能,能够高速寻 找优化解,有效提高需求预测准确率。【方法/过程】本文利用BP神经网络具有的优异非线性逼近能力,以我国天然 气需求量预测为例,对需求量数据进行训练并采用L-M算法进行改进,最终提高对天然气需求量的预测精度。【结 果/结论】实验结果证明,利用数据挖掘中的BP神经网络非线性预测优势能准确捕捉天然气需求预测的变化趋势, 为精准预测需求提供了一种有效的工具。  相似文献   

9.
阿柔娜 《情报科学》2023,(5):153-160
【目的/意义】分析数据隐私风险的时序主题关联,理清热点主题的演化路径,探索有温度的数据隐私风险治理。【方法/过程】基于WOS核心合集和Scopus数据库收录的数据隐私风险领域相关文献,通过LDA主题模型将文本按照时间片切分,并识别各时间片的研究主题;再通过余弦相似度计算分析相邻时间片主题的时序关联,梳理主题演化路径并探索研究前沿。【结果/结论】数据隐私风险研究的关注点逐渐从对识别、评估和缓解数据隐私风险技术本身的关注,转向对平台、算法和场景整体性情境的关注,这需要通过数字伦理、法律和社会等方面共同助力形成负责任的技术,以期构建数字信任环境。【创新/局限】本研究对跨学科和跨领域的数据隐私风险研究的演化路径进行梳理,探索数据隐私风险治理的有效路径。未来可进一步细化不同时期的主题,并深入分析不同时间片的新兴技术对数据隐私风险的影响。  相似文献   

10.
【目的/意义】针对学术APP评论数据特征,挖掘用户评论语义关联关系,为平台运营者和开发者高效获取 用户需求和关注点提供思路和指导方法。【方法/过程】首先,基于LDA主题模型和GloVe 词向量模型构建学术APP 用户在线评论主题语义关联研究框架,然后,采集超星移动图书馆APP在线评论作为样本数据,通过主题识别获取 用户评论主题并基于词向量相似性得到主题语义关联,最后构建出语义关联主题图谱。【结果/结论】实验结果表明 运用文章提出的思路方法能够有效发现用户评论主题和主题间关联关系并得到主题关联图谱,从而为学术APP平 台运营者完善平台功能提供参考和借鉴。  相似文献   

11.
【目的/意义】学科领域的研究前沿是科学研究的重点。鉴于识别研究前沿中缺乏将用户需求信息和发文 趋势结合的现况,本文提出基于引文量与发文量,利用Z分数与Sen’ s斜率的研究前沿识别方法。【方法/过程】利用 LDA模型提取学科领域的研究主题,以Z分数代表研究主题的活跃度,Sen’ s斜率代表研究主题的发文趋势,以图书 馆学领域为例,分析其研究主题在2012-2017年的发文量与引文量,实现对该领域研究前沿的识别。【结果/结论】图 书馆学领域的前沿主题有图书馆网络化与自动化、阅读推广、公共文化事业、信息资源建设与知识管理等。通过与 Citespace突发检测法相比,证明本文提出的方法在识别学科领域研究前沿时更全面。  相似文献   

12.
朱光  潘高枝  李凤景 《情报科学》2022,40(4):127-137
【目的/意义】识别信息隐私研究领域的热点主题,梳理主题演化路径。【方法/过程】针对主题识别语义杂乱 等问题,提出时序关联与结构表征视角下的主题演化分析方法。首先利用LDA(Latent Dirichlet Allocation)模型识 别多时间窗口下的文献主题,进一步运用共词分析绘制语义更为独立的主题凝聚子群。在此基础上,从时序关联 维度计算相邻窗口下主题间的相似度,梳理演化路径;从结构表征维度,设计主题新颖度、中心性、影响力等计量指 标,探寻信息隐私前沿和热点主题的演化变迁。【结果/结论】实证分析结果表明,本文方法可以深度挖掘信息隐私 领域研究主题,从宏微观两个维度全面梳理主题的演化路径。研究有利于探测信息隐私研究的前沿。【创新/局限】 综合运用LDA主题模型与共词分析方法绘制主题凝聚子群,从时序演化和结构表征两个维度探寻主题演化路径。 未来研究中有待于引入多种数据源以对比主题差异,有待于引入多元组术语改善主题识别效果。  相似文献   

13.
【目的/意义】云计算的普及使得MI学科受到学术界的持续关注,对MI主题识别与演化的分析可以揭示历史演化,有助于发现人们关注的问题,预见该领域的未来发展。【方法/过程】本文利用潜狄利克雷分配(Latent Dirichlet Allocation, LDA)主题模型对web of science(WOS)数据库中与MI相关的主题进行识别和挖掘,并利用生命周期理论、变异系数法、Kullback-Leibler divergence(KL)等理论和方法绘制出MI研究主题的演化路径。【结果/结论】研究结果表明,MI的研究主题正逐渐向方法、技术和实践的研究方向发展,医疗数据分析、临床数据挖掘、健康信息技术等新兴技术和应用方向将成为未来MI学科的研究热点。【创新/局限】本文从生命周期视角对全球范围内医学信息学学科的主题演化进行挖掘和分析,为该学科未来的发展提供借鉴,但并没对各地区分别进行分析,因此存在一定的局限性。  相似文献   

14.
胡泽文  周西姬  任萍 《情报科学》2022,39(2):183-192
【目的/意义】高价值专利识别与培育是我国知识产权强国建设的重要环节,全面解读领域研究概况与进展 能够为科研和从业人员提供借鉴。【方法/过程】综合运用扎根理论和 NVivo 分析工具,通过领域主题的程序化编 码,识别出高价值专利评估与识别研究的重要主题,并从时间维度进行分析和综述。【结果/结论】专利质量与专利 价值是一对相互交融的概念,高价值专利可以从经济价值、市场价值、战略价值和法律价值等维度来衡量;高价值 专利评估数据主要来源于专利案例、专利数据库和专利行业数据;专利价值评估与识别研究主要涵盖三大主题:专 利价值的市场评估分析、专利价值影响因素及作用机理、专利价值评估指标组合与模型构建。【创新/局限】扎根理 论能够系统梳理领域的重要研究主题和进展,未来可以通过科学知识图谱动态展示领域科研合作态势、研究热点 与前沿,以及从实践的角度分析高价值专利评估与识别的典型案例。  相似文献   

15.
李一帆  王玙 《情报科学》2022,40(6):115-123
【目的/意义】随着学科交叉与学科融合的不断深入,科研工作越来越需要多个学者合作完成。识别潜在的 合作关系,为学者推荐适合的合作对象,能有效提高科研效率。【方法/过程】基于动态网络表示学习模型对学者合 作关系预测展开研究。首先,提出一种动态网络表示学习模型 DynNE_Atten。其次,根据图书情报领域的文献数 据构建动态科研合作网络和动态关键词共现网络,使用 DynNE_Atten 模型得到作者向量表示和关键词向量表示, 同时提取作者单位特征。最后,融合作者合作、主题与单位特征,预测未来可能产生的合作。【结果/结论】实验结果 表明,本文提出的动态网络表示学习模型在时序链路预测任务中只需要较少的输入数据,就能达到较高的准确性; 相比于未融合特征的学者表示,融合模型在合作关系预测中展现出明显的优势。【创新/局限】提出了一种新的动态 网络表示学习模型,并融合主题特征和作者单位特征进行科研合作预测,取得了较好的结果。目前模型在特征融 合的方式上只考虑了数据层面的异构,并未考虑网络层面的异构。  相似文献   

16.
[目的/意义]从微观视角把握研究前沿主题在基金项目、论文数据中的关联关系,有助于准确把握科学知识生长中的研究前沿活动机理,对于研究前沿、新兴趋势识别和多源科技文献融合等工作具有一定的实践指导意义。[方法/过程]首先,利用LDA模型进行基金、论文研究主题探测;然后,综合新兴度、关注度指标和战略坐标图进行初始研究前沿判别,在主题扩散演化滞后效应测度结果基础上进行滞后修正的研究前沿识别;最后,利用ARIMA模型和Word2Vec模型进行研究前沿主题趋势预测分析。[结果/结论]以美国纳米农业领域为例进行了实证研究。研究发现,基金和论文在外部数量和内部主题特征两个层面都显示出一定的滞后性。文章对纳米颗粒在农作物代谢过程中诱导应激机制、用于绿色可持续环境及农业应用的纳米气泡技术、农作物吸收不同剂量下纳米材料的反应与机制等7个研究前沿主题发展趋势进行了预测分析。  相似文献   

17.
【目的/意义】为揭示中外图书情报领域对大数据研究的现状和发展趋势,挖掘研究热点主题及其演化过 程。【方法/过程】文章统计分析了近十年图情领域大数据研究的论文发文数量、核心机构和核心作者等指标,采用 文本数据挖掘的方法识别出不同领域时期的研究热点主题,并分析了随时间的推移研究主题的演变情况。此外, 论文还对比分析了中外图情领域研究主题的相关性和差异性,展现出中外图情领域对大数据研究的联系和区别。 【结果/结论】随着时间的发展,中外大数据研究主题趋于相似。大数据研究主题的趋势向着研究主题多元化,结构 层次鲜明化的方向发展,在未来几年将会有更多新颖的研究主题产生。  相似文献   

18.
孙靖超  刘为军 《情报科学》2021,39(7):147-152
【目的/意义】舆情主题识别一直是舆情领域的研究热点,如今已有丰富的研究成果。现有研究对舆情信息 进行表征时多采用了传统的词袋模型、主题模型或词向量模型,只能对词语进行唯一的向量表征且传统模型需对 文本分词,可能会因分词错误、数据稀疏、出现集外词等情况影响识别效果。【方法/过程】本文构建了一种基于多采 样双向编码表示的网络舆情主题识别模型,在训练前无需对文本进行分词,针对文本过长的情况采用头尾结合的 方式进行截断,从字、段、位置三个维度提取特征嵌入,通过自注意力机制进行舆情表征,在训练过程中使用区分性 微调和多采样dropout的方法增强泛化能力,提升识别效果。【结果/结论】实验结果表明构建模型在舆情主题分类任 务中表现良好,可以在不对文本分词的情况下实现对舆情主题的准确识别。【创新/局限】创新之处在于构建了一种 新型的网络主题识别模型,局限之处在于算法复杂,如何进一步调参优化是接下来的研究重点。  相似文献   

19.
田亚丹 《情报科学》2021,39(6):123-133
【目的/意义】针对现有主题演化方法难以满足预测目的的需求,本文从知识动态发展的角度出发,构建知 识主题演化预测模型,为探究科学领域发展脉络与研究趋势提供方法。【方法/过程】通过Lda模型抽取知识主题,利 用马尔可夫和隐马尔可夫构建主题稳态与主题热度的演化预测模型。【结果/结论】以云计算领域的科学文献作为 实证分析对象,结果表明本模型可以根据历史数据来预测知识主题稳态分布情况与未来热度趋势,且在热度预测 精度上较灰色模型更高。【创新/局限】本文只考虑了横向主题内部的热度高低变化,没有进行纵向维度上各知识主 题间的对比。  相似文献   

20.
李欣颖  徐恺英 《情报科学》2022,40(6):185-193
【目的/意义】通过对近 5年我国信息行为研究动态及发展趋势进行分析,掌握国内研究前沿及发展方向。 【方法/过程】运用文献分析和CiteSpace软件,对近5年我国信息行为研究动态及未来研究趋势进行分析。【结果/结 论】总结出医疗健康情境、生活情境、工作情境及社交媒体情境四个情境下的研究热点;归纳出扩充及细化研究群 体、注重研究理论与模型、注重研究方法、关注医疗健康领域及关注社交媒体的应用 5个未来研究趋势。【创新/局 限】未来将对国外信息行为研究动态及发展趋势进行研究,并与国内进行对比。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号