首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 765 毫秒
1.
江秋菊 《情报科学》2019,37(6):96-100
【目的/意义】本文综合考虑文献的主题、被引频次和发文时间,从三维视角出发,提出一种文献影响力指数 (Influence Index of Document,IIOD)计算方法,在主题分类的基础上对文献的影响力进行评价。【方法/过程】以 中国引文数据库中2013-2017年情报学领域9本期刊的10523篇文献为样本,利用LDA模型进行主题提取,并将 LDA与K-means算法结合实现文本分类,进而计算特定主题下文献的影响力指数,根据文献影响力指数对文献进 行排名。【结果/结论】文献影响力指数综合考虑了文献的主题特征、被引频次和时效性,其排名结果更加全面合理, 为评价文献的影响力提供了一种新的视角。  相似文献   

2.
【目的/意义】基于Rao-Stirling 指数和LDA模型进行领域学科交叉主题识别,并以纳米科技为例验证将 Rao-Stirling 指数和LDA模型用于领域学科交叉主题识别的有效性和适用性。【方法/过程】基于Rao-Stirling 指数 测度领域文献学科交叉程度,设定阈值发现高度学科交叉文献。基于LDA模型对筛选出的学科交叉文献进行主题 识别,发现学科交叉点和学科交叉研究主题。【结果/结论】基于Rao-Stirling 指数从引文的角度进行领域文献学科 交叉测度可以有效地发现与某领域相关的学科交叉文献,且有利于大数据集的学科交叉文献发现研究的实现。基 于LDA模型进行学科交叉主题识别可以有效地发现学科交叉主题。两方法的组合应用为发现某领域学科交叉主 题研究提供一种新视角。  相似文献   

3.
刘运梅  张帅  王丹丹 《情报科学》2022,40(3):174-182
【目的/意义】在双一流学科建设背景下,本文基于学科研究主题分类模型、z指数评价模型,以国内图书情 报与档案管理领域 25 所一级学科点为例,建立了高校学科点的优势研究方向识别方法。【方法/过程】利用 Word2vec 模型结合 k-means 进行关键词聚类,将图情档学科划分为 12 个研究主题;其次,基于匹配的主题-学科 点-被引频次三维关系,建立25所学科点在12个研究主题下的300个评价数据集;最后,计算学科点在不同研究主 题中的zsi指数,并识别学科点的优势研究方向。【结果/结论】实验发现:z指数评价模型较好地实现了各机构发表论 文数量、质量、被引分布之间的平衡。其次,基于细粒度研究主题的学科点评价方法具有分类评价、多元化评价的 相对优势。【创新/局限】本文提出的评价模型可为不同科研群体提供一定的信息参考与决策支持,同时也为国内 高校学科评价提供了一个相对公平、个性化、多元化的评价视角;但该评价模型易受主题分类质量的影响。  相似文献   

4.
【目的/意义】构建主题-主题关联的学科知识网络,从主题之间语义关联角度度量主题在学科知识网络中 的影响力,分析学科知识结构演化规律,为热点、前沿主题探测提供方法支撑。【方法/过程】基于 LDA主题模型抽取 学科领域研究主题,利用主题在科学文献中的共现关系构建主题-主题关联的学科知识网络,并提出主题影响力概 念和度量方法;基于复杂网络结构分析方法对学科领域生命周期内主题-主题关联的学科知识网络进行演化分 析。【结果/结论】实证分析表明主题的网络影响力是主题强度、被学者关注度等外部特征指标的有力补充,可用来 探测热点、前沿主题。同时,学科知识结构随着学科领域的发展表现出较强的小世界网络特征。  相似文献   

5.
【目的】 研究z指数在期刊评价中的效果。【方法】 以SSCI收录的信息科学和图书馆学期刊为例,计算分析了目标数据的总发文数量、总被引频次、篇均被引频次、一致性指标η、h 指数、p指数和z指数,实证研究了z指数应用于期刊影响力的评价效果。【结果】 z指数相较于h指数以及p指数更加适合于综合评估期刊学术影响力的质量因素、数量因素和被引分布情况。【结论】 利用z指数评价期刊有助于激励期刊发表高水平论文,z指数具有较好的灵敏性和区分度。但z指数在期刊学术影响力评价中存在不能区分施引文献影响力大小等缺陷。  相似文献   

6.
【目的/意义】通过构建作者-主题关联的二模学科知识网络,度量作者在知识创新网络中的影响力,探寻 研究活跃程度高、研究范围广、潜在合作空间大的重要学者,对于科学评价学者学术影响力,挖掘热点、前沿研究主 题具有重要的指导作用。【方法/过程】基于AT主题模型抽取作者-主题关联矩阵,计算作者的研究主题强度,在此 基础上构建作者-主题关联的二模学科知识网络,利用作者在网络中的中心性指标度量作者主题关联影响力;基于 复杂网络结构分析方法对学科领域生命周期内作者-主题关联的学科知识网络进行演化分析。【结果/结论】实证分 析表明作者主题关联影响力与基于引文的学术影响力和基于社交媒体的社会影响力指标形成有力互补,可用于核 心作者以及热点、前沿主题探测。  相似文献   

7.
【目的/意义】随着互联网在社会中的影响力逐渐增大,面对网络群体性事件对社会生活的冲击,需把握网 络群体性事件的演化规律,确定事件类别,提炼事件特征,基于不同类别的网络群体性事件,提出有针对性的应对 措施。【方法/过程】通过LDA主题模型与K-means算法相结合,利用LDA模型实现文本潜在语义的识别,最终运用 SVM算法进行网络群体性事件聚类分析,得到五类网络群体性事件。【结果/结论】构建的网络群体性事件动态识别 模型,通过大量的文本训练,在事件聚类数为5时具有良好的解释性,完成了网络群体性事件的客观分类,分别为: 经济型、社会型、文化型、民族型和环境型,为政府分类应对策略提供依据。【创新/局限】利用 LDA主题模型和 Kmeans算法,减少了模型的迭代次数,确定最佳主题数,提高了网络群体性事件识别结果的准确性,但是运用慧科新 闻数据库搜集到的文本数据范围有限,且分类结果反应的事件特征具有一定局限性,后续研究可进一步扩大动态 文本数据库,对分类算法进行改进和深化。  相似文献   

8.
王静茹  陈震 《情报科学》2018,36(1):102-107
【目的/意义】目前LDA模型在文本数据挖掘方法中占有重要的地位,已成为数据挖掘领域的研究热点。 为了进一步提高LDA模型在文本挖掘中的应用效果,有必要对LDA模型文本主题提取效果进行对比研究。【方法/ 过程】本文提出了一种基于LDA模型的不同类型文本数据主题提取效果对比评价方法,先通过LDA模型对文本数 据进行主题挖掘;再通过定量的主题提取效果评价方法进行对比研究。【结果/结论】本文以期刊论文、网络舆情事 件话题、微博文本、调查问卷为文本数据源,实验结果表明LDA模型在处理语义信息明确逻辑关系合理的长文本数 据时,主题提取效果较好。这为提高LDA模型的挖掘效率提供了一定的理论依据。  相似文献   

9.
张雷  谭慧雯  张璇  韩龙 《情报科学》2022,40(3):144-151
【目的/意义】构建高校师德舆情微博用户评论LDA模型,可以更精准识别舆情演化特征和分析关键主题传 播路径,帮助高校和相关部门更为有效地进行舆情监管和舆情引导。【方法/过程】本文以“天津大学一教授学术造 假”事件为例,基于 LDA模型构建高校师德舆情下微博用户主题生成模型,采用困惑度评价指标确定 LDA模型最 优主题数,采用信息熵确定每一主题在不同日期的主题强度,通过关键词共现知识图谱、词云展现舆情话题的演 变,最后基于主题相似度确定主题传播路径。【结果/结论】LDA模型和信息熵可以解析出网络用户群体关注的重要 主题热点,精准识别舆情演化特征,识别主题最优传播路径进行舆论引导,对爆发的舆情实现预测和管制优化。【创 新/局限】文章创新性地构建高校学术道德舆情的LDA主题模型,有效确定微博用户群体主题、识别舆情演化特征、 分析主题间传播路径,具有普适性;进一步扩大高校师德其他舆情分析及结合网络舆情情感分析为下一步的研究 内容。  相似文献   

10.
商宪丽 《情报科学》2018,36(6):57-62
【目的/意义】本文剖析交叉学科的潜在主题识别,分析潜在主题的文献数量,揭示交叉学科的研究主题、构 成和热门研究主题。【方法/过程】以数字图书馆学科为实例,构建交叉学科集成数据集,经过数据集预处理、LDA主 题模型训练、潜在主题标签标注等处理过程,挖掘出交叉学科中的潜在主题及其构成,揭示交叉学科的热门研究主 题。【结果/结论】本文提出了一种基于潜在主题模型的交叉学科主题识别方法,该方法利用了交叉学科与相关基础 学科之间的内在关联,通过整合交叉学科研究文献与相关基础学科研究文献构建集成数据集,能够更为精确地识 别交叉学科的潜在主题和热门研究主题。  相似文献   

11.
【目的/意义】云计算的普及使得MI学科受到学术界的持续关注,对MI主题识别与演化的分析可以揭示历史演化,有助于发现人们关注的问题,预见该领域的未来发展。【方法/过程】本文利用潜狄利克雷分配(Latent Dirichlet Allocation, LDA)主题模型对web of science(WOS)数据库中与MI相关的主题进行识别和挖掘,并利用生命周期理论、变异系数法、Kullback-Leibler divergence(KL)等理论和方法绘制出MI研究主题的演化路径。【结果/结论】研究结果表明,MI的研究主题正逐渐向方法、技术和实践的研究方向发展,医疗数据分析、临床数据挖掘、健康信息技术等新兴技术和应用方向将成为未来MI学科的研究热点。【创新/局限】本文从生命周期视角对全球范围内医学信息学学科的主题演化进行挖掘和分析,为该学科未来的发展提供借鉴,但并没对各地区分别进行分析,因此存在一定的局限性。  相似文献   

12.
王晓慧  王康 《情报科学》2018,36(2):63-66
【目的/意义】量化学者学术影响力评价指标间的关系和相互联系的紧密程度,并综合评估选取最客观、公 正的评价指标,为评价学者学术影响力提供科学依据。【方法/过程】以CNKI期刊库为数据来源,以竞争情报为检 索词,统计该领域所有学者,并计算被引频次排名靠前的99 位学者的发文量、篇均被引频次、重要论文数、重要论文 被引频次、合作率、h 指数、g 指数、p 指数,利用SPSS22.0 分析各指标之间的关系。【结果/结论】运用不同的评价指标 评价学者学术影响力将得出不同的结论;各评价指标之间存在较多相关性;p 指数在众多指标中更具区分度、灵敏 度以及适用性和可靠性,是一个极具应用前景的评价指标。  相似文献   

13.
林丽丽  马秀峰 《情报科学》2019,37(12):87-92
【目的/意义】为了解近年来图书情报研究的热门主题及其演化趋势,利用LDA模型进行文本挖掘。【方法/ 过程】选取CNKI作为检索数据库,以2006年至2017年图书情报学领域10本核心期刊中的论文摘要作为研究数 据,借助开源工具JGibbLDA构建LDA模型,运用困惑度来确定模型主题数目,根据主题-词项分布文件进行主题 标识,根据文档-主题分布文件计算主题强度。【结果/结论】2006年至2017年图书情报学领域有20个研究主题,其 中比较热门的主题有7个; 8个主题的强度呈上升趋势, 9个主题的强度呈下降趋势, 3个主题的强度变化幅度较小。  相似文献   

14.
梁珊  邱明涛  马静 《情报科学》2017,35(7):44-49
【目的/意义】考虑到使用LDA模型进行主题抽取时,抽取到的特征词是无序的,破坏了原有的主谓宾结 构,导致抽取效果不准确,可读性差的缺陷,构造了WO词序模型,并将LDA模型与WO模型结合,提出了基于 LDA-WO混合模型的微博主题有序特征抽取算法。【方法/过程】使用LDA模型进行主题建模,获得无序特征词, 然后通过WO模型对特征词进行排序,将特征词与原语料进行对比,构造特征词-语料位置矩阵,通过对特征词的 位置排序,构造特征词词序权值矩阵,最终获得有序的特征词,完成对话题特征的有序抽取。【结果/结论】本文以真 实新浪微博数据为实验对象,实验结果表明基于LDA-WO模型的特征词提取方法进行特征抽取,抽取到的特征词 可读性更强,可弥补传统LDA模型在话题可解释性上的不足。  相似文献   

15.
熊文靓  付慧真 《情报科学》2021,39(11):117-126
【目的/意义】跨学科是当今科学发展的显著特征,以跨学科研究特征为主的跨学科性研究探索,不仅为厘 清跨学科研究主题提供重要线索,而且为跨学科研究管理和评价提供依据。【方法/过程】以跨学科性研究为研究对 象,借助Coherence Score与LDA相结合主题挖掘模型识别跨学科性研究的主要主题,并通过文献计量法从宏观和 微观层次探索跨学科性研究演化特征。【结果/结论】结果显示,对跨学科研究的跨学科性评估正处于快速发展期, 跨学科研究不仅来源于社会科学、生态学等学科跨界探索的内在驱动,也源于气候变化、生态环境脆弱性等复杂问 题的外在驱动;跨学科研究评价指标与方法复杂综合,融合大数据、人工智能等新技术是发展趋势;多种形式的跨 学科教育与科研合作是促进跨学科研究落实的根本。【创新/局限】多维剖析跨学科性研究热点与未来发展趋势,为 国家科技政策制定和科学研究者开展相关研究提供参考。  相似文献   

16.
【目的/意义】作者影响力是学术资源分配、学术人才引进、学术奖励分发的重要指标。为丰富作者影响力 的评价体系,本文提出评价作者影响力的新指标——Iw(Weighted Influence)指数。【方法/过程】在前人研究的基础 上,修正加权被引频次,综合论文数量、署名顺序、发文时间等参数构建 Iw指数。为检验 Iw指数的评估效果,选取 CNKI数据库“图书情报与数字图书馆”研究领域下发文量排名前 40位的作者,计算其 Iw指数,并与 h指数、hc指数 进行对比。【结果/结论】相比 h指数、hc指数,Iw指数对论文数量、署名顺序、加权最高被引频次等敏感度更高,对作 者影响力排名的区分效果更显著,评价结果更全面精细。  相似文献   

17.
潘晓  段鑫星 《情报科学》2021,39(7):131-135
【目的/意义】针对当前中小企业情报收集系统模型收集情报的准确性、信息检索查全率以及情报分类管理 效率较低的问题,提出基于LDA及模糊VIKOR法的中小企业情报收集系统模型构建。【方法/过程】根据LDA模型 设计并构建中小企业情报收集系统模型架构,通过企业管理架构采集知识资源,将获取的知识分别划分至管理架 构相应模块中,实现企业知识整合管理。根据模糊VIKOR法设计了中小企业情报分类步骤,引入贝叶斯统计的标 准法,获取最佳主题数量,采用Gibbs抽样算法得出分类隐含层主题集合概率整体分布的向量,实现中小企业情报 收集系统分类管理。【结果/结论】实验结果表明,该系统的准确性较高,能够有效提高情报分类管理效率以及信息 检索查全率。【创新/局限】本文采用LDA模型整合管理企业知识,结合模糊VIKOR法分类管理企业情报收集,构建 准确高效的系统模型,但本文构建的系统模型未应用于实际企业中进行反馈与完善。  相似文献   

18.
【目的/意义】随着LDA模型成为微博信息推荐的主要工具,众多的LDA演化模型的使用问题成为研究者 亟待解决地问题。【方法/过程】首先,从演化发展角度对LDA模型运行机理进行了解析,揭示了模型使用的先决条 件和算法内涵;其次,从不同需求的视角揭示了RB-LDA、RT-LDA、C-LDA、MB-LDA等扩展模型对LDA模型的 功能性补充;最后,提出LDA模型的技术演化方向。【结果/结论】结果表明可利用微型本体来提升语义性、利用多种 模型融合来提升精度、利用大数据来提升数据质量是LDA模型未来的演化方向,可使LDA模型信息推荐能力的更 具个性化和精准化。  相似文献   

19.
【目的/意义】学科领域的研究前沿是科学研究的重点。鉴于识别研究前沿中缺乏将用户需求信息和发文 趋势结合的现况,本文提出基于引文量与发文量,利用Z分数与Sen’ s斜率的研究前沿识别方法。【方法/过程】利用 LDA模型提取学科领域的研究主题,以Z分数代表研究主题的活跃度,Sen’ s斜率代表研究主题的发文趋势,以图书 馆学领域为例,分析其研究主题在2012-2017年的发文量与引文量,实现对该领域研究前沿的识别。【结果/结论】图 书馆学领域的前沿主题有图书馆网络化与自动化、阅读推广、公共文化事业、信息资源建设与知识管理等。通过与 Citespace突发检测法相比,证明本文提出的方法在识别学科领域研究前沿时更全面。  相似文献   

20.
朱光  潘高枝  李凤景 《情报科学》2022,40(4):127-137
【目的/意义】识别信息隐私研究领域的热点主题,梳理主题演化路径。【方法/过程】针对主题识别语义杂乱 等问题,提出时序关联与结构表征视角下的主题演化分析方法。首先利用LDA(Latent Dirichlet Allocation)模型识 别多时间窗口下的文献主题,进一步运用共词分析绘制语义更为独立的主题凝聚子群。在此基础上,从时序关联 维度计算相邻窗口下主题间的相似度,梳理演化路径;从结构表征维度,设计主题新颖度、中心性、影响力等计量指 标,探寻信息隐私前沿和热点主题的演化变迁。【结果/结论】实证分析结果表明,本文方法可以深度挖掘信息隐私 领域研究主题,从宏微观两个维度全面梳理主题的演化路径。研究有利于探测信息隐私研究的前沿。【创新/局限】 综合运用LDA主题模型与共词分析方法绘制主题凝聚子群,从时序演化和结构表征两个维度探寻主题演化路径。 未来研究中有待于引入多种数据源以对比主题差异,有待于引入多元组术语改善主题识别效果。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号