首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 193 毫秒
1.
【目的/意义】基于文献数据的领域知识图谱构建有助于探测某学科领域的主要研究内容及其发展方向,是 进行技术创新的基础情报工作,对于研究人员、企业都具有一定的意义。【方法/过程】提出基于交互式可视化技术 的知识图谱构建方法,首先基于经典LDA模型进行主题识别,然后基于社会网络分析方法构建领域主题网络识别 关键主题词;最后,基于JS(D3 工具)绘制可交互的关键主题词关联与检索知识图谱,发现关键主题词的隐含联系, 辅助进行领域知识挖掘与分析。【结果/结论】通过对我国医疗健康信息领域进行实证研究,验证了本文提出方法的 准确性和有效性。  相似文献   

2.
[目的/意义]基于文献计量学和文本挖掘方法探索与某领域相关的学科交叉知识图谱的新思路。[方法/过程]提出可视化学科多样性测度指数和主题模型的领域学科交叉知识图谱研究框架,基于Science Overlay Map和嵌入领域本体的LDAvis进行领域学科交叉知识图谱的构建,并以纳米科技领域为例,验证学科交叉知识图谱研究框架的有效性和适用性。[结果/结论]基于Science Overlay Map的领域学科交叉科学地图,从全学科的角度展示纳米科技领域与其他学科的交叉情况,基于LDAvis结合领域本体的学科交叉主题交互图则聚焦具体的学科交叉主题和主题之间的相互关系,二者的结合可以从宏观和微观上更清晰地把握纳米科技领域与其他学科的交叉情况。本研究可以弥补学科交叉主题识别结果不容易被解释的局限性,为领域学科交叉知识图谱研究提供了一种解决方案的新视角。  相似文献   

3.
张雷  谭慧雯  张璇  韩龙 《情报科学》2022,40(3):144-151
【目的/意义】构建高校师德舆情微博用户评论LDA模型,可以更精准识别舆情演化特征和分析关键主题传 播路径,帮助高校和相关部门更为有效地进行舆情监管和舆情引导。【方法/过程】本文以“天津大学一教授学术造 假”事件为例,基于 LDA模型构建高校师德舆情下微博用户主题生成模型,采用困惑度评价指标确定 LDA模型最 优主题数,采用信息熵确定每一主题在不同日期的主题强度,通过关键词共现知识图谱、词云展现舆情话题的演 变,最后基于主题相似度确定主题传播路径。【结果/结论】LDA模型和信息熵可以解析出网络用户群体关注的重要 主题热点,精准识别舆情演化特征,识别主题最优传播路径进行舆论引导,对爆发的舆情实现预测和管制优化。【创 新/局限】文章创新性地构建高校学术道德舆情的LDA主题模型,有效确定微博用户群体主题、识别舆情演化特征、 分析主题间传播路径,具有普适性;进一步扩大高校师德其他舆情分析及结合网络舆情情感分析为下一步的研究 内容。  相似文献   

4.
商宪丽 《情报科学》2018,36(6):57-62
【目的/意义】本文剖析交叉学科的潜在主题识别,分析潜在主题的文献数量,揭示交叉学科的研究主题、构 成和热门研究主题。【方法/过程】以数字图书馆学科为实例,构建交叉学科集成数据集,经过数据集预处理、LDA主 题模型训练、潜在主题标签标注等处理过程,挖掘出交叉学科中的潜在主题及其构成,揭示交叉学科的热门研究主 题。【结果/结论】本文提出了一种基于潜在主题模型的交叉学科主题识别方法,该方法利用了交叉学科与相关基础 学科之间的内在关联,通过整合交叉学科研究文献与相关基础学科研究文献构建集成数据集,能够更为精确地识 别交叉学科的潜在主题和热门研究主题。  相似文献   

5.
王璐  马峥  潘云涛 《情报科学》2019,37(4):17-21
【目的/意义】学科交叉研究是学科建设情报分析中的重要领域。对学科交叉的测度可以客观反映学术实 体的学科交叉现状,为学科建设提供参考和借鉴。【方法/过程】在综述国内外现有学科交叉评价方法的基础上,提 出一种基于论文产出的从学科交叉规模和学科交叉难度两个方面来协同度量学科交叉情况的测度方法。该方法 首先基于学科分类体系构建学科树,然后根据论文所属学科分类来计算学科交叉规模和学科交叉难度,提出交叉 指数算法和TOP-K学科组合算法来表征学术实体学科交叉情况。【结果/结论】选取国家和高校两类学术实体对本 文方法进行实证检验,证明了本文所提出方法的实用性。同时通过算法性能分析,证明了本文提出方法的高效性。  相似文献   

6.
【目的/意义】构建主题-主题关联的学科知识网络,从主题之间语义关联角度度量主题在学科知识网络中 的影响力,分析学科知识结构演化规律,为热点、前沿主题探测提供方法支撑。【方法/过程】基于 LDA主题模型抽取 学科领域研究主题,利用主题在科学文献中的共现关系构建主题-主题关联的学科知识网络,并提出主题影响力概 念和度量方法;基于复杂网络结构分析方法对学科领域生命周期内主题-主题关联的学科知识网络进行演化分 析。【结果/结论】实证分析表明主题的网络影响力是主题强度、被学者关注度等外部特征指标的有力补充,可用来 探测热点、前沿主题。同时,学科知识结构随着学科领域的发展表现出较强的小世界网络特征。  相似文献   

7.
【目的/意义】探析一个学科领域中学术文献的研究内容与研究方法之间的潜在关系,对科学研究和科研 管理均具有一定的指导意义。为此,本文给出一种“内容-方法”共现分析方法。【方法/过程】选取Web of Science数 据库中国际著名的17 种情报学期刊文献共12082 篇,利用LDA模型提取文献主题;通过人工识别对提取的主题分 别标注为研究内容和研究方法;通过自编程序,建立学术文献研究内容与研究方法的共现关系;最后通过2-模网络 实现共现关系的可视化。【结果/结论】研究结果表明,“内容-方法”共现分析不仅能够从内容和方法两个视角了解 学科领域的研究态势,而且能够发现学科领域研究内容与研究方法之间的潜在关系。  相似文献   

8.
高楠  高嘉骐  陈洪璞 《情报科学》2023,(3):127-135+172
【目的/意义】通过综合使用论文和专利数据源,开展新兴技术的识别与演化路径方法研究,期望以此提高学科领域新兴技术探测研究的准确性和科学性。【方法/过程】首先,针对集成电路这一特定领域使用Word2Vec语义相似度与字符串相似度相结合的方法构建词袋,并利用LDA主题模型发现并识别集成电路领域隐含的技术主题,构建新颖度、强度和热度等多维指标对新兴技术进行对比和甄别。其次,划分时间窗,采用余弦相似度算法计算相邻时间窗内主题间的相似性,以可视化路径的形式将筛选结果进行呈现,以此判断主题演化关系类型。【结果/结论】研究发现,集成电路领域呈现学界与业界研究成果相互促进的良好态势,结合论文与专利数据的新兴技术识别方法,可以有效且清晰的发现集成电路研究领域的热点型、增长型、成熟型和潜在型技术主题,并通过新兴技术演化路径的构建,揭示了领域科学与技术间知识的交互与转移。【创新/局限】本研究创新性采用Word2Vec语义相似度与字符串相似度相结合的方法构建词袋,提高了词袋构建质量,为后续基于LDA主题模型识别隐含的技术主题奠定了基础,但在数据源的多样性、时滞性问题,以及模型阈值设置的客观性上还存在局限性,需要...  相似文献   

9.
罗建  蔡丽君  史敏 《情报科学》2019,37(12):57-62
【目的/意义】基于专利的两阶段新兴技术识别方法能够帮助企业更精准的发现和识别具有变革潜力的新 兴技术,有利于企业洞察研发趋势,在竞争中抢占先机。【方法/过程】以图像识别领域为例,采用两阶段方法识别新 兴技术,第一阶段采用LDA对专利说明书全文构建主题聚类模型,以确定图像识别领域的各项子技术领域;第二阶 段采用新兴技术识别指标体系评判各子技术领域综合表现,最终识别出图像领域的新兴技术。【结果/结论】实验成 功识别出新型光波导纤维材料和计算机存储媒介两项新兴技术,实验结果与业界分析保持一致,说明两阶段新兴 技术识别方法能有效地对专利文献开展新兴技术识别。  相似文献   

10.
【目的/意义】学科领域的研究前沿是科学研究的重点。鉴于识别研究前沿中缺乏将用户需求信息和发文 趋势结合的现况,本文提出基于引文量与发文量,利用Z分数与Sen’ s斜率的研究前沿识别方法。【方法/过程】利用 LDA模型提取学科领域的研究主题,以Z分数代表研究主题的活跃度,Sen’ s斜率代表研究主题的发文趋势,以图书 馆学领域为例,分析其研究主题在2012-2017年的发文量与引文量,实现对该领域研究前沿的识别。【结果/结论】图 书馆学领域的前沿主题有图书馆网络化与自动化、阅读推广、公共文化事业、信息资源建设与知识管理等。通过与 Citespace突发检测法相比,证明本文提出的方法在识别学科领域研究前沿时更全面。  相似文献   

11.
江秋菊 《情报科学》2019,37(6):96-100
【目的/意义】本文综合考虑文献的主题、被引频次和发文时间,从三维视角出发,提出一种文献影响力指数 (Influence Index of Document,IIOD)计算方法,在主题分类的基础上对文献的影响力进行评价。【方法/过程】以 中国引文数据库中2013-2017年情报学领域9本期刊的10523篇文献为样本,利用LDA模型进行主题提取,并将 LDA与K-means算法结合实现文本分类,进而计算特定主题下文献的影响力指数,根据文献影响力指数对文献进 行排名。【结果/结论】文献影响力指数综合考虑了文献的主题特征、被引频次和时效性,其排名结果更加全面合理, 为评价文献的影响力提供了一种新的视角。  相似文献   

12.
【目的/意义】云计算的普及使得MI学科受到学术界的持续关注,对MI主题识别与演化的分析可以揭示历史演化,有助于发现人们关注的问题,预见该领域的未来发展。【方法/过程】本文利用潜狄利克雷分配(Latent Dirichlet Allocation, LDA)主题模型对web of science(WOS)数据库中与MI相关的主题进行识别和挖掘,并利用生命周期理论、变异系数法、Kullback-Leibler divergence(KL)等理论和方法绘制出MI研究主题的演化路径。【结果/结论】研究结果表明,MI的研究主题正逐渐向方法、技术和实践的研究方向发展,医疗数据分析、临床数据挖掘、健康信息技术等新兴技术和应用方向将成为未来MI学科的研究热点。【创新/局限】本文从生命周期视角对全球范围内医学信息学学科的主题演化进行挖掘和分析,为该学科未来的发展提供借鉴,但并没对各地区分别进行分析,因此存在一定的局限性。  相似文献   

13.
【目的/意义】为了解决新近发表文献大多零被引、被引多是自引的问题,本文基于论文所在期刊的复合影 响因子,对 p 指数改进,提出 pi 指数计算方法,用以合理有效地进行人才评价。【方法/过程】以图书情报学领域 2015—2016年的发文情况为例,运用 pi指数识别近两年该学科的主要贡献者,并分析 pi指数与 p指数、h指数的评 价效果;以图书情报学三位不同年龄段和不同发文情况的优秀学者为例,分析 pi指数对中高龄学者与年轻学者的 评价效果。【结果/结论】研究发现 pi指数在评价新近发表文献时,较 h指数、p指数表现出更好的评价效果,可用于 识别近期某研究领域的主要贡献者;另外 pi指数对优秀青年人才具有较好的识别能力,可作为一个较公平和客观 的人才评价指标。  相似文献   

14.
李亚婷 《情报科学》2017,35(11):156-160
【目的/意义】为了更清晰地展示国内外图书情报学的学科交叉研究的全貌,进而促进学科间的良好互动。 【方法/过程】本文通过对相关文献的梳理,从学科交叉的影响分析、程度测度和内容挖掘三个方面进行研究分析。 【结果/结论】学科交叉的影响不仅在于提升学科的研究质量,也对工作者提出了与时俱进的要求;学科交叉的程度 测度研究最为丰富,基于多种多样的数据集、通过多样性和聚合性两方面的指标展开了大量的实证研究,可见图书 情报学的交叉性已得到广泛的认可;学科交叉的内容挖掘从微观层面对学科间具体的联系进行了分析,发现图书 情报学与计算机的交叉最为紧密,与其他学科的联系也逐渐加强。  相似文献   

15.
朱光  潘高枝  李凤景 《情报科学》2022,40(4):127-137
【目的/意义】识别信息隐私研究领域的热点主题,梳理主题演化路径。【方法/过程】针对主题识别语义杂乱 等问题,提出时序关联与结构表征视角下的主题演化分析方法。首先利用LDA(Latent Dirichlet Allocation)模型识 别多时间窗口下的文献主题,进一步运用共词分析绘制语义更为独立的主题凝聚子群。在此基础上,从时序关联 维度计算相邻窗口下主题间的相似度,梳理演化路径;从结构表征维度,设计主题新颖度、中心性、影响力等计量指 标,探寻信息隐私前沿和热点主题的演化变迁。【结果/结论】实证分析结果表明,本文方法可以深度挖掘信息隐私 领域研究主题,从宏微观两个维度全面梳理主题的演化路径。研究有利于探测信息隐私研究的前沿。【创新/局限】 综合运用LDA主题模型与共词分析方法绘制主题凝聚子群,从时序演化和结构表征两个维度探寻主题演化路径。 未来研究中有待于引入多种数据源以对比主题差异,有待于引入多元组术语改善主题识别效果。  相似文献   

16.
王静茹  陈震 《情报科学》2018,36(1):102-107
【目的/意义】目前LDA模型在文本数据挖掘方法中占有重要的地位,已成为数据挖掘领域的研究热点。 为了进一步提高LDA模型在文本挖掘中的应用效果,有必要对LDA模型文本主题提取效果进行对比研究。【方法/ 过程】本文提出了一种基于LDA模型的不同类型文本数据主题提取效果对比评价方法,先通过LDA模型对文本数 据进行主题挖掘;再通过定量的主题提取效果评价方法进行对比研究。【结果/结论】本文以期刊论文、网络舆情事 件话题、微博文本、调查问卷为文本数据源,实验结果表明LDA模型在处理语义信息明确逻辑关系合理的长文本数 据时,主题提取效果较好。这为提高LDA模型的挖掘效率提供了一定的理论依据。  相似文献   

17.
【目的/意义】学者影响力评价是国内外研究的热点,本研究在学者影响力评价指标h指数与z指数中加入 “主题”维度弥补过往研究的不足。【方法/过程】以核物理学科为例检验模型的有效性,利用网络爬虫在中国知网抓 取文献共计11419条。经数据预处理后,首先,利用LDA模型对文献分类,得到我国核物理学科的八个研究主题: 核反应研究、放射性衰变与新元素合成、核物理应用研究、核物理计算、核反应实验装置设计、核数据测量方法与数 据库建设评价、核结构研究与核天体物理研究。其次,利用ATM模型对学者分类。最后,利用上述分类结果分别 计算学者的hk指数与zk指数,并将结果与h指数和z指数比较。【方法/过程】经过相关性检验,研究结果与h指数和 z指数有较高一致性。因此,利用LDA模型和ATM模型融合学者影响力评价指数h指数和z指数可以更加科学地 评估学者的影响力,弥补了全学科评价指标的缺陷。  相似文献   

18.
【目的/意义】本文通过论文和专利两个层面的机构合作网络探测产学研的潜在合作机会。【方法/过程】利 用石墨烯相关领域产学研合作论文和专利的相关文献,通过社会网络分析探究整体网络的相关指标,同时测度网 络中的重要节点;进一步使用LDA主题模型分析论文层及专利层的热点主题与主要研究热点主题的机构。为探测 潜在合作情况,利用链路预测和熵权法测度未来机构间的合作关系及合作主题。【结果/结论】研究发现论文层与专 利层的中心节点分别是中国科学院和法国国家科学研究中心;论文层中国船舶重工集团和洛斯阿拉莫斯国家实验 室会在石墨烯结构主题研究上产生合作,专利层南京航空航天大学和中国科学院上海光学精密机械研究所潜在合 作主题为石墨烯制备。  相似文献   

19.
刘运梅  张帅  王丹丹 《情报科学》2022,40(3):174-182
【目的/意义】在双一流学科建设背景下,本文基于学科研究主题分类模型、z指数评价模型,以国内图书情 报与档案管理领域 25 所一级学科点为例,建立了高校学科点的优势研究方向识别方法。【方法/过程】利用 Word2vec 模型结合 k-means 进行关键词聚类,将图情档学科划分为 12 个研究主题;其次,基于匹配的主题-学科 点-被引频次三维关系,建立25所学科点在12个研究主题下的300个评价数据集;最后,计算学科点在不同研究主 题中的zsi指数,并识别学科点的优势研究方向。【结果/结论】实验发现:z指数评价模型较好地实现了各机构发表论 文数量、质量、被引分布之间的平衡。其次,基于细粒度研究主题的学科点评价方法具有分类评价、多元化评价的 相对优势。【创新/局限】本文提出的评价模型可为不同科研群体提供一定的信息参考与决策支持,同时也为国内 高校学科评价提供了一个相对公平、个性化、多元化的评价视角;但该评价模型易受主题分类质量的影响。  相似文献   

20.
张瑞  董庆兴 《情报科学》2020,38(6):67-75
【目的/意义】知识流动模式能够动态反映知识形态在知识流动中发生的变化,体现学科系统中不同知识体 系的发展规律,因此从科学文献角度出发研究知识流动模式的发现具有重要意义。【方法/过程】以图书情报学领域 为例,设计一种组合方法,首先采用LDA(latent Dirichlet allocation,隐狄里克雷分布)主题模型进行领域内文献的主 题聚类,然后提取引用和被引用数据构成主题知识流入、流出特征,并作为HMM(Hidden Markov Model,隐马尔可 夫模型)训练模型的观测值序列,识别不同的隐藏状态,进一步对模型的拟合效果进行评估,最后通过聚类分析将 隐藏状态序列与知识流动模式一一对应,揭示图书情报学领域存在不同知识流动模式的差异性。【结果/结论】实验 结果显示,不同类型的知识流动模式具有不同的表现形式,反映了领域内部主题研究的演变历程,为理解和认识科 学发展趋势具有一定价值。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号