首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 312 毫秒
1.
[目的/意义]21世纪互联网技术的发展为学术研究提供了开放的交流平台,科研信息资源由此呈指数增长,学者难以从繁杂的信息中快捷获取所需信息,从而导致学术资源利用率低下。学术资源精准化、个性化推荐,成为了提高学术信息流转效率和实现价值增值的有效途径。[方法/过程]本文利用文献发表时间因子与文献语义相似度对异质信息网络进行加权,并基于此加权网络采用Node2vec进行有偏随机游走生成图节点序列,然后利用Skip-gram语言模型进行序列学习,最终计算节点向量的相似度以实现学术信息推荐。[结果/结论]以CNKI中的数据集为例对本文所提出的模型进行验证,实证结果表明,使用该模型推荐的论文与学者,一方面与目标学者的研究方向相符合;另一方面在时间维度上也较为精准,能够有效满足学者信息需求。  相似文献   

2.
【目的/意义】从引文内容视角探究引文网络的拓扑结构及其组成要素的知识属性与引文网络中知识流动 效应间的关系。【方法/过程】首先,在阐述引文内容视角下引文网络知识流动主要特征的基础上,从静态特征属性 和动态结构属性2个方面构建了知识流动的演化动力模型;然后,依据影响引文网络中知识流动效应的主要因素, 从知识吸收效应、知识叠加效应和知识成本效应3个方面构建了知识流动效应函数的数学模型;最后,借鉴描述知 识溢出效应的蜂巢模型及其修正模型提出了知识流动效应系数的计算方法。【结果/结论】运用Netlogo设置演化动 力模型的初始参数,并通过仿真实验剖析各因素对知识流动效应系数的影响机理。文中方法可为客观反映引文网 络中的知识流动规律与模式,并揭示引文网络中的知识流动效应提供一套可参考的实证模型。【创新/局限】本文通 过计算实验方法从理论上较为系统地分析了引文内容视角下引文网络的知识流动效应,得出了一系列结论,但并 未结合实际题录数据的计算结果进行对比和优化。  相似文献   

3.
[目的/意义]使用深度学习中Doc2vec文本向量化的方法进行专利与行业间类目相似度的计算,旨在为用计算机进行类目映射时提供新的方法和思路。[方法/过程]实验通过《国际专利分类表》的小类及其下级类目大组与《国民经济行业分类表》中的小类展开,通过Doc2vec文本向量化和余弦相似度的方法求取三组相似值(专利小类与行业小类、专利大组与行业小类、每组专利小类下大组与行业小类相似度的平均值),并以农业类目为例进行解释说明。[结果/结论]通过计算专利大组与行业小类相似度平均值的方法进行映射更具合理性。  相似文献   

4.
[目的/意义]为推进文献知识发现研究方法体系的形成和应用研究的广泛开展,梳理引文分析法与内容分析法结合的不同模式,可为后续研究提供参考。[方法/过程]在介绍引文分析、内容分析的基础上,提出两者结合的必要性;从引文分析法与内容分析法不同结合方式(组合、聚合与融合)的概念解析、研究结构、相关应用等方面,全面展示两种分析方法结合的基本概貌;并给出未来两种方法实现深度结合的研究趋势。[结果/结论]引文分析法与内容分析法结合实现文献知识发现的有效性已得到国内外学者的认可,目前已形成系统的方法体系,其方法理论可推广应用到多源信息融合实现知识发现的研究中去。  相似文献   

5.
[目的/意义]在学术论文中,引文内容句中的知识能够反映被引学科的知识在施引学科中的分布,跨学科知识流动研究能够揭示不同学科间的知识流动现象,促进学科交叉融合。[方法/过程]采用引文内容分析法,以PLoS平台的开放学术论文全文数据为例,选取其中的引文句为研究对象。自动抽取引文句中包含的知识(即术语),再结合学科以及位置信息,揭示跨学科知识流动现象。[结果/结论]跨学科知识在相似领域内流动较频繁,不同学科的术语在不同位置的流动差异明显。  相似文献   

6.
[目的/意义]技术路径识别能够得到表征技术发展的链接模式,挖掘技术方向及演变特征,对企业知悉技术路径发展有重要参考价值。[方法/过程]通过Web of Science和USPTO数据库对期刊文献和专利数据进行导出,利用Pajek软件分别构建期刊文献和专利引文网络;对引文网络进行社群划分,提取最大的社群网络进行主路径识别;对双源主路径节点文献构建文本相似性矩阵,利用文本相似性算法将前述路径进行融合与连接,全面揭示技术发展路径。[结果/结论]提出了一种基于期刊文献与专利双源引文网络和文本相似性分析的技术路径识别及融合方法,将该方法应用于无线充电技术领域,揭示了无线充电技术的发展主线,验证了所提方法的可行性与实用性,为相关企业明晰技术路径提供了科学的决策理论支持。  相似文献   

7.
[目的/意义]在提倡“文理交叉”的新文科建设背景下,识别跨学科潜在知识组合,并分析其合作方案的可行性,对于把握跨学科创新方向、推动学科转型与交叉融合具有重要意义。[方法/过程]基于多路径分析和全文知识提取,构建跨学科潜在知识组合合作潜力识别模型,从路径连通性、平衡性、有效潜在路径数三方面反映两知识的合作潜力,并以图书情报学“引文分析”领域为例,全文提取2016—2020年研究文献及其跨学科参考文献关键词进行实证分析。[结果/结论]实证表明,该模型能够通过多组已形成知识路径识别平衡性较好的跨学科潜在知识组合,并发现“引文网络—技术跨越”“相似度分析—激活函数”“聚类分析—扩散曲线”等识别结果具有理论合作可行性和实际应用价值。  相似文献   

8.
[目的/意义]提出了一种融合专利引文网络和SAO语义分析的技术演化路径识别及拓展方法,对企业精准高效开展技术创新活动意义重大。[方法/过程]首先,对专利数据进行时间窗口划分,利用Gephi软件构建专利引文网络;其次,运用Girvan-Newman算法对引文网络进行社群划分,对综合排序前三的社群通过SPC算法提取主路径;再次,对主路径所涉及专利进行SAO结构提取,经规范化处理后构建基于SAO结构的技术演化路径;最后,将最新科技文献及专利通过语义相似性计算链接至技术演化路径末端,进而克服引文的时滞性缺陷。[结果/结论]将该方法应用于全固态锂电池技术领域,揭示了全固态锂电池相关技术的演进热点、发展脉络及未来趋势,验证了所提方法的可行性与实用性,为相关企业明晰创新路径提供了科学的决策理论支持。  相似文献   

9.
[目的/意义]学术论文评价是科研评价的基础,是科研管理和评价的刚需。目前基于引文和论文内容视角构建的论文评价模型效果仍有提升的空间。[方法/过程]首先,利用复杂网络分析法,从文献相似性网络的节点属性构建论文重要性评价模型,探讨从文献网络的角度评价论文质量的可行性。其次,选择8个医学相关学科,下载数据形成8个文献数据集,根据论文被Faculty Opinions数据库收录的情况,事先标记为重要论文和普通论文。再次,从论文的主题词、题目摘要和参考文献3种信息源分别构建基于医学主题词表树状结构、Doc2Vec算法和文献耦合的3种文献相似性网络,并对每一种文献相似性网络,利用复杂网络分析方法对网络中的节点进行特征计算,选择具有统计学差异的节点属性指标作为区别两类论文的评价指标。最后,采用4种机器学习算法对数据集中的论文进行二分类学习,构建并评估论文重要性评价模型。[结果/结论]基于文献网络进行论文评价的方法是可行的,3种文献网络构建算法效果差异较小,语义相似性文献网络和文献耦合两种算法略优于基于Doc2Vec的算法。BP神经网络算法在基于文献网络构建的论文重要性评价模型中性能最好。  相似文献   

10.
[目的/意义]基于引文网络识别跨学科交流中承担中间人角色的跨学科知识,一方面有利于了解跨学科交流现状,另一方面为后续基于中间人识别跨学科相关知识、促进跨学科合作研究奠定基础。[方法/过程]基于中间人角色分类理论,提出跨学科知识交流的中间人角色分类;构建模型,识别目标学科在当前跨学科交流中各类当采跨学科中间人。[结果/结论]选择图书情报学领域影响力较大、跨学科程度较高的6种期刊数据为样本,研究发现:当采跨学科输入守门型中间人有语义相似度、条件随机场、国家安全、智库等;当采跨学科输出代理型中间人有KANO模型、特征分析、智慧图书馆、研究热点等;当采跨学科输入输出沟通型中间人有政策分析、区块链、信息安全、网络舆情等。  相似文献   

11.
[目的/意义] 在信息检索、科技论文评价和知识结构演化方面,引文分析都起着至关重要的作用。随着格式化全文数据库的出现,引文分析迈入了4.0时代——全文引文分析阶段。但是,目前还没有中文的格式化全文数据库,这极大地制约了全文引文分析在我国科技文献中的研究和应用。[方法/过程] 在本文中我们提出建立高效的中文全文引文分析依赖的数据集和检索平台的方法,主要包括:1)提出了基于规则和SVM分类方法的论文元数据和引用提取方法;2)提出基于Spark平台的实现高效引文内容分析标准化数据集生成方法;3)提出建立引用内容的科技文献检索平台。[结果/结论] 引文内容分析标准化数据集的建立将全面提升全文引文分析在我国科技领域中的研究效能,提高科技文献查找精度。  相似文献   

12.
【目的/意义】利用网络分析方法对融入引文内容的引文网络中的知识流动规律与模式展开系统研究,以期 为引文网络中的知识扩散、转化与创新提供理论与实证依据。【方法/过程】选取描述性统计量和网络分析指标,对 知识节点的知识流动能力及角色、知识群落的知识流动类型及结构、整体网络的知识流动分布特征及结构特征进 行深度刻画和剖析。【结果/结论】依据CNKI数据库主题期刊论文为测度数据,分别构建“智库”“数字人文”“数据治 理”三个主题的引文网络,并依据文中方法比较分析其间知识流动特征的异同。文中方法能够深入挖掘学术文献 间的知识关联,弥补过去引文网络知识流动研究中因忽略深层次引用信息而产生的缺陷。【创新/局限】本文采用多 种指标与方法对引文内容视角下引文网络知识流动规律与模式展开系统研究,但是未从整体引文网络中抽取反映 某一或某些知识属性的个体引文网络进行分析。  相似文献   

13.
[目的/意义]从方法论层面探索Altmetrics学科范式,推动其理论框架的进一步完善。[方法/过程]根据事件模型,分析引用事件和社交媒体事件的共性和差异,将引文分析方法移植到Altmetrics中,探讨并扩展Altmetrics分析方法及其应用思路,从而构建Altmetrics分析方法体系。[结果/结论]Altmetrics分析方法体系包括:社交媒体事件的特征分布分析、Altmetrics计数分析、文本分析、网络分析和自提及分析,这些方法能够支撑Altmetrics在学术评价中的有效应用,进一步提升领域成熟度。  相似文献   

14.
李叶叶  李贺  沈旺  曹阳  涂敏 《情报科学》2022,39(2):65-73
【目的/意义】随着网络购物的普及,在线评论成为影响消费者、销售者和生产者决策的重要数据。大数据 时代,在线评论呈现出多源异构、爆发式增长的特点,难以为用户的购买决策和商家竞争提供有力的情报支撑。【方 法/过程】本文利用多源异构的在线评论数据构建知识图谱,提出了一种基于多源异构数据构建知识图谱的框架, 模式层构建围绕在线评论的信源、内容以及形式构建,最终形成知识图谱的概念框架,并运用word2vec从多源异构 文本中获取实体、关系和属性,并进行数据融合与知识图谱分析。【结果/结论】实验部分以手机商品在线评论为例, 验证了本文所构建的知识图谱对在线评论相关研究及挖掘的有效性,研究结果揭示了多源异构在线评论数据的特 点,为大数据环境下在线评论信息组织、展示和挖掘提供了新的研究视角。【创新/局限】运用知识图谱对在线评论 进行描述,有效解决信息过载、多源异构信息融合等问题。本文采用半自动化的方式构建知识图谱,未来考虑引入 无监督的方法提高构建效率。  相似文献   

15.
胡玉宁  韩玺  朱学芳 《情报科学》2021,39(11):21-29
【 目的/意义】从文献实体的多特征数据融合的视角构建基于主题指纹-引文耦合的数据融合理论模型,并 对数据融合过程进行实证分析。【方法/过程】对融合主题指纹-引文的方法逻辑进行理论阐释和数学机理分析,以 乳腺小叶癌为案例呈现文献特征项的数据融合过程,通过主题指纹的类别归属与引文期刊所属JCR学科的对比发 现二者在揭示知识表征方面的功能特征。【结果/结论】融合主题指纹-引文的2-模知识网络能够发挥主题指纹和引 文共同揭示学科主题和知识结构的功能;引文信息表征了研究的学科基础、学科背景等稳定性知识结构信息,主题 指纹代表了学科研究前沿、突变主题、新兴趋势等动态性知识主题信息。【创新/局限】融合主题指纹-引文的理论模 型和分析方法是从数据融合层面将内容分析方法与引文分析方法进行结合的有效尝试,未来的研究将聚焦多模知 识网络构建、网络结构分析和量化测度研究,进一步提高该理论模型在知识服务领域应用的科学性、普适性。  相似文献   

16.
[目的/意义]技术集群因对属性相同的技术集聚进行研究,能够识别新技术,发现技术发展规律,提前感知市场技术变化,引起学者和企业管理者越来越高的关注。[方法/过程]以文本挖掘和复杂网络技术方法对专利文本数据进行分析,进而构建动态专利有向网络,并从网络中基于Python程序提取巨片,通过巨片拓扑性质分析核心技术集群的演化历程。[结果/结论]以美国电商数据处理技术为例的实证研究表明:通过构建动态有向网络,并从网络中提取巨片分析技术演化,能够有效的识别出美国电商数据处理技术中"数据设备技术、数据信息技术、数据系统技术、数据应用技术和数据融合技术"5个核心技术集群,并进一步发现核心技术集群之间很好的更新替换机制。实证研究证明了基于动态专利有向网络的核心技术集群演化分析方法的有效性。  相似文献   

17.
[目的/意义]技术轨道可以用于发现特定技术领域内连续性和非连续性的创新变化。[方法/过程]本文提出基于边链接影响力流的主路径搜索算法,该方法首先采用引文网络中影响力传递算法对引文网络路径的影响力流进行计量和赋值,然后通过主路径全局搜索算法得到影响力总和最大的技术主路径。[结果/结论]相比传统的主路径分析方法,该方法对于引文链接权值度量的描述更加明确合理。对海水淡化领域的实证表明,相比传统的主路径分析法,该方法能够在主路径中找到更早的起源节点,技术主路径的演化过程更加明晰。  相似文献   

18.
王仁武  孟现茹  孔琦 《现代情报》2018,38(10):57-64
[目的/意义]研究利用深度学习的循环神经网络GRU结合条件随机场CRF对标注的中文文本序列进行预测,来抽取在线评论文本中的实体-属性。[方法/过程]首先根据设计好的文本序列标注规范,对评论语料分词后进行实体及其属性的命名实体标注,得到单词序列、词性序列和标注序列;然后将单词序列、词性序列转为分布式词向量表示并用于GRU循环神经网络的输入;最后输出层采用条件随机场CRF,输出标签即是实体或属性。[结果/结论]实验结果表明,本文的方法将实体-属性抽取简化为命名实体标注,并利用深度学习的GRU捕获输入数据的上下文语义以及条件随机场CRF获取输出标签的前后关系,比传统的基于规则或一般的机器学习方法具有较大的应用优势。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号