首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到17条相似文献,搜索用时 129 毫秒
1.
[目的/意义]21世纪互联网技术的发展为学术研究提供了开放的交流平台,科研信息资源由此呈指数增长,学者难以从繁杂的信息中快捷获取所需信息,从而导致学术资源利用率低下。学术资源精准化、个性化推荐,成为了提高学术信息流转效率和实现价值增值的有效途径。[方法/过程]本文利用文献发表时间因子与文献语义相似度对异质信息网络进行加权,并基于此加权网络采用Node2vec进行有偏随机游走生成图节点序列,然后利用Skip-gram语言模型进行序列学习,最终计算节点向量的相似度以实现学术信息推荐。[结果/结论]以CNKI中的数据集为例对本文所提出的模型进行验证,实证结果表明,使用该模型推荐的论文与学者,一方面与目标学者的研究方向相符合;另一方面在时间维度上也较为精准,能够有效满足学者信息需求。  相似文献   

2.
[目的/意义]关键词是反映期刊研究主题、研究方法和数据源等信息的重要途径。本文尝试通过论文关键词来研究学术期刊的相似度,为期刊分类等学术研究和实际工作提供参考。[方法/过程]首先,在相关文献梳理的基础上,提出了基于论文关键词的两种期刊相似度计算方法。然后,以《中国图书馆学报》和《情报学报》为实证对象,从CSSCI采集了两种期刊1998-2017年的关键词数据。最后,计算了两种期刊的相似度,并分析了两种期刊论文的共现关键词。[结论]研究发现,两种期刊的相似度有一定波动,但整体上呈现为一个下降趋势。这反映出两种期刊上发表的论文的相似性在不断下降,而差异性在不断增加。  相似文献   

3.
[目的/意义]针对被引频次指标在学术论文评价中的局限性,提出基于多维度引用特征的学术论文评价方法,提高引文指标在单篇论文评价中的可靠性。[方法/过程]通过被引频次标准化消除学科、时间等因素的影响,作为频次指标;通过引用主体的重要性、引用时间跨度、引用强度、引用位置、引用情感、主题相似度6个维度的引用特征,区分不同引用中被引文献对施引文献的作用,作为特征权重;将频次指标和特征权重相结合,对学术论文进行定量评价。[结果/结论]改进基于引用的学术论文评价方法,有效解决被引频次指标对所有引用同等对待的问题。该方法的评价结果比被引频次指标更加合理,还能更细致地剖析论文的被引特征。  相似文献   

4.
[目的/意义]随着科技发展,创新成为企业的立身之本,推进企校合作有助于企业在市场竞争中占有一席之地。[方法/过程]构建了融合专利与论文信息的内容挖掘和引用基础的组合相似度计算的企校合作推荐模型,组合相似度计算包括细分领域分类代码、关键词和引用基础3个维度。并利用我国人工智能领域前50强企业同高校之间的合作推荐做实证分析,且从比较研究和结果分析两个角度进行验证。[结果/结论]企校创新合作机构推荐模型能够取得较好的结果,有助于企业寻找具体研究领域的恰当高校合作机构,在一定程度上能够促进我国企校机构间深度合作,推动企校机构创新共赢。  相似文献   

5.
[目的/意义]作者相似度研究是探测学科知识结构、挖掘潜在合作关系的重要基础。[方法/过程]本文拟构建作者的关键词—文献2模矩阵,通过研究矩阵对应的灰度图像之间的相似性来判定作者相似性,并利用灰色关联理论计算基于合著关系和基于关键词的作者相似度,最后进行实证分析,对比三种作者相似性结果。[结果/结论]实验表明:基于关键词—文献矩阵的作者相似度研究可以减少因作者发文量不同及高频关键词的使用带来的影响,同时可以放大作者间研究内容的差异性与相似性,能较为准确地反映作者的相似度。  相似文献   

6.
李晓敏  王昊  李跃艳 《情报科学》2022,40(4):156-165
【目的/意义】为帮助科研用户快速准确地找到与自身研究兴趣相关的学术论文,构建了基于细粒度语义实 体的学术论文推荐模型。【方法/过程】将实验前期识别出的研究主题、研究对象和理论技术类语义实体作为学术论 文和核心作者的内容特征,分别利用TF-IDF算法、TextRank算法和LDA模型得到学术论文和核心作者的特征词, 利用Word2vec对特征词进行向量化,再计算核心作者和学术论文的余弦相似度,将余弦相似度值靠前的Top20推 荐给作者。【结果/结论】利用准确率、召回率和F值对基于三种算法得到的特征词生成的推荐结果进行比较评价,结 果表明,基于TF-IDF算法得到的特征词生成的推荐效果最佳,并对推荐结果进行了实例展示,可以看出本文提出 的推荐模型能够更为全面地为科研用户推荐与其研究兴趣类似的学术论文,提高科研效率。【创新/局限】本文主要 是从学术论文的内容特征入手,对类型细分后的关键词利用不同算法进行核心作者特征词筛选,进而实现学术论 文推荐,但是对学术论文中包含的网络关系并未涉及。  相似文献   

7.
[目的/意义]识别潜在技术关系对企业寻找竞合对象、提升创新能力具有重要意义。研究提出一种融合专利类别与语义信息的企业潜在技术关系测算方法,有助于判断企业之间的技术重叠、补充和匹配程度。[方法/过程]首先,建立企业—IPC—专利文本三层映射矩阵,统计企业之间的IPC交集、补集等数据;其次,基于IPC和专利文本分别计算企业在类别和语义维度上的指标,实现在相同层级上计算企业的技术相似度和互补度;最后,计算技术匹配度,建立企业技术匹配度矩阵,进行可视化展示。[结果/结论]对24家上市公司进行实证分析,结果表明,该方法优于单一维度的测算方法,可用于判断企业之间的技术匹配情况。后续将纳入科研院校等机构类型,深入挖掘机构之间的技术相似点、互补点,利用复杂网络等工具展示互补的方向性,并考虑扩展应用场景,进一步提升该方法的情报价值。  相似文献   

8.
[目的/意义]在开放的知识交流环境中向学者推荐具有相似研究兴趣的学者有助于学者高效获取到所需的学术资源,更好地开展学术研究和学术交流。[方法/过程]首先利用LDA主题模型提取学者的科研兴趣特征,同时引入时间因子加权兴趣特征,形成学者动态兴趣矩阵,基于此使用K-means对具有相似研究兴趣的学者进行聚类分析,并在类簇内综合学者的科研能力和社交属性两个维度构建学者推荐模型。[结果/结论]以“百度学术”数据集对模型进行验证,实验结果表明该模型能够很好地发现相关学者,满足可操作性和推荐结果有效性。在学者推荐过程中引入更贴近现实的动态兴趣特征对推荐结果具有一定效果。  相似文献   

9.
[目的/意义]从用户相似度计算和用户反馈双重视角出发,进行高质量用户推荐,有利于提高网络知识社区个性化推荐水平。[方法/过程]首先基于爬虫工具和Python包进行用户属性数据采集和分析,以计算用户之间的背景、社交关系、博文信息的综合相似度;然后再计算用户核心度,基于相似度矩阵和核心用户排名形成待推荐列表;最后引入用户反馈机制,并根据用户的正负反馈结果确定最佳Top-k好友。[结果/结论]融入用户反馈的好友推荐模型能够提高推荐用户的质量,有效地提高好友推荐水平,也验证了好友推荐是一个逐步修复的过程。  相似文献   

10.
匡登辉 《现代情报》2019,39(4):115-124
[目的/意义]对比分析相同主题的不同类型科学文献的使用行为,利用用户学术行为数据全面测评学术论文影响力。[方法/过程]基于Web of Science数据库中学术论文使用次数,分析比较不同学科文献的使用差异。从文献使用入手,收集2013-2017年3D打印领域的论文数据,以化学、工程文献为对比分析对象,从论文的学科视角分析使用次数与被引频次之间的相关性,分析高使用与高引用(Top 10%)论文的重合文献,探测文献使用差异,并进行独立样本T检验。[结果/结论]U1与被引次数成微弱正相关,U2与被引次数显著性相关;两学科的科学论文在使用上存在统计学意义上的显著差异,可能原因是不同学科学者的文献使用行为不同。此外,文献类型对使用次数有影响,综述类文献信息量较为丰富,从而可以获得更多的使用、引用。  相似文献   

11.
基于词嵌入语义的精准检索式构建方法   总被引:1,自引:0,他引:1  
[目的/意义]使用科技文献数据库进行文献检索时,检索式中的关键词如果不够全面,将导致检索结果查全率较低;检索式中的关键词如果一词多义,则可能向检索结果中引入无关文献,导致查准率较低。[方法/过程]针对这两类问题,本文提出使用词嵌入这一新颖的文本数据化表现形式,一方面通过语义分析对检索关键词进行扩充从而提高查全率;另一方面通过发现语义异常点来提高查准率。[结果/结论]本文将该方法应用于人工智能领域中深度学习方向上的文献检索式构建,实验结果表明该方法能在一定程度上提高检索的查全率和查准率。  相似文献   

12.
[目的/意义]论文标题中往往包含部分或全部关键词,标题与关键词之间存在差异便于读者将二者结合,更全面地了解文献内容。[方法/过程]本文首先提出了论文标题与关键词差异度的概念,然后对CSSCI中近20年的图情类期刊论文分别从差异度的年度分布、不同期刊论文差异度比较、标题长度和关键词数量对差异度的影响几个方面进行研究。[结果/结论]结果表明,标题与关键词差异度有随着年份变小的趋势;有4种期刊差异度相对偏大,说明这几个期刊的标题与关键词能反映更多的内容信息;标题长度在15~30之间和关键词数在4~5个时,差异度相对较大。  相似文献   

13.
李海林  林春培 《科研管理》2022,43(1):176-183
   鉴于传统方法对科研成果关键词研究存在较强主观影响和较少考虑时间因素等问题,提出基于时间序列聚类的科研成果关键词分析方法。该方法通过统计分析方法验证关键词出现顺序在一定程度上反映了关键词反映主题思想的重要性,将关键词的重要度转化为时间序列数据,分别从重要度的数值和趋势两个角度出发,使用动态时间弯曲方法度量关键词重要度时间序列数据之间的相似性,结合近邻传播方法对关键词时间序列数据之间的相似性矩阵进行聚类分析,实现科研成果的关键词分析研究。通过对某科研管理类重要期刊2008—2017年期间刊发的科研成果论文关键词研究发现:新方法不仅可以对科研成果中关键词的关注热度和趋势进行聚类划分,自适应地找到中心关键词作为相应类别的特征代表对象,还能为科研成果关键词的主题分析提供理论方法和决策支持。  相似文献   

14.
【目的/意义】针对基于关键词的科技文献聚类研究进行了一些探讨,包括:使用具有不同特征的关键词来 实现文献聚类在效果上有何差异;如何按特征对关键词进行选择来提高文献聚类效果。【方法/过程】按照关键词词 频与语义类型特征设置对照组进行实证研究,观察其对文献聚类密度及文献语义表示效果的影响。【结果/结论】单 独使用具有超高频、次高频、研究主题或限定范围特征的关键词进行文献聚类能使聚类密度较为合适;超高频特征 通常在其他频次中都具有体现,次高频词能同时反映不同频次的关键词特征,但次高频词对中频词特征的表示不 够全面;将语义类型不同的关键词分开来实现文献聚类,其效果好于将关键词进行组配,语义类型不同的关键词间 存在互斥性。【创新/局限】本文发现了在以关键词间的共现关系为基础来进行文献聚类时单独选择次高频或某一 语义类别的关键词来实现文献聚类具有较好效果,但缺少对关键词间语义结构关系的进一步研究。  相似文献   

15.
[目的/意义]精准识别潜在专利技术组合,将相互关联的技术组成保护范围更大的专利网,对于打破单项专利的局限性、构建更为缜密的技术壁垒具有重要意义。[方法/过程]首先在对关键词与核心IPC进行语义抽取的基础上,筛选出核心专利集合,然后计算基于专利相似性与互补性的专利组合强度,最后利用MCL聚类算法直观、精准地识别潜在专利组合,并以艾滋病疫苗领域专利对方法进行了验证。[结果/结论]该方法以核心专利集合为数据源有效降低了组合识别中的噪音,基于多维度的专利组合强度计算克服了以往组合识别指标的片面性,利用MCL聚类算法无需人为规定簇群数量,保证识别质量。  相似文献   

16.
[目的/意义]研究学术文献被撤销的规律和特征对于客观认识撤稿现象、净化学术环境、加强科研诚信建设具有重要价值。当前对于撤稿的研究集中于期刊论文,很少关注会议文献。[方法/过程]以撤稿观察数据库中7579篇被撤销会议文献为研究对象,分析总结被撤销文献的时间、来源和学科分布特征以及被撤销原因和时滞。[结果/结论]会议文献撤稿与期刊论文撤稿在原因和时滞上存在重要差异,中国是会议文献撤稿的“重灾区”。研究认为,科研人员、审稿人、出版商、科研管理机构亟需共同努力,加强对于学术会议的质量控制,提高相关主体行为的规范性。  相似文献   

17.
Topic evolution has been described by many approaches from a macro level to a detail level, by extracting topic dynamics from text in literature and other media types. However, why the evolution happens is less studied. In this paper, we focus on whether and how the keyword semantics can invoke or affect the topic evolution. We assume that the semantic relatedness among the keywords can affect topic popularity during literature surveying and citing process, thus invoking evolution. However, the assumption is needed to be confirmed in an approach that fully considers the semantic interactions among topics. Traditional topic evolution analyses in scientometric domains cannot provide such support because of using limited semantic meanings. To address this problem, we apply the Google Word2Vec, a deep learning language model, to enhance the keywords with more complete semantic information. We further develop the semantic space as an urban geographic space. We analyze the topic evolution geographically using the measures of spatial autocorrelation, as if keywords are the changing lands in an evolving city. The keyword citations (keyword citation counts one when the paper containing this keyword obtains a citation) are used as an indicator of keyword popularity. Using the bibliographical datasets of the geographical natural hazard field, experimental results demonstrate that in some local areas, the popularity of keywords is affecting that of the surrounding keywords. However, there are no significant impacts on the evolution of all keywords. The spatial autocorrelation analysis identifies the interaction patterns (including High-High leading, High-Low suppressing) among the keywords in local areas. This approach can be regarded as an analyzing framework borrowed from geospatial modeling. Moreover, the prediction results in local areas are demonstrated to be more accurate if considering the spatial autocorrelations.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号