首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 859 毫秒
1.
[目的/意义]融合多元网络和网络表示学习方法学习并发现作者间的关联性,能够更好地进行合作者推荐。[方法/过程]文章首先搜集情报学领域相关文献数据作为原始数据集,在经过数据清洗后,根据作者间的多元关系构建各信息实体的多个科研信息网络,然后对高维网络利用Node2vec网络表示学习方法学习各节点的信息,从而得到各网络中节点的向量表示。其次,通过余弦相似度计算各网络中的作者相似度。最后融合作者间机构合作偏好和作者学术水平相似度得到最终的推荐结果。[结果/结论]文章提出的融合模型考虑了多元网络和数据稀疏性,在AUC值上的表现优于单一维度,得到了更好的合作预测效果。实验结果表明,该合作者推荐模型在情报学领域作者合作者推荐中具有可行性。  相似文献   

2.
学术文献引文推荐研究进展   总被引:1,自引:0,他引:1  
[目的/意义]学术文献引文推荐是指对于给定的学术文献,自动化地为其推荐合适的引文和参考文献。借助于引文推荐,用户可以在一定程度上提高撰写学术文献的效率,降低对重要相关文献的漏引。[方法/过程]分析国内外引文推荐研究的最新进展,阐述引文推荐问题的演化过程,从局部引文推荐和全局引文推荐等方面对引文推荐进行梳理,重点归纳文档相似性、主题模型、翻译模型、协同过滤和混合推荐等5种引文推荐常用方法,并总结引文推荐常用数据集和测评方法。[结果/结论]已有引文推荐研究的主要问题在于未考虑用户偏好的动态变化性及研究领域的综合性,在用户研究和实际应用方面仍有所欠缺;未来引文推荐的研究可运用语义化表达方法和自然语言生成技术,从基于上下文的引文推荐和跨语言引文推荐等方面进行展开。  相似文献   

3.
易明  刘明  冯翠翠 《情报学报》2022,(4):337-349
针对单领域推荐中的数据“稀疏性”和用户“冷启动”问题,提出一种综合利用评分信息和特征信息的跨领域推荐模型。首先,利用异质网络表示学习,针对源领域和目标领域的异质信息网络,通过元路径、DeepWalk算法生成网络表示学习向量,进而利用个性化非线性融合输出源领域和目标领域的物品特征信息向量;其次,利用神经网络模拟CMF (collective matrix factorization),生成用户和物品的评分信息向量,并通过映射函数MLP (multilayer perceptron)将用户评分信息向量映射到不同领域,以突出用户特征在不同领域的差异性;最后,将评分信息和特征信息有机融合,以损失函数为依据,采用梯度下降的方法学习模型的参数,从而完成评分预测。研究结果表明,在豆瓣网和Amazon数据集上,本文模型均优于其他相关算法;在提升推荐效果方面,目标领域RMSE (root mean squared error)和MAE (mean absolute error)下降了1%~15%,源领域RMSE和MAE下降了1%~19%;在用户“冷启动”方面,目标领域的RMSE和MAE下降了1%~14%...  相似文献   

4.
以CNKI真实数据集为研究对象,通过共引文献统计功能得出一个文献耦合网络。首先采用形式概念分析的方法构建耦合文献形式背景,其次对耦合网络中的知识载体与知识属性剥离解析,而后探寻知识概念的偏序关系,进而建立耦合文献概念格。经由知识聚类、关联规则挖掘等一系列格上作业,可视化地勾勒出文献耦合网络的知识结构以及知识属性之间的组分异质性规律,探索概念格技术与引文分析方法的融合机制。  相似文献   

5.
[目的/意义]通过分析引文持续增长论文的表现特征和深层原因,揭示论文持续影响力的相关规律.[方法/过程]选择美国物理学会(APS)数据集作为数据源,借助BASS模型识别引文持续增长型论文,并根据1:1原则选取引文非持续增长型论文作为对照组,比较两组论文在文献特征和引文扩散网络上的差异.[结果/结论]结果表明,引文持续增...  相似文献   

6.
情感分析研究的知识结构及热点前沿探析   总被引:1,自引:0,他引:1  
周建  刘炎宝  刘佳佳 《情报学报》2020,39(1):111-124
为了解国内外情感分析领域的研究状况,揭示该领域的知识结构、研究热点与发展动态,本文采用共被引分析、聚类分析、共词分析、战略坐标分析等方法,借助CiteSpace、UCINET、BICOMB、SPSS等软件,对Web of Science数据库收录的以情感分析为主题的相关文献进行计量分析与知识图谱绘制。分析结果表明,情感分析的应用、深度学习与神经网络、电子商务下的产品评论、事物情感特征评分、社交网络下用户生成内容、语义定向广告技术以及文本语言属性分析构建了情感分析的知识结构,产品评论与口碑、数据挖掘与人工智能、无监督学习、HadoopMapReduce与支持向量机以及神经网络与深度学习为该领域的研究热点,而顾客评论、推荐系统、极性分类、主题模型、电影评论、推特数据将是未来该领域主要研究方向。  相似文献   

7.
[目的/意义]梳理引文推荐的相关研究,为后续研究提供借鉴和参考。[方法/过程]首先,阐述引文推荐的起源、概念界定和分类;其次,根据研究数据的不同,总结引文推荐基于作者关系、内容过滤、论文关系、计量指标等不同类型数据的多种方法;最后,梳理深度学习技术在引文推荐中的应用实践。[结果/结论]基于大数据和人工智能的学术环境,展望引文推荐未来可能的发展。  相似文献   

8.
力学各分支学科研究前沿和发展趋势的可视化分析   总被引:4,自引:0,他引:4  
科学知识可视化是在信息技术推动下发展出来的一个新领域.本文以流体力学、固体力学、计算力学和振动力学领域的14种国际代表性期刊10年间的论文为研究对象,通过CiteSpace软件对引文数据和主题词数据的分析和处理,生成共被引文献网络和施引文献主题词共词网络组成的共被引与共词的混合网络图.以知识图谱的方式展示了力学各分支学科的重要被引文献、主要学术人物以及由施引文献主题词所表达的力学重要研究领域,揭示了力学各分支学科的演化过程、研究热点和前沿发展趋势.并深入剖析了支撑当前力学发展的由20世纪所形成的知识基础.  相似文献   

9.
相关反馈是一种根据用户或系统的相关性判断重构初始检索提问的方法,已被证明可以有效地改进检索效果.具体到学术文献,其引用关系表征了文献内容上的相关性,因而可以为相关反馈提供有价值的辅助信息.本文提出了一种基于引用上下文、文献同被引和文献耦合的相关反馈改进算法.该算法的基本思想包括:利用学术文献的引用上下文信息扩充词包模型(bags of words)进行文本表示;在相关文献判断阶段利用相关文献在引文网络中与其他文献的同被引强度和耦合强度扩充相关文献集合;结合基于聚类的相关反馈思想抽取查询扩展项.实验证明该算法提高了相关反馈效果.此外,相关分析的结果表明文献同被引以及文献耦合强度与文献内容相似度具有显著的相关性.  相似文献   

10.
通过CNKI的《中国学术文献网络出版总库》和《中国引文数据库》统计了贵州省图情机构获得正高职称并且发文在10篇以上专业人员的论文及被引情况(统计时间为2013年7月31日),在此基础上,通过计算得出了每名学者学术水平分值。  相似文献   

11.
本文创新性构建学术论文被引影响因素特征空间,以我校SCI&SSCI学术论文为例,验证机器学习模型在预测学术论文被引频次研究中的有效性和准确性,本文的分析结论可以为高校图书馆开展决策支持服务提供参考。本文梳理学术论文被引频次影响因素及预测方法的相关研究,结合传统文献计量和Altmetrics指标构建学术论文影响因素的特征空间,并通过实验比较线性回归、神经网络、支持向量机三种机器学习模型在预测学术论文被引频次研究中的有效性和准确性。本文的分析结论证明基于Altmetrics视角构建的特征空间的预测准确率大幅度提高,并且支持向量机模型在对学术论文影响力预测的实证研究中表现出优异的性能。  相似文献   

12.
[目的/意义]学术社交网络所提供的问答服务已成为学者们快速获取学术信息、解决学术问题的重要途径,实现基于机器学习的问答质量智能评价和服务优化对学术社交网络中优质内容传播具有重要意义。[方法/过程]以ResearchGate问答服务为研究对象,从结构化特征、内容特征、其他特征以及回答者特征4个维度构建答案质量评价体系,利用机器学习方法和数据增强技术进行答案质量分类预测。[结果/结论]SMOTE算法在处理不平衡样本时具备有效性;支持向量机在单一模型预测中,取得出色的分类效果;组合模型使预测精度得到进一步提升,基于随机森林、支持向量机、BP神经网络构建的组合模型分类性能最佳,以此为基础可通过搭建问答质量智能评价系统实现学术社交网络问答服务优化。  相似文献   

13.
Understanding paper citation dynamics and accurately predicting future citation counts of papers is of significant interest, and thus modeling citation dynamics as an information cascade has recently attracted considerable attention. Nevertheless, most of these recent deep learning-based information cascade prediction models are focused on the embedding of each individual node rather than the entire structure of the cascade graph, which limits the robustness of the model. Thus, instead of learning the representation of each node in the cascade, we propose learning the dynamic structural representation of the entire information cascade graph with the degree distribution vectors corresponding to different timestamps as the input of a sequential deep neural network, named CasDENN. Extensive experiments on datasets from academic paper citations (APS) and social media post forwards (Weibo) show a dramatic improvement over state-of-the-art baselines, where the prediction error can be reduced by approximately 8%–10% and the running time is less than 10% of the fast baseline.  相似文献   

14.
[目的/意义]学术文本结构功能是对学术文献的结构和章节功能的概括,针对当前研究较少从学术文本多层次结构出发进行融合和传统方法依赖人工经验构建规则或特征的问题,本文在对学术文本层次结构进行解析的基础上,构建了多层次融合的学术文本结构功能识别模型。[方法/过程]以ScienceDirect数据集为例进行实验,该模型首先通过深度学习方法对不同层次学术文本进行结构功能识别,接着采用投票方法对不同层次和不同模型的识别结果进行融合。[结果/结论]研究结果表明各层次集成后的整体效果较单一模型均有不同程度提升,综合结果的整体准确率、召回率和F1值分别达到86%、84%和84%,并且深度学习算法在学术文本分类任务中的性能较传统机器学习算法SVM更优,最后对学术文本结构功能错分情况进行了分析,指出本研究潜在的应用领域和下一步的研究方向。  相似文献   

15.
With the advancement of science and technology, the number of academic papers published each year has increased almost exponentially. While a large number of research papers highlight the prosperity of science and technology, they also give rise to some problems. As we know, academic papers are the most intuitive embodiment of the research results of scholars, which can reflect the level of researchers. It is also the standard for evaluation and decision-making of them, such as promotion and allocation of funds. Therefore, how to measure the quality of an academic paper is very critical. The most common standard for measuring the quality of academic papers is the number of citation counts of them, as this indicator is widely used in the evaluation of scientific publications. It also serves as the basis for many other indicators (such as the h-index). Therefore, it is very important to be able to accurately predict the citation counts of academic papers. To improve the effective of citation counts prediction, we try to solve the citation counts prediction problem from the perspective of information cascade prediction and take advantage of deep learning techniques. Thus, we propose an end-to-end deep learning framework (DeepCCP), consisting of graph structure representation and recurrent neural network modules. DeepCCP directly uses the citation network formed in the early stage of the paper as the input, and outputs the citation counts of the corresponding paper after a period of time. It only exploits the structure and temporal information of the citation network, and does not require other additional information. According to experiments on two real academic citation datasets, DeepCCP is shown superior to the state-of-the-art methods in terms of the accuracy of citation count prediction.  相似文献   

16.
本文为解决领域科技文献与专题价值的割裂问题提出深度融合科技文献、科研活动等科研对象与领域专题数据资源的图谱构建方法。通过主题词关联设计,构建包含期刊论文、期刊、科研机构、科研人员及专题实体类型的科研本体,选取机器学习专题构建科研知识图谱,并基于图数据库Neo4J进行图谱管理与查询验证。该专题科研知识图谱可以支持单实体/属性、多实体事实性问题的复杂图谱查询,有效揭示专题、科技文献的关联关系,具有较强的应用价值,可以为面向文献数据的智能知识服务提供新的思路和方向。  相似文献   

17.
利用语义角色标注技术对文献进行标注,以句子为最小单位进行文献的语义相似度检测。提取文献中所有词语的上位词,为每篇文献形成句子-词-语义角色-上位词四部图。语义相似的句子对比参照四部图确定,最终计算出两篇文献相似句子的Jaccard系数作为两篇文献的语义相似度。实验结果表明,所识别出的语义相似度较字粒度Jaccard系数法、词粒度Jaccard系数法、Winnowing Jaccard系数法等高出13%,然而受语料库限制,本方法还有很大的提升空间。  相似文献   

18.
Academic genealogy aims to structure and analyze the mentoring relationships between advisor and advisee. The representation of this structure results in academic genealogy graphs. For the analysis and characterization of these graphs, we present a set of metrics and their corresponding mirror metrics that capture the characteristics of its topological structure and represent them as quantitative attributes. The metrics of fecundity, fertility, descendants, cousins, generations, and relationships consider the descendants of the academics represented in the graph. The mirror metric of these topological metrics considers the ascendancy of academics. Individually, the metrics have strong semantic intuition and define characteristics regarding the performance in the mentoring of an academic. Together, the metrics are useful for the identification, characterization, and classification of communities and their members. The genealogical data available through the platforms of the Mathematics Genealogy Project and the Academic Family Tree were used as case studies. Two hundred thirteen thousand and 675,000 academic records were obtained for each project. We analyze the capacity of characterization of the metrics using the structuring of a similarity graph and through the distribution of the nodes in principal components. We observed that the set of metrics is capable of capturing the configuration pattern existing in genealogy graphs independently of its scale.  相似文献   

19.
[目的/意义] 高校图书馆信息化水平高,但数据挖掘与智慧化水平有待提升。复杂网络以图数据库为存储和图查询的载体,对图结构数据进行统一组织和挖掘。图嵌入、图算法技术相较于传统机器学习方法能够充分挖掘图结构数据中的隐含联系。本研究运用复杂网络技术融合多源数据,探索图嵌入技术、图算法等图结构数据挖掘方法在提升图书馆智慧化水平中的作用。[方法/过程] 首先基于可获取的数据进行数据特征分析与清洗;其次结合数据特征构建复杂网络概念模型,采用Neo4j批量导入技术实现网络构建和存储;最后探索图算法、图嵌入技术在图结构数据挖掘中的应用。[结果/结论] 以图结构融合多源数据构建图书馆复杂网络,并以图数据库作为存储介质。图算法与图嵌入技术在在用户画像分析、精准推荐、智能问答等图书馆智能化应用等方面具有独特优势。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号