首页 | 本学科首页   官方微博 | 高级检索  
 共查询到20条相似文献,搜索用时 531 毫秒
识别不同学科间共有的研究内容是学科交叉知识发现的一种研究思路。学科间具有相似语义的研究内容,能够更好地体现学科之间知识的融合、交流现象。针对从科技文献数据中获取语义相似学科交叉研究主题的问题,本文提出了一种基于无监督对比学习的科技文献及关键词语义相似关系表示学习方法,构建了一种语义相似学科交叉主题识别模型。该模型将Spearman相关系数作为评价学科交叉主题的指标,解决了现有研究缺少学科交叉研究数据集的问题。研究结果表明,本文模型较好地获取了科技文献及其关键词之间的语义相似关系,能够较好地反映两个学科之间的交叉态势。  相似文献   

科学创新内容是科学交流的核心对象,在科学创新活动中扮演着重要角色。本文综合应用文献对比分析法,梳理了科学创新相关概念的内涵,归纳了基于科技文献的创新内容识别抽取的主流实践及主要问题,对比了创新内容结构化组织的主要数据模型与基于创新内容的应用场景。研究结果表明,科学创新内容的识别抽取、组织及应用存在显著的学科差异,相关数据模型对创新内容的组织与表征粒度也有很大不同,尚不存在广泛、通用的创新内容识别抽取方法和适配全学科的创新内容数据模型;同时,基于创新内容的应用具有广阔发展前景,但目前相关的大规模落地实践较少。本文从宏观层面上构思了基于科学创新内容的科学交流实践框架及其渐进型和突破型实践路径,以及实现该框架的3个主要任务和面临的主要挑战。  相似文献   

文章首先对科学数据与科技文献应用的现状进行了阐述,分析了科学数据与科技文献DOI标识的异同点,总结了DOI在科学数据与科技文献融合中的作用,并对两种科技资源融合的案例进行了研究,最后给出了基于DOI技术的科学数据与科技文献融合模型.  相似文献   

共引分析方法及其应用研究耿海英(中国科学院文献情报中心2004级硕士研究生)专业:情报学指导教师:肖仙桃研究员(中国科学院国家科学图书馆兰州分馆)共引分析方法是引文分析方法中的一种,是一种定量的情报研究方法,主要通过分析两篇文献同时被别的文献引用的情况来研究文献之间的关系,这种方法被广泛用于科学评价、科技管理等诸多领域。国外对此已有较多研究,但缺乏整体性和系统性。随着科学知识图谱逐渐成为科学计量学研究的热门领域,共引分析方法再一次成为人们关注的焦点。本文基于已有的零散研究,对共引分析方法及其应用作了全面系统的分…  相似文献   

期刊论文与专利文献的整合框架研究   总被引:2,自引:0,他引:2  
期刊论文与专利文献是重要的科技文献资源,实现两者相互之间的有效链接有利于加强基础研究与应用研究之间的联系,促进技术创新。针对当前文献服务体系中的孤岛现象,提出基于知识组织体系的期刊论文与专利文献的整合框架。在此基础上,论述两者整合研究的内容,建立中图法与IPC的映射模型和基于主题的异构文献整合模型。  相似文献   

文本型科技文献是当前科学知识表达以及科学交流的主要形态。为了促进科学交流,对日益增长的科技文献中的科学知识进行数据化及组织呈现的研究和实践逐渐增多。本文对科技文献数据化及组织呈现方法、应用场景、实现技术进行了系统梳理,包括科技文献的元数据化、科学词汇抽取、领域实体及其关系识别、篇章功能结构识别、科技文献语义组织以及科技文献呈现与智能化应用六个维度,总结目前该研究领域存在的主要问题;在此基础上设计了科技文献数据化及组织呈现的整体框架,阐述了该框架实现的四个核心技术:识别抽取技术、语义组织技术、分析推理技术以及展陈交互技术;最后归纳总结了该领域面临的挑战,如科学知识自动获取、科学数据质量及信任性、科学知识交互体验等。未来需要加强各方合作,以高质量的科学数据为基础,实现科学知识的叙事生产和转化。图4。表3。参考文献69。  相似文献   

情境感知的科技文献协同推荐方法研究   总被引:1,自引:0,他引:1  
为适应科技工作者个性化、系统化和动态化的科技文献获取需求,提出基于情境感知的科技文献协同推荐方法。系统地分析情境、科技工作者和科技文献之间的关系,建立情境感知的科技文献协同推荐过程模型,并对该过程实现中的关键方法展开深入探讨;同时构建对应的推荐系统并通过实验验证该协同推荐方法的有效性。  相似文献   

<正>文中的科技新闻工作者是指从事采编和传播科学(自然和社会)、技术领域新闻的科技记者、科技编辑、科技评论员等的统称。科学和文化是人类社会发展中两个极为重要的内容。科学作为一种不断发展的学术活动与其周围的社会和文化结构之间建构出一种互惠关系,社会文化环境对科学本身的发展是有影  相似文献   

分析节点在网络中的位置和关系是网络分析的重要内容,也是为科学评价问题提供了有益的借鉴.从评价的角度,作者和文献之间存在正向的相互影响效应,因此提构建了由作者和文献构成的异质二分网络评价模型,应用PageRank和HITS算法的思想,建立作者和文献的协同评价.基于混合网络模型的协同评价,综合了合作网络和引文网络的结构特征,能够提供更为均衡的度量指标.以情报和图书馆学领域为样本,对模型的参数特征及收敛性进行了分析,通过对比分析说明了算法的有效性.  相似文献   

曾文  徐红姣  李颖  王莉军  赵婧 《情报工程》2016,2(3):037-042
文本相似度的计算方法以采用TF-IDF的方法对文本建模成词频向量空间模型(VSM)为主,本文结合科技期刊文献和专利文献特点,对TF-IDF的计算方法进行了改进,将词频的统计改进为科技术语的频率统计,提出了一种针对科技文献相似度的计算方法,该方法首先应用自然语言处理技术对科技文献进行预处理,采用科技术语的自动抽取方法进行科技文献术语的自动抽取,结合该文提出的术语权重计算公式构建向量空间模型,来计算科技期刊文献和专利文献之间的相似度。并利用真实有效的科学期刊和文献数据进行实验测试,实验结果表明文中提出的方法优于传统的TF-IDF计算方法。  相似文献   

Document clustering of scientific texts using citation contexts   总被引:3,自引:0,他引:3  
Document clustering has many important applications in the area of data mining and information retrieval. Many existing document clustering techniques use the “bag-of-words” model to represent the content of a document. However, this representation is only effective for grouping related documents when these documents share a large proportion of lexically equivalent terms. In other words, instances of synonymy between related documents are ignored, which can reduce the effectiveness of applications using a standard full-text document representation. To address this problem, we present a new approach for clustering scientific documents, based on the utilization of citation contexts. A citation context is essentially the text surrounding the reference markers used to refer to other scientific works. We hypothesize that citation contexts will provide relevant synonymous and related vocabulary which will help increase the effectiveness of the bag-of-words representation. In this paper, we investigate the power of these citation-specific word features, and compare them with the original document’s textual representation in a document clustering task on two collections of labeled scientific journal papers from two distinct domains: High Energy Physics and Genomics. We also compare these text-based clustering techniques with a link-based clustering algorithm which determines the similarity between documents based on the number of co-citations, that is in-links represented by citing documents and out-links represented by cited documents. Our experimental results indicate that the use of citation contexts, when combined with the vocabulary in the full-text of the document, is a promising alternative means of capturing critical topics covered by journal articles. More specifically, this document representation strategy when used by the clustering algorithm investigated in this paper, outperforms both the full-text clustering approach and the link-based clustering technique on both scientific journal datasets.  相似文献   

Summarizing Similarities and Differences Among Related Documents   总被引:10,自引:0,他引:10  
In many modern information retrieval applications, a common problem which arises is the existence of multiple documents covering similar information, as in the case of multiple news stories about an event or a sequence of events. A particular challenge for text summarization is to be able to summarize the similarities and differences in information content among these documents. The approach described here exploits the results of recent progress in information extraction to represent salient units of text and their relationships. By exploiting meaningful relations between units based on an analysis of text cohesion and the context in which the comparison is desired, the summarizer can pinpoint similarities and differences, and align text segments. In evaluation experiments, these techniques for exploiting cohesion relations result in summaries which (i) help users more quickly complete a retrieval task (ii) result in improved alignment accuracy over baselines, and (iii) improve identification of topic-relevant similarities and differences.  相似文献   

梁柱  沈思  叶文豪  王东波 《情报学报》2022,41(2):167-175
在现有的裁判文书检索系统上,非专业领域的用户检索具有局限性。目前,法律领域的智能检索仅在基于裁判文书的法律条文的推荐和分类上开展了研究,缺乏对裁判文书自动推荐的相关研究,因此,本文提出了一种利用类新闻的事实性文本智能推荐裁判文书的方法,结合目前的研究工作,总结裁判文书的结构和内容特征,利用类新闻的事实性文本模拟非法律专业用户的检索查询式,构建含有结构内容特征的裁判文书语料库,并自动推荐相关裁判文书文档。结果显示,利用裁判文书的法院意见结构内容特征,对新闻语料进行特征词表示之后,LambdaMART模型在文本匹配结果上表现良好,优于传统的全文检索技术。  相似文献   

电子文档和用户的增长导致了信息检索结果个性化模式的创新,从而更好地为用户偏好服务.个性化的内容检索旨在改善检索过程中考虑个别用户的特殊兴趣.本文提出了一种基于扩展模糊概念网的信息检索结果的个性化的新方法.在这种方法中,网页和用户偏好都将以扩展模糊概念网形式表示.扩展模糊概念网可看作是关系矩阵和关联矩阵模型,关系矩阵中的元素代表模糊概念间的关系,关联矩阵中的元素表明概念间的关联度.这种方法的好处是能找到用户查询的绝大多数文档并且更灵活、更好地显示给用户.  相似文献   

影响科技查新质量的相关因素   总被引:9,自引:0,他引:9  
文章分析了影响科技查新质量的相关因素:查新要点的提出、密切相关文献的筛选、相关文献对比分析、查新报告的撰写、查新审查制度的完善、查新人员自身业务素质,并提出了相应措施.  相似文献   

《中文社会科学引文索引》在科研及管理中的作用   总被引:4,自引:0,他引:4  
《中文社会科学引文索引》从文献之间的引证和被引证关系上揭示社科研究成果之间的相互关系,为人们在科学研究中检索相关资料和课题申报中了解各领域研究动态。以及项目鉴定中进行查新服务等提供了有力的工具。同时,CSSCI的检索、统计、分析、对比功能为科研管理与决策部门进行学科规划、人才引进、科研工作总结提供了有效的素材。  相似文献   

In this paper we look at some of the problems in interacting with best-match retrieval systems. In particular, we examine the areas of interaction, some investigations of the complexity and breadth of interaction and attempts to categorise user's information seeking behaviour. We suggest that one of the difficulties of traditional IR systems in supporting information seeking is the way the information content of documents is represented. We discuss an alternative representation, based on how information is used within documents.  相似文献   

A number of technologies exist which enable the unobtrusive capture of computer interface interactions in the background of a user's working environment. The resulting data can be used in a variety of ways to model aspects of search activity and the general use of electronic documents in normal working routines. In this paper we present an approach for using captured data to identify relationships between documents used by an individual or group, representing their value in a given context—that may relate to specific information need or activity. The approach employs the use of a naïve Bayesian classifier to evaluate possible relationships that are derived implicitly from the data. It is intended that the relationships established be stored within an information retrieval (IR) system to aid in the retrieval of related documents where future users arrive at a similar context. In the evaluation of the approach over 70 hours of data from computer users in industrial and academic settings are collected to assess its overall feasibility. The results indicate that the approach provides a useful method for the establishment of identifiable relationships between documents based on the context of their usage, rather than their content.  相似文献   

隐含语义检索及其应用   总被引:5,自引:1,他引:4  
隐含语义检索(Latent Semantic Indexing, LSI) 是一种基于概念的文献检索方式。它区别于传统的基于用户查询条件与文档的单词匹配的文献检索方法, 根据文档与查询条件在语义上的关联而向用户提交查询结果。本文介绍了隐含语义检索在文献检索中的一种实现方法, 为文献检索提供了一种新的途径。  相似文献   

This study introduces a novel framework for evaluating passage and XML retrieval. The framework focuses on a user’s effort to localize relevant content in a result document. Measuring the effort is based on a system guided reading order of documents. The effort is calculated as the quantity of text the user is expected to browse through. More specifically, this study seeks evaluation metrics for retrieval methods following a specific fetch and browse approach, where in the fetch phase documents are ranked in decreasing order according to their document score, like in document retrieval. In the browse phase, for each retrieved document, a set of non-overlapping passages representing the relevant text within the document is retrieved. In other words, the passages of the document are re-organized, so that the best matching passages are read first in sequential order. We introduce an application scenario motivating the framework, and propose sample metrics based on the framework. These metrics give a basis for the comparison of effectiveness between traditional document retrieval and passage/XML retrieval and illuminate the benefit of passage/XML retrieval.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号