首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 31 毫秒
1.
基于词向量扩展的学术资源语义检索技术   总被引:1,自引:0,他引:1  
[目的/意义] 尝试以统计的方法为指导思想,探究基于词向量扩展的语义检索技术来提升学术资源的语义检索能力。[方法/过程] 利用自然语言处理、文本挖掘技术,对采集来的学术资源(主要是学术论文)元数据进行预处理,结合word2vec词向量生成工具和elasticsearch全文检索引擎搭建语义检索系统,对学术资源进行语义检索的探索研究。[结果/结论] 本文提出的方法能够有效提升学术信息的检索效果,一定程度上实现学术资源的语义检索,并为后续语义检索的进一步研究提供借鉴。  相似文献   

2.
数字图书馆网格服务描述机制研究*   总被引:2,自引:0,他引:2  
将数字图书馆网格中的服务特征进行分类,基于这些特征分类进行多属性的数字图书馆网格服务描述,就数字图书馆网格中服务的语义描述层次问题进行探讨,提出基于本体的数字图书馆网格服务语义描述模型。  相似文献   

3.
文章分析了新型学术交流模式、e-Science、数据密集型科研等不同科研场景对数字信息资源的依赖,并提出应对策略。新型学术交流模式主要依赖于数字资源的开放关联、组织描述、深度开放以及免费共享;e-Science主要依赖于数字资源的元数据描述、内容存储关联等多种服务,并且资源依赖具有学科特征;数据密集型科研主要依赖于海量科学数据资源以及多类型软件工具类资源等。针对学术交流模式的变革提出信息资源的多样化建设尤其是开放科学数据的建设,并嵌入到学术交流过程中;针对e-Science的发展,提出把开放信息资源建设嵌入到科研环境中,关注不同学科对信息资源的需求特点;针对数据密集型科研,提出加强工具类资源的建设,提供与数据相关的更多服务等。  相似文献   

4.
OBJECTIVES: HealthCyberMap (HCM-http://healthcybermap.semanticweb.org) is a web-based service for healthcare professionals and librarians, patients and the public in general that aims at mapping parts of the health information resources in cyberspace in novel ways to improve their retrieval and navigation. METHODS AND SERVICE DESCRIPTION: HCM adopts a clinical metadata framework built upon a clinical coding ontology for the semantic indexing, classification and browsing of Internet health information resources. A resource metadata base holds information about selected resources. HCM then uses GIS (Geographic Information Systems) spatialization methods to generate interactive navigational cybermaps from the metadata base. These visual cybermaps are based on familiar medical metaphors. CONCLUSIONS: HCM cybermaps can be considered as semantically spatialized, ontology-based browsing views of the underlying resource metadata base. Using a clinical coding scheme as a metric for spatialization ('semantic distance') is unique to HCM and is very much suited for the semantic categorization and navigation of Internet health information resources. Clinical codes ensure reliable and unambiguous topical indexing of these resources. HCM also introduces a useful form of cyberspatial analysis for the detection of topical coverage gaps in the resource metadata base using choropleth (shaded) maps of human body systems.  相似文献   

5.
UMLS语义命题是用三元组表示的最小语义化知识单位,其主语和宾语都是UMLS超级叙词表中的概念,谓词是UMLS语义网络中的语义关系。UMLS语义命题的抽取过程涉及浅层句法分析、概念映射、谓词识别与语义命题生成等环节。两种以UMLS语义命题为基础的医学信息资源聚合方法——用知识单元作为资源单位的聚合方法和用文档关联数据作为资源单位的聚合方法,其聚合结果分别是知识网络和文档网络。  相似文献   

6.
敦煌遗书图像蕴含丰富的文化内涵,对于研究中国古代社会历史、宗教与美术具有重要意义,但传统单一线性的图像检索方式不利于敦煌遗书图像隐性知识的挖掘,影响知识发现的深度与广度。而关联数据能够连接多源异构资源,实现多种资源的语义互联,既能促进管理标准化与规范化,又有利于提升图像内容的深入整合,同时,将关联数据应用于敦煌遗书图像在理论、实践与技术上都具备可行性。为此,本文针对敦煌遗书图像的物理特征与内容语义特征构建敦煌遗书图像层次模型,使用元数据描述后将这些元数据进行关联;同时,本文基于关联数据设计敦煌遗书图像知识关联的组织模式,其自底向上分为数据收集层、语义描述层、数据关联层与知识应用层四层,旨在改善图像检索效果并利于敦煌遗书图像的知识发现与智能查询。  相似文献   

7.
调研UMLS构成和建设特点,重点研究UMLS在检索方面的应用实例,分析归纳UMLS在语义化、智能化检索方面的功能设计、实现方法与实际效果,以期为基于集成式知识组织系统的智能检索应用的场景功能设计、技术开发和实现,提供借鉴和参考。UMLS在智能检索中的应用主要包括:(1)扩展检索,主要有同义词扩展、等级结构扩展和词组切分扩展等方法;(2)语义检索,基于概念和概念之间的关系进行检索和结果内容表达;(3)问答式检索,包括问题分析、文献检索、语句提取、答案生成和语义聚类。  相似文献   

8.
电子文件管理元数据描述方式研究   总被引:1,自引:0,他引:1  
从语言学角度看,电子文件管理元数据的描述有三种方式,即语义描述、语法描述和本体描述,这三种方式在描述电子文件管理元数据方面各有异同.采用JSO 11179来描述电子文件管理元数据语义,如在语法上采用XML来描述电子文件管理元数据,只能在形式上实现电子文件管理元数据的置标机读化描述,而难以在语义层面上对其进行置标智能化描述;采用本体语言来描述电子文件管理元数据,就可以实现电子文件管理元数据语义描述与语法描述的融合集成,实现电子文件管理元数据置标智能化的描述.  相似文献   

9.
[目的/意义] 通过对国内外数字文化资源语义融合相关研究成果的总结和Europeana案例分析,为国内数字文化资源整合的研究与实践提供参考和借鉴。[方法/过程] 选取目前发展较为成熟的数字文化资源整合项目Europeana作为案例,分别从资源内容描述规则、语义知识本体模型设计、元数据语义化操作和关联数据的发布与访问4个方面对其数字文化资源语义融合的实现方法进行分析。[结果/结论] 研究发现,构建聚合式元数据模型、建立细粒度语义概念模型、创建开放的语义关联数据网络、提供泛在化关联数据应用服务是实现数字文化资源语义融合的关键。  相似文献   

10.
解读语义Web     
介绍语义Web的概念及目的,认为语义Web的实质就是使计算机能够理解网络信息资源的元数据,并以书目数据的发展变化为例解读语义Web中元数据的结构和意义。提出书目数据向元数据发展,需要著录项目标准化,构建元数据描述框架,制定计算机能理解的词汇,科学地定义词汇的属性和词汇之间的关系。  相似文献   

11.
面向网络信息资源聚合搜索的细粒度聚合单元元数据研究   总被引:1,自引:0,他引:1  
由于相关信息片段分散分布在海量且复杂多样的网络信息资源中,用户往往需要花费大量时间浏览、查询和收集所需信息。面向聚合搜索的细粒度聚合单元元数据可以深入揭示信息特征及其关联关系,促进知识发现并提升知识服务效率。因此,有必要构建细粒度聚合单元的元数据描述框架。本文以图书情报领域开放获取期刊论文、在线百科、博客等网络信息资源为数据源,采用逻辑结构分析和形式结构分析方法建立聚合单元划分框架,包括篇章层级的标题、著者等外部特征,以及节段、句群、图表单元中的话语意图和语义功能等特征;通过分析聚合单元的属性特征及复用DC、LOM元数据元素,构建描述聚合单元访问信息、物理信息和语义信息的元数据框架;设计检索数据库并采用实验法对聚合单元元数据框架进行验证。实验表明,该元数据框架可支持多类型网络信息资源、各层级细粒度聚合单元的检索,可为细粒度信息聚合与搜索提供理论基础与实践指导。图7。表6。参考文献58。  相似文献   

12.
基于 UMLS医学本体的挖掘文献间潜在联系的设计与实现   总被引:1,自引:0,他引:1  
以Swanson的非相关文献知识发现的原理为依据,采用自然语言处理技术,将不规范的自然语言转换为UMLS中的概念,同时引入语义过滤系统,开发出非相关医学文献潜在联系的挖掘工具,同时用Swanson发现镁与偏头痛的数据做验证,结果表明,该方法能很好地重现Swanson的研究结果,并且能发现更多的有潜在价值的中介词,具有较高的效率。  相似文献   

13.
针对科技文献特征词在语义上的层次特性,提出基于概念泛化的内容过滤推荐算法.采用矢量空间模型作为用户兴趣偏好和科技文献特征的描述模型;在比较科技文献特征与用户兴趣偏好的相似程度时,首先从字符层面比较科技文献特征词与用户兴趣特征词,然后在基于ODP目录结构的用户兴趣偏好概念泛化树上对字符不相同的特征词对进行语义比较,并修正特征词权重,以避免遗漏"字符不同,但语义相似"的关键词对.理论分析和实验结果表明,该算法能够更加全面、准确地推荐科技文献对象.  相似文献   

14.
This research concerns the frequency of the assignment of author-supplied keyword strings and cataloger supplied subject heading strings within a library catalog. The results reveal that, on average, more author-assigned keywords and more cataloger-assigned Library of Congress Subject Headings were assigned to works emerging from the arts & humanities than to works emerging from the social sciences and science, technology, engineering, and mathematics (STEM) disciplines. STEM disciplines in particular received a lower amount of topical metadata, in part because of the under-assignment of name/title, geographical, and corporate subject headings. These findings reveal how librarians could increase their understanding of how topical access is functioning within academic disciplines.  相似文献   

15.
[目的/意义] 研究统一医学语言系统中语义网络与社会化标注系统结合的深层次应用。[方法/过程] 总结UMLS语义网络的现有应用,分析UMLS语义类型与FrameNet语义类型的特征,构建适合本研究的语义类型,并通过实例梳理社会化标注系统与本体映射的思路。[结果/结论] 提出将所构建的语义类型作为标签归类的分类器以及作为分众分类系统与框架网络本体映射的桥梁。突破传统的基于统计的标签归类方法可为本体与分众分类系统的映射提供新的视角。  相似文献   

16.
科学数据语义描述研究述评   总被引:1,自引:0,他引:1  
周宇  廖思琴 《图书情报工作》2017,61(12):136-144
[目的/意义] 对国内外科学数据语义描述相关研究成果进行调研分析,归纳研究热点、研究特征和研究框架,总结研究中存在的不足,提出发展建议,为今后国内科学数据组织和服务提供参考和借鉴。[方法/过程] 从多个权威数据库采集国内外2007年1月至2016年12月发表的有关科学数据语义描述的期刊论文和学位论文,采用比较法和归纳法分析并揭示研究热点,并对相关研究成果进行述评。[结果/结论] 研究结果表明:①国内外科学数据语义描述研究很不均衡,主要研究成果集中在自然科学领域;②基于描述深度、加工层次和表现形式的分析维度更方便洞悉各种语义描述方法的本质特征和区别;③当前科学数据语义描述研究还存在不足,需要在描述对象选择、可视化检索、数据集成、知识发现等方面进行深入研究。  相似文献   

17.
Recent developments in Web technology can be used for semantic enhancement of scholarly journal articles, by aiding publication of data and metadata and providing ‘lively’ interactive access to content. Such semantic enhancements are already being undertaken by leading STM publishers, and automated text processing will help these enhancements become affordable and routine. Publisher, editor, and author all have primary roles in that process; an incremental approach is needed. Publication of data and metadata to the Web make possible added‐value ‘ecosystem services‘; semantic publishing will bring substantial benefits to scholarly communication.  相似文献   

18.
[目的/意义] 随着科学交流体系向电子媒介迁移,传统的科学论文内容组织及呈现方式带来了诸多弊端。科学论文语义增强能够创新科学论文内容的组织与呈现方式,是解决这些问题的关键,得到了来自科研机构与学术出版商的重视,形成了一系列理论与实践成果。对这些成果进行梳理、归纳,发现其中的优势与不足,能够为后续推动科学论文语义增强的进一步发展起到指导作用。[方法/过程] 从语义增强的概念入手,着重分析科学论文语义增强的核心目标、实现路径与关键问题,随后,梳理对科学论文中正文本与副文本内容进行语义增强的理论与实践成果,并围绕科学论文语义增强路径上的三个阶段:语义标注、语义组织与可视化呈现进行对比分析。[结果/结论] 研究进一步归纳总结现阶段科学论文语义增强的特点,并对科学论文语义增强的未来发展及研究提出4点意见。  相似文献   

19.
基于语义模型的数字图书馆知识组织信息抽取策略   总被引:1,自引:1,他引:0  
简述语义模型是实现数字资源语义关系形式化描述的方式,是数字图书馆知识组织语义互联的重要影响因素。作为数字图书馆知识组织语义互联的重要环节,信息抽取需要本体提供语义知识依据,同时产生的文档也可以作为设计和丰富本体的知识资源。构建数字图书馆知识组织语义互联的语义模型以“元数据、领域本体、桥本体、本体解析体系”为核心要素,在此基础上探讨信息抽取的策略。  相似文献   

20.
White papers – reports conveying research or recommendations on a complex issue – arrive in the inboxes of academic librarians, along with an obligation to monitor them if they can help one's library or university. They seem to invariably disappoint, the written equivalent of empty calories. This paper asks: is this true? If so, how so? And why? To answer, a selection method produced a modest subset of current, topical white papers to analyze – hence this article as a fragment on recent, topical white papers. A simple discourse analysis was performed to find if there was a broad pattern the documents followed, and if a more analysis was required. A clue as to why this pattern prevailed came from criticisms of prognostications about the current pandemic (as of this writing), leading to a return to the reports: who authored them, and how they are situated in political-sociological terms in LIS discourse? The concluding findings fit with earlier analyses, suggesting much about prestige in LIS and how that is maintained, how practices are (and are not) formulated – and what that has to do with the white papers.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号