首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 31 毫秒
1.
[目的/意义]对国内政府开放数据服务水平进行评价,可为我国政府开放数据的客观评价与政策制定提供参考和依据,从而提高我国政府数据开放效益。[方法/过程]从微观层面的数据与用户视角出发,建立政府开放数据服务水平的评价指标体系,以武汉等8地政府开放数据平台上的"文化休闲"主题数据集为例,利用熵值法计算权重与政府开放数据服务水平综合评价值。[结果/结论]我国城市政府开放数据服务水平具有以下特征:政府开放数据服务水平与数据可利用性具有较高的关联性,且具有层次性;各地政府开放数据服务水平呈现出不一致性。  相似文献   

2.
[目的/意义]以美国开放政府数据网站Data.gov中的元数据标准为例,分析其元数据体系及具体标准,以期为我国开放政府数据元数据标准的构建提供参考。[方法/过程]采用实例分析的方法,归纳总结美国开放政府数据元数据标准的体系结构。[结果/结论]美国开放政府数据元数据标准分为数据集内容与数据集格式描述元数据标准,并针对原始数据集与地理空间数据集采用不同标准描述;并指出我国在构建自身开放政府数据元数据标准时可借鉴Data.gov中的元数据标准体系。  相似文献   

3.
[目的/意义]分析美英政府开放健康医疗数据的主题分布情况与开放程度,为健康医疗行业数据开放提供参考。[方法/过程]围绕美国和英国政府数据开放门户上发布的健康医疗数据的来源机构、主题分布、开放数据认证、开放等级分布等情况进行量化研究。[结果/结论]截至2015年4月,美国data.gov共发布812个健康医疗类数据集,约50%为来自医疗保险与医疗补助服务中心的医疗保险与费用数据;87%的开放数据认证等级为初级;英国data.gov.uk共发布1 755个健康医疗类数据集,37%为卫生管理与质量监测数据,35%为人口统计数据,近70%的数据有访问限制。开放政府数据在实践层面尚处于起步阶段,美英政府分级分类开放了部分健康医疗数据,开放数据的主题分布较为集中、开放程度有限,其分级分类的做法有一定的借鉴意义。  相似文献   

4.
近10年我国传统知识组织系统关联化研究述评   总被引:2,自引:0,他引:2  
韩燕  何琳  彭爱东 《图书情报工作》2017,61(24):135-143
[目的/意义]对传统知识组织系统关联化现状进行梳理和分析,为国内传统知识组织系统语义化研究提供参考和建议。[方法/过程]通过文献数据库及网络平台进行检索和调查,概述国内相关研究情况,并从研究者采用不同语义化描述方法模型的角度对国内传统知识组织系统的语义化描述现状和研究成果进行分析。[结果/结论]对比国外相关研究,指出我国目前的研究运用的语义描述框架对传统KOS的表达能力有限、缺少转换后本体模型的质量控制、关联数据发布成果较少、且鲜有关于后续问题的研究,需要扩展综合现有的语言模型,进行转换后模型的质量控制,同时加强研究成果的开放与共享,逐步实现从理论研究到实践运用的过渡。  相似文献   

5.
科研实体名称规范的关联数据模型构建   总被引:1,自引:0,他引:1  
[目的/意义] 旨在研究将国家科技图书文献中心(National Science and Technology Library,NSTL)的科研实体名称规范数据发布为关联数据的难点——关联数据的数据模型。科研实体名称规范数据的数据模型研究,有助于NSTL科研实体数据的共享、互联、质量提升,融入到互联网中,同时也为其他机构使用、发布关联数据提供模型参考。[方法/过程] 首先,分析比较国内外关联数据发布项目中所采用的数据模型,发现关联数据发布项目中的数据模型主要分为以Schema.org为核心和多种标准词表组合两类;结合NSTL名称规范数据的特点,设计两种形式的关联数据模型,并从关联数据模型对名称规范数据的表达程度、模型复杂度等角度进行比较,选择较优方案;最后以D2RQ为工具进行实验,将NSTL名称规范的样例数据发布为关联数据。[结果/结论] 分析发现两种方案中以Schema.org为核心标准词表的方案相对于多种标准词表组合的方案有较优的表达完整度、较低的模型复杂度,更易于融入互联网,因此更适合作为NSTL名称规范数据的关联数据模型。  相似文献   

6.
The retrieval of documents that originate from digitized and OCR-converted paper documents is an important task for modern retrieval systems. The problems that OCR errors cause for the retrieval process have been subject to research for several years now. We approach the problem from a theoretical point of view and model OCR conversion as a random experiment. Our theoretical results, which are supported by experiments, show clearly that information retrieval can cope even with many errors. It is, however, important that the documents are not too short and that recognition errors are distributed appropriately among words and documents. These results disclose that an expensive manual or automatic post-processing of OCR-converted documents usually does not make sense, but that scanning and OCR must be performed in an appropriate way and with care.  相似文献   

7.
Through a case study of using social media tools to open up part of the curatorial research process for an online exhibit on the history of astronomy at the Library of Congress, I offer some initial ideas about how an open approach to sharing curatorial research could significantly expand the impact and reach of such work. Drawing on three distinct emerging conceptions and frameworks for the idea of “open” (open notebook science, linked open data, and open innovation) I suggest how this case study can be used to guide work with existing simple and inexpensive tools and how it could also inform the development of future tools, services and exhibit development methods. This work builds on an ongoing discussion of open data in libraries, archives, and museums. To date, most of that dialog is about object records and not about the stories and narratives cultural heritage institutions tell about them. I suggest ways to make the production of cultural heritage data, as well as the final outputs, part of an open and transparent process.  相似文献   

8.
This article concerns how higher education institutions across the United Kingdom are implementing systems and workflows in order to meet open access requirements for the next Research Excellence Framework. The way that institutions are preparing is not uniform, although there are key areas which require attention: cost management, advocacy, systems and metadata, structural workflows, and internal policy. Examples of preparative work in these areas are taken from institutions who have participated in the Open Access Good Practice initiative supported by Jisc.  相似文献   

9.
[目的/意义]通过对档案文献编纂成果传播媒介评价的实证研究,为档案文献编纂成果的有效传播和用户满意度的提升提供数据支持和参考。[方法/过程]通过文献搜集、专家访谈以及问卷调查3种方式确立档案文献编纂成果传播媒介的评价指标,运用主成分分析法计算各指标权重,应用MUSA模型和标杆分析法,对4种档案文献编纂成果传播媒介进行满意度实证研究。[结果/结论]获得4种传播媒介的用户满意度测评结果,定位每种媒介在档案文献编纂成果传播过程中的主要竞争优势、主要竞争劣势、薄弱之处以及需优先改善之处,为档案文献编纂成果传播的理论研究以及档案文献编纂工作的实践活动提供借鉴。  相似文献   

10.
崔春  毕强 《图书情报工作》2014,58(24):99-105
关联爵士项目是一项探索关联数据在数字人文领域中应用的实验项目,主要关注如何利用关联数据提升文化遗产文献的可视性,即通过爵士历史的数字档案揭示音乐家之间的关系以及他们在爵士领域的社交网络.介绍关联爵士项目产生的背景、具体内容、开发步骤以及项目中的关键问题,认为其可以为我国关联数据与数字人文领域的结合研究带来一定的启示:采用挖掘实体关系为目标的研究路线与方法、最大化文本来源、发布中文名称规范关联数据、对现有本体进行选择和映射、利用众包方式开展文本分析工作.  相似文献   

11.
余文婷  梁少博  吴丹 《情报工程》2015,1(5):068-076
运用开放知识基金会的开源软件 CKAN,根据 OAD 中的社会科学开放数据集,提出社会科学开放数据服务平台要素、关键功能及其实现方法,并结合 CKAN 的成功案例对平台功能进行具体描述。  相似文献   

12.
陈涛  夏翠娟  刘炜  张磊 《图书情报工作》2015,59(17):113-119
[目的/意义]目前,关联数据领域的研究正从如何生产数据向如何消费数据的方向转变,可视化已成为该领域研究的新热点。通过关联数据可视化可以在有限的空间(如一张图)传达无限的信息,更直观地展示数据之间的内在联系,利于信息的发现。[方法/过程]针对关联数据系统中实际产生的实例数据和本体结构这两类RDF数据,分别介绍一些适用于这两类数据形式的可视化技术和实现方法,并引用实际开发和研究中的成功案例进行阐述。[结果/结论]本文所提到的可视化实现方法具有一定的通用性,可以为其他关联数据应用系统的可视化提供指导和借鉴。  相似文献   

13.
[目的/意义] 分析和评估国家图书馆发布的关联数据集,以了解典型国家级资源的数据质量状况,为其他图书馆的数据发布和应用集成提供借鉴。[方法/过程] 在现有质量评估指标体系的基础上构建针对关联书目数据的质量评估框架和指标,通过人工调研和自动统计、分析方法对关联数据集的RDF词汇、URI有效性等7个指标进行统计和分析。[结果/结论] 5个国家图书馆发布的图书关联数据集在RDF词汇、著录项描述、信息关联等3方面显示出较为明显的一致性,在语法检测及URI的有效性检测等方面显示出国家图书馆数据的高质量。  相似文献   

14.
Document clustering of scientific texts using citation contexts   总被引:3,自引:0,他引:3  
Document clustering has many important applications in the area of data mining and information retrieval. Many existing document clustering techniques use the “bag-of-words” model to represent the content of a document. However, this representation is only effective for grouping related documents when these documents share a large proportion of lexically equivalent terms. In other words, instances of synonymy between related documents are ignored, which can reduce the effectiveness of applications using a standard full-text document representation. To address this problem, we present a new approach for clustering scientific documents, based on the utilization of citation contexts. A citation context is essentially the text surrounding the reference markers used to refer to other scientific works. We hypothesize that citation contexts will provide relevant synonymous and related vocabulary which will help increase the effectiveness of the bag-of-words representation. In this paper, we investigate the power of these citation-specific word features, and compare them with the original document’s textual representation in a document clustering task on two collections of labeled scientific journal papers from two distinct domains: High Energy Physics and Genomics. We also compare these text-based clustering techniques with a link-based clustering algorithm which determines the similarity between documents based on the number of co-citations, that is in-links represented by citing documents and out-links represented by cited documents. Our experimental results indicate that the use of citation contexts, when combined with the vocabulary in the full-text of the document, is a promising alternative means of capturing critical topics covered by journal articles. More specifically, this document representation strategy when used by the clustering algorithm investigated in this paper, outperforms both the full-text clustering approach and the link-based clustering technique on both scientific journal datasets.  相似文献   

15.
宁子晨  魏来 《图书情报工作》2020,64(12):106-117
[目的/意义] 专利文献与学术论文分别表现了技术创新与科学研究的新进展,通过专利主体将二者结合进行技术主题演化分析,对进一步发现专利技术与科学研究间的关系有一定的参考意义。[方法/过程] 以数据挖掘领域的学术型发明人为纽带,从专利主体-关键词耦合、IPC耦合以及IPC-关键词共现3个角度,提出关联方法并构建研究框架,分析不同时间段下主体、技术及主题多维关联关系的演化,探究数据挖掘领域内专利文献与学术论文的主体、主题关联关系。[结果/结论] 学术型发明人在数据挖掘技术创新中的作用越来越重要,大多主体的技术主题是相近的,部分甚至呈现高度的统一,但是也存在少数技术与主题不直接相关,差异度较大,但不论技术与主题是否直接相关,数据挖掘相关技术发明与科学研究都已经实现了较为深入的相互渗透。  相似文献   

16.
[目的/意义]针对当前我国高校机构知识库研究与应用离真正的开放互连、知识集成、知识检索还有较大差距的问题,提出一种面向关联数据的机构知识库构建方法,该方法覆盖机构知识库构建的整个过程,并支持机构知识的资源整合、语义检索、知识推理和关联数据发布,为各高校机构知识库建设提供参考。[方法/过程]调研和剖析国内外典型的机构知识库,将机构知识库构建方法分为5个步骤,包括:①评价和选择有价值的信息资源;②建立机构知识库概念模型;③进行语义描述和关联设置;④发现并创建关联化数据环境下的语义推理规则;⑤设计系统架构,并通过西南科技大学机构知识库构建实例来验证该方法的有效性。[结果/结论]实例验证表明,面向关联数据的机构知识库构建方法具有合理性和有效性,起到了降低机构知识库开发难度和缩短开发周期的作用,对于其他机构知识库的建设具有参考价值。  相似文献   

17.
文章基于利益相关者理论视角对科研数据开放共享进行研究,利用威勒模型对科研数据开放共享涉及的利益相关者进行角色定位分析,梳理利益相关者的利益诉求,构建科研数据开放共享的利益相关者互动关系图,厘清利益相关者间互动关系,提出促进科研数据开放共享的对策,激励科研数据共享的利益相关者积极参与共享,为科研数据的开放共享提供借鉴。  相似文献   

18.
[目的/意义]关联数据的研究对于数据资源的描述、组织、发布、检索、利用等具有重要意义。医学相关领域拥有庞大的数据规模和发达的数据共享实践,对该领域开放关联数据集进行系统的调查研究,对关联数据集的共享、管理、应用而言有重要的参考价值。[方法/过程]从平台分布、主题、格式、链入链出关系、所用词表等维度就医学相关领域的85个开放关联数据集进行调查及统计分析;从药物知识发现、语义关联搜索、智慧医疗建设等方面研究关联数据集的实际应用问题。[结果/结论]归纳医学相关领域开放关联数据集在科学研究和实践应用中的特点,以及在推动语义网发展和支持智慧医疗等方面的欠缺之处,以期促进对语义网、关联数据网络等关联数据发展与应用相关问题的进一步思考、探索和解决。  相似文献   

19.
The quality of metadata in open data portals plays a crucial role for the success of open data. E-government, for example, have to manage accurate and complete metadata information to guarantee the reliability and foster the reputation of e-government to the public. Measuring and comparing the quality of open data is not a straightforward process because it implies to take into consideration multiple quality dimensions whose quality may vary from one another, as well as various open data stakeholders who – depending on their role/needs – may have different preferences regarding the dimensions’ importance. To address this Multi-Criteria Decision Making (MCDM) problem, and since data quality is hardly considered in existing e-government models, this paper develops an Open Data Portal Quality (ODPQ) framework that enables end-users to easily and in real-time assess/rank open data portals. From a theoretical standpoint, the Analytic Hierarchy Process (AHP) is used to integrate various data quality dimensions and end-user preferences. From a practical standpoint, the proposed framework is used to compare over 250 open data portals, powered by organizations across 43 different countries. The findings of our study reveals that today’s organizations do not pay sufficient heed to the management of datasets, resources and associated metadata that they are currently publishing on their portal.  相似文献   

20.
采用定量统计方法,对Linked Open Data(LOD)中关联数据集的现状进行分析,认为现有的关联数据存在一定的问题,需要进一步绿色化。在界定绿色关联数据概念的基础上,将其要求分为内在质量、数据描述、数据关联、数据访问、数据生存5种类型,并描述每种类型所包含的具体要求。提出用工程化方法来生产和维护绿色关联数据,涉及数据需求分析、数据设计、数据测试、数据维护和数据工程管理等关键步骤。认为可建立数据更新通知机制和数据评价机制来进一步提高关联数据的绿化水平。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号