首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 890 毫秒
1.
数据科学视角下数据溯源研究与实践进展   总被引:1,自引:0,他引:1  
真实性和可靠性是当前各领域对数据的根本要求,基于数据溯源实现数据的质量控制与可信管理具有重要的研究价值和实践意义。数据溯源不仅是一个技术问题,同时也是一个管理问题,在数据科学范式下应当受到信息资源管理研究的关注和重视。鉴于此,本文结合相关领域的最新研究进展,系统阐述了数据溯源的概念发展与内涵;梳理了面向数据溯源管理的信息描述模型、通用表达模型、领域应用模型、安全管理模型与区块链溯源管理模型;描述了关系数据库、科学工作流、大数据平台、云计算和区块链等典型应用环境下的数据溯源计算方法。此外,本文还重点分析了数据溯源在数字图书馆、档案信息管理、网络信息资源管理、科学数据共享管理及电子商务信息系统等信息资源管理研究领域中的应用价值与相关实践,并对数据溯源技术方法、标准规范、信息安全、区块链融合以及模型扩展验证等方面的发展进行了展望,以期为数据管理和数据科学领域的研究人员提供参考。参考文献136。  相似文献   

2.
以人物数据为中心,探索卓越科学家语义描述和关联发现的技术实现路径。利用Sesame对数据进行存储管理,发布语义数据,实现围绕卓越科学家的搜索发现。从学科领域、奖项、组织机构、科研成果、地理位置等多个维度挖掘卓越科学家的关联信息,实现了卓越科学家数据的关键词检索,对外提供WebService,通过人物中心节点图和人物地图可视化地显示卓越科学家数据的语义关联。  相似文献   

3.
常颖聪  何琳 《图书情报工作》2015,59(13):117-125
[目的/意义] 科学实验数据组织现状混乱、丢失现象频繁,严重阻碍科学数据的保存、复用以及公开获取,因此构建规范的科学实验元数据模型对实验数据的组织、保存、检索、复用等有重大的现实意义。[方法/过程] 首先通过文献调研对现有科学实验元数据集进行总结;其次以植物学基因表达实验为例,通过用户访谈对实验室数据组织现状以及实验操作流程、特点等进行调查总结,初步构建植物学基因表达实验元数据描述方案;最后通过德尔菲法对元数据元素集进行打分、评估、筛选、确立。[结果/结论] 构建基于科学实验数据生命周期的植物学基因表达实验元数据模型,能够完整描述包含实验设计、实验数据等在内的科学实验基础信息,同时包括科研成果、数据访问等信息;基于该元数据模型不仅便于科学实验数据的组织,还有利于科学实验数据公开获取以及科研成果的追溯,为不同类型科学数据语义化关联提供支撑。  相似文献   

4.
[目的/意义]梳理并分析国外关于数据科学家能力体系的相关研究,为我国构建数据科学家能力体系提供参考借鉴,既有利于提高数据科学人才培养效率,也有益于满足数据科学家职业发展的需要。[方法/过程]选取主要国家(地区)的典型数据科学家能力研究成果,解读分析其中的能力框架与要素,探讨目前国外数据科学家能力体系的研究方法、数据科学家职业准入条件以及信息环境变化对数据科学家能力的影响。[结果/结论]国外数据科学家能力体系的建设值得借鉴。我国应该尽快构建数据科学家能力框架,明确数据科学家的培养目标与职业发展路径;通过顶层设计、多方协同,加强数据科学专业人才培养;强调理论知识与实践能力并重,注重数据科学家的在职技能拓展。  相似文献   

5.
关联数据在网络信息管理中的应用   总被引:1,自引:0,他引:1  
互联网的发展产生了大量的各种类型的信息,但由于传统网络数据的发布格式缺乏结构和语义,造成了网络上大多数文档和数据的孤立。关联数据作为一种新的网络数据发布方式,通过RDF(资源描述框架)构建数据模型,通过URI(统一资源标识符)命名数据实体,发布有关联的互联网信息,使用HTTP协议获取这些相互关联的信息,实现互联网信息的语义整合,实现关联数据浏览器和搜索引擎的应用,使计算机能够更加智能化地帮助人们组织和管理信息。  相似文献   

6.
互联网的发展产生了大量的各种类型的信息,但由于传统网络数据的发布格式缺乏结构和语义,造成了网络上大多数文档和数据的孤立。关联数据作为一种新的网络数据发布方式,通过RDF(资源描述框架)构建数据模型,通过URI(统一资源标识符)命名数据实体,发布有关联的互联网信息,使用HTTP协议获取这些相互关联的信息,实现互联网信息的语义整合,实现关联数据浏览器和搜索引擎的应用,使计算机能够更加智能化地帮助人们组织和管理信息。  相似文献   

7.
数据治理——图书馆事业的发展机遇   总被引:1,自引:0,他引:1  
数据驱动发现成为一种新的科学进步路线,产生了新的知识服务对象:愈加重视数据的科学家和工程师、数据科学家、数据工程师、数据分析师、公民科学家等。数据获取需要依靠国家的行政命令、资助机构的政策、研究机构和大学的管理办法等。数据共享存在于不同学科,而且已具备了基础设施,诸如:数据中心、数据云、数据知识库与数据期刊、信息技术中心、数字资源中心等。数据重用需要公共部门、企业、公众、利益相关方在“尽可能地开放,尽责任地封闭”前提下,采取协调一致的行动。在这里,数据馆员扮演重要角色。数据治理生态体系需要图书馆执行数据获取、数据共享、数据重用的政策。通过不断寻找和搜集最佳实践案例,图书馆可以支持数据治理。参考文献79。  相似文献   

8.
新冠肺炎疫情暴发以来,大数据在疫情防控的流调、溯源等工作中的作用凸显。数据是信息的表现形式和载体,它作为新型生产要素,已快速融入生产、分配、流通、消费和社会服务管理等各个环节,成为数字化、网络化、智能化的基础,是推动我国经济发展的新引擎。2022年12月19日,中共中央、国务院发布《关于构建数据基础制度更好发挥数据要素作用的意见》(以下简称“数据20条”),提出构建数据基础制度体系、促进数据规范流通的20条政策举措。档案信息作为重要的数据资源,理应在“数据20条”的政策覆盖范围内。  相似文献   

9.
关联数据特点及发布研究   总被引:3,自引:0,他引:3  
研究了关联数据的特点、类型,分析了关联数据的发布基础和发布方法。以宁波市数字图书馆服务外包产业信息门户关联数据应用为例,研究了关联数据发布与应用的架构,并以专业人才关联数据发布为例分析了关联数据发布和应用的实现方法,为关联数据的实践应用提供借鉴。  相似文献   

10.
E—science关注数字环境下的科研活动,然而随着生物医学大数据的爆发,数据密集型科学研究为e·Science~来了新的挑战。科学工作流通过形式化科学计算的流程,支持在一个专门的程序环境下自动协调多任务多步骤的处理,从而减少科研投入,提高科研效率。文章首先归纳筑总结了科学工作流的相关定义,然后分析了当前主流的科学工作流系统,提出科学工作流处理如何应对密集的生物医学数据,并基于Taverna开展了生物医学领域的科学工作流实验。最后总结了科学工作流当前的研究现状和存在的一些问题。  相似文献   

11.
使用关联数据标准发布图书馆数据,有助于图书馆信息的公开、复用和传播,关联数据所具备的技术特征也极其适用图书馆数据管理系统的更新换代,克服现存数据格局的缺陷。文章重点分析了图书馆数据利用关联数据发布标准进行发布的优势、使用原则、数据保障以及所产生的变化。  相似文献   

12.
杨剑 《图书情报工作》2014,58(4):111-116
语义关联数据网中,可互操作溯源是建立语义信任的关键手段,这在国际学术研究组织中一直是热点研究问题,W3C溯源工作小组也推出了PROV模型,以解决统一的溯源信息发布和访问问题。通过从溯源粒度、溯源状态性、溯源之溯源、自动化发布、可互操作溯源与隐私等方面的分析研究,深入阐述构建语义关联数据网可互操作溯源中的规划和技术问题,提出实践准则,为后续应用实践打下基础。  相似文献   

13.
文章以现有的研究为基础,将信息需求动机的溯源划分为心理导向溯源、任务导向溯源和信息素养导向溯源三个方面,同时进一步细分了各“溯源”的维度,据此对信息需求动机的“溯源”问题进行了深入探讨.  相似文献   

14.
[目的/意义]开展数据对象可溯源性保障研究,可降低大数据时代所凸显的跨领域、海量、异构和动态数据的失信风险,有助于自动化实现数据质量评价、数据审计及数据恢复等问题。[方法/过程]基于数据溯源、密码编码学等理论,以数据对象为操作单位,提出一种新的数据对象版本号计算方法;进一步提出了数据对象DNA的概念及其生成和回溯方法,并探讨其IT实现及应用。[结果/结论]本文提出统一溯源新方法数据对象DNA,具有易生成、防篡改、普适性强等特点,可应用于数据对象的世系检验和数据连续性自动审计等场景。  相似文献   

15.
2018年3月国务院发布《科学数据管理办法》,强调科研机构作为科学数据管理的责任主体,应部署本机构科学数据的管理与服务体系。科研资助机构数据政策为科研机构明确了管理科学数据的过程中需要完成的任务与目标,可以有效推进科研机构的科学数据管理实践。按照科学数据管理流程的核心环节,系统分析并梳理国际科研资助机构的数据政策,将政策要求转化为科研机构在数据管理核心环节的职责与任务,以为我国科研机构有效部署科学数据管理工作提供参考。  相似文献   

16.
本文从航空产品数据重要性及归档现状入手,分析航空产品数据质量控制的紧迫性;引入数据供应链的概念并分析在航空产品数据管理中的适用性。通过分析档案数据质量评价指标以及数据供应链的作用,提出运用数据供应链对航空产品数据归档质量进行评价。以数据供应链PROV数据溯源模型为基础,构建包含安全层、运行层和建链层的航空产品档案数据质量控制体系。  相似文献   

17.
林英 《图书馆论坛》2012,32(5):70-73,64
针对媒体新闻数据库建设中数据的质量控制,结合数据库运作实践中遇到的问题,提出建立数据源媒体筛选标准、数据源数据筛选标准和数据著录规范时应遵循的原则和基本要求,以及操作过程中质量控制的实现方法,以不断提高数据质量,保持数据库系统稳定运行,促进资源共享,更好地满足信息服务需要,推动图书馆事业的可持续发展.  相似文献   

18.
一、大数据背景下档案服务面临的挑战(一)如何在海量数据中查询到所需要的档案信息。随着档案信息化建设的不断推进以及数据量的进一步增大,在进行档案查询时,往往需要的信息会被埋没在大量的不需要的数据中,并且检索性能急剧下降,甚至无法响应。因此,如何在大量的档案中快速而准确地找到所需的信息,是档案服务要解决的首要问题。(二)如何在海量数据中抽取和挖掘有用的信息和知识。依靠人工抽取、挖掘知识,在传统纸质档案时代、档案数量不多的情况下还可实行,但在大数据时代海量档案存在、非结构化数据盛行的今天则会变得心有  相似文献   

19.
新媒体时代数据新闻火爆。无论是专业媒体还是新型的自媒体,都在用数据新闻进行新闻信息产品的生产。笔者通过数据新闻溯源,发现数据新闻是传统精确新闻在互联网时代下的发展与进化,在这种条件下,数据新闻以其同时满足专业媒体重掌舆论引导权以及满足受众参与、对新鲜形式的新闻产品的需要迅速发展起来。但于此同时,也应当看到,由于技术原因的限制,数据新闻目前在有温度的关乎人情、人性的新闻生产方面还存在一定缺陷,并且关于数据获取与开发上在法律层面也存在争议。因此一面要注意对数据新闻的正确定位,一面也要注意数据新闻中对数据开发的合理化和合法化。  相似文献   

20.
[目的/意义] 为解决现有网页文本缺乏起源标注的问题,提出一种借助PROV本体发现相似网页文本起源关系的方法。[方法/过程] 通过聚类算法、自动语义标注和关联数据构建等技术的综合应用,结合PROV-POL溯源模型,检测网页文本实体的演变过程,实现文本级和属性级两级溯源方案。[结果/结论] 实验验证了借助语义网技术和数据溯源模型实现网页文本数据溯源的可行性,但实验过程中聚类算法的召回率有待提高。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号