首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到16条相似文献,搜索用时 140 毫秒
1.
[目的/意义] 为解决现有网页文本缺乏起源标注的问题,提出一种借助PROV本体发现相似网页文本起源关系的方法。[方法/过程] 通过聚类算法、自动语义标注和关联数据构建等技术的综合应用,结合PROV-POL溯源模型,检测网页文本实体的演变过程,实现文本级和属性级两级溯源方案。[结果/结论] 实验验证了借助语义网技术和数据溯源模型实现网页文本数据溯源的可行性,但实验过程中聚类算法的召回率有待提高。  相似文献   

2.
数据科学视角下数据溯源研究与实践进展   总被引:1,自引:0,他引:1  
真实性和可靠性是当前各领域对数据的根本要求,基于数据溯源实现数据的质量控制与可信管理具有重要的研究价值和实践意义。数据溯源不仅是一个技术问题,同时也是一个管理问题,在数据科学范式下应当受到信息资源管理研究的关注和重视。鉴于此,本文结合相关领域的最新研究进展,系统阐述了数据溯源的概念发展与内涵;梳理了面向数据溯源管理的信息描述模型、通用表达模型、领域应用模型、安全管理模型与区块链溯源管理模型;描述了关系数据库、科学工作流、大数据平台、云计算和区块链等典型应用环境下的数据溯源计算方法。此外,本文还重点分析了数据溯源在数字图书馆、档案信息管理、网络信息资源管理、科学数据共享管理及电子商务信息系统等信息资源管理研究领域中的应用价值与相关实践,并对数据溯源技术方法、标准规范、信息安全、区块链融合以及模型扩展验证等方面的发展进行了展望,以期为数据管理和数据科学领域的研究人员提供参考。参考文献136。  相似文献   

3.
[目的/意义]FAIR科学数据管理原则在医学领域的应用有助于增强医学数据的可发现、交互、共享与重用。评估FAIR实施情况有利于指导医学科学数据开放平台规范元数据描述,明确溯源及共享机制,完善数据管理规范。[方法/过程]通过借鉴Go FAIR Metric Group(GFMG)的通用框架、荷兰数据存档与网络服务DANS、欧盟Horizon 2020、澳大利亚研究数据共享组织ARDC和澳大利亚联邦科学与工业研究组织CSIRO开发的5 Star Data Rating Tool的FAIR评估框架及其指标,制定面向我国医学科学数据开放平台的FAIR原则应用评估框架。基于该框架,选定我国11个样本平台开展网络调研,从可发现(Findable)、可访问(Accessible)、可互操作(Interoperable)和可重用(Reusable)4个维度分析调研结果。最后从标识符、元数据、许可协议、词表规范、溯源描述等方面提出我国医学科学数据开放平台应用FAIR原则的建议。[结果/结论]FAIR原则在我国医学科学数据开放平台的应用有待进一步拓展,尤其是在永久性标识符的使用和遵循标准开展溯源描述方面。  相似文献   

4.
[目的/意义]FAIR科学数据管理原则在医学领域的应用有助于增强医学数据的可发现、交互、共享与重用。评估FAIR实施情况有利于指导医学科学数据开放平台规范元数据描述,明确溯源及共享机制,完善数据管理规范。[方法/过程]通过借鉴Go FAIR Metric Group(GFMG)的通用框架、荷兰数据存档与网络服务DANS、欧盟Horizon 2020、澳大利亚研究数据共享组织ARDC和澳大利亚联邦科学与工业研究组织CSIRO开发的5 Star Data Rating Tool的FAIR评估框架及其指标,制定面向我国医学科学数据开放平台的FAIR原则应用评估框架。基于该框架,选定我国11个样本平台开展网络调研,从可发现(Findable)、可访问(Accessible)、可互操作(Interoperable)和可重用(Reusable)4个维度分析调研结果。最后从标识符、元数据、许可协议、词表规范、溯源描述等方面提出我国医学科学数据开放平台应用FAIR原则的建议。[结果/结论]FAIR原则在我国医学科学数据开放平台的应用有待进一步拓展,尤其是在永久性标识符的使用和遵循标准开展溯源描述方面。  相似文献   

5.
[目的 /意义]针对实践中数据故事应包含哪些内容、创作流程是什么等问题,提出一种数据故事生成方法,以期为数据故事的创作提供理论指导。[方法 /过程]在前人的研究基础上,基于数据科学、认知科学、自然语言处理和可解释性机器学习等理论,提出一种面向局部可解释性机器学习的数据故事生成方法,该方法对数据故事的生成步骤和创作方式进行详细的阐述和说明。同时对LIME算法的输出进行改进,使其更易理解。在此基础上对提出的数据故事化方法进行案例实现,以验证方法的可行性。[结果 /结论 ]提出的数据故事生成方法有助于丰富数据故事化研究的理论体系,同时为数据故事的生成研究和数据故事化工具的研发提供一定的启示。  相似文献   

6.
[目的/意义] 对国外基于"数据资产框架(DAF)"的机构数据资产审计理论和实践进行调研分析,以为我国开展数据资产审计提供指导和借签。[方法/过程] 通过文献调研、网络调研,对JISC资助的DAF和国外基于DAF的数据资产实践进行总结,详细解析DAF在开展机构数据资产审计中的应用,得出对我国开展机构数据资产审计的启示。[结果/结论] DAF框架是一个通用的、系统的框架,基于DAF的机构数据资产审计能较完整地发现机构的数据资产。DAF框架可为我国开展机构数据资产审计提供参考方向,规范数据审计行为,避免在审计时产生错误和遗漏资产信息。  相似文献   

7.
[目的 /意义]探析数据向善的本质内涵与边界,对其实现的驱动因素进行挖掘,以帮助我国数字生态实现常态化数据向善发展。[方法 /过程]通过理论溯源探求数据向善的内在要素与范畴,界定其本质概念,之后使用ISM模型分析数据主体采取数据向善行为的驱动因素,最后剖析数据向善实现的困境与未来。[结果 /结论 ]研究发现驱动数据主体采取数据向善的动因可以分为核心动因、间接动因与表层动因,选择合适的驱动因素是实现数据向善的关键。在未来如果想要在社会层面上普及数据向善,需要从行规、法律、市场环境等多个维度出发。  相似文献   

8.
越来越多的科学家使用工作流系统设计和运行科学实验。工作流执行的结果数据集可能需要与报告或论文一起发布,以为其他科学实验的输入重复使用。此时,数据的正确性需要被验证,要求科学家在发布数据的同时发布其溯源元数据,包括数据的演变历史、起源和所有权。为协助科学家完成这一任务,文章建立了一个工作流实例,在此基础上,探讨工作流管理系统运行时溯源信息的收集,指出原始溯源信息在支持数据发布任务时的缺陷,提出了一种提纯溯源的方法来获得适合于数据发布任务的溯源信息。  相似文献   

9.
[目的/意义]对图书馆数据形态演变情况进行探讨,以了解各种形态下图书馆数据研究的重点及未来研究方向。[方法/过程]在考察OCLC的4个数据科学项目及其反映出的3种数据表现形式的基础上,将图书馆数据形态分为原生形态、聚合形态、扩展形态、关联形态、知识形态等5种类型。[结果/结论]不同的图书馆数据形态有着不同的数据加工深度和广度。可通过多源聚合、内生与外联、关联数据化、知识三元组抽取与融合等途径实现5种数据形态之间的有序演变。  相似文献   

10.
[目的/意义] 针对当前国内在政府数据开放过程中的资源描述问题,提出四层结构的资源描述方法,满足政府开放数据资源描述要求,加快政府开放数据进程。[方法/过程] 在分析政府数据开放特点下的描述要求的基础上,引入DC、VoID、DCAT等元数据标准对数据资源进行目录描述、数据集描述、关联描述和访问描述。[结果/结论] 该描述方法可以为开放后的数据共享、查找、管理等提供有效的支持,帮助实现真正意义上的政府数据开放。  相似文献   

11.
[目的/意义]构建文化遗产数字基础设施既是保护传承文化遗产的重要手段,又是开放科学环境下支撑新的研究范式的重要保障。[方法/过程]本研究以德国国家文化遗产科研数据基础设施建设项目NFDI4Culture为研究对象,从建设内容、核心问题、组织结构到运行机制进行了分析。[结果/结论]研究发现,NFDI4Culture项目以建设科研数据基础设施的方式进行文化遗产数字化,具有协同合作、标准统一,并且建立全数据生命周期生态系统的特点。本研究在结尾给予我国图书馆/信息机构进行相关工作给予建议。  相似文献   

12.
[目的/意义]介绍Make Data Count与COUNTER联合推出的《研究数据使用统计实施规范》,为数据级别计量提供新指标与新视角。[方法/过程]通过对标准文本的分析,介绍该规范的提出背景、目标、范围、相关概念及核心内容,通过案例剖析Dash、DataONE、Zenodo及其他7个数据存储库对《规范》的应用情况。[结果/结论]研究数据的使用统计具有其独特之处,《规范》的推出可对数据引用及数据替代计量形成补充进而描述完整的科研学术影响力。目前遵循该规范的数据存储库还不多,为推动数据使用计量的应用,需要标准组织、科研人员、机构库及数据存储库、出版商、科研机构及资助机构、图书馆等不同利益相关者在数据产生、管理、传播与利用等环节的相互合作。  相似文献   

13.
[目的/意义] 比较分析数据管理与数据治理差异与联系,为制定科学数据开放共享政策提供参考。[方法/过程] 运用比较分析法,解析数据管理与数据治理在定义与内涵、功能、目标、原则、焦点领域5个方面的异同,由此解析其对制定我国科学数据开放共享政策的启示。[结果/结论] 数据管理与数据治理在定义与内涵、功能、目标、原则、焦点领域上都有显著差异,但两者也有内在联系。数据治理是成功实施数据管理的关键。认清两者的关系有助于明晰目前我国科学数据管理政策的不足之处,为今后完善科学数据管理办法提供参考,从而规划与制定实用的科学数据开放共享细则。  相似文献   

14.
[目的/意义] 在数据驱动范式情境下,揭示政府门户网站开放数据状态及其主体行为状态之间的内部关联,推动政府数据开放效果和进程。[方法/过程] 采用爬虫方法抓取上海市政府数据门户网站中各开放数据集,在对各数据集指标进行相关分析的基础上,采用Stepwise探索其回归关系,筛选得出关联度较高的变量;进一步对关系显著的变量进行PLS回归检验,得出政府开放数据状态与其主体行为状态的内部关联。[结果/结论] 在政府数据开放进程中,政府部门的主体行为比数据自身的客体特征对公众主体行为的影响更大。在影响公众评分的因素中,政府开放保密级别的影响因子最大,且具有显著负向影响作用;政府更新频率、政府首次开放时间、数据格式可机读性对公众评分具有显著正向影响作用。  相似文献   

15.
[目的/意义] 比较分析数据管理与数据治理差异与联系,为制定科学数据开放共享政策提供参考。[方法/过程] 运用比较分析法,解析数据管理与数据治理在定义与内涵、功能、目标、原则、焦点领域5个方面的异同,由此解析其对制定我国科学数据开放共享政策的启示。[结果/结论] 数据管理与数据治理在定义与内涵、功能、目标、原则、焦点领域上都有显著差异,但两者也有内在联系。数据治理是成功实施数据管理的关键。认清两者的关系有助于明晰目前我国科学数据管理政策的不足之处,为今后完善科学数据管理办法提供参考,从而规划与制定实用的科学数据开放共享细则。  相似文献   

16.
[目的/意义] 初步论述信息安全界理论前沿,论述威胁情报及其相关热点问题,试图引入新的情报概念,开拓情报研究新的领域。[方法/过程] 通过文献调研、内容分析和归纳演绎,梳理出威胁情报的主要特点、基础性技术、实践现状与趋势、重要意义和未来研究方向。[结果/结论] 威胁情报:①将成为情报研究新的热点;②具有应用范围广泛、紧密跟踪和可用于信息安全管理决策的特征;③对国家信息安全管理和国家情报要素研究均具有重要意义;④与其相关的数据管辖与隐私保护、情报共享等问题将成为未来的研究重点。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号