首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 456 毫秒
1.
[目的/意义]明确定义数据故事化的内涵与特征,正确理解数据故事与文学故事的区别,实现数据故事化的自动生成和工程化研发是推动数据故事化这一新研究领域的关键所在。[方法/过程]首先,在调查分析数据故事化领域的研究现状的基础上,提出了数据故事化的内涵与特征;其次,采用数据科学与数据工程方法提出数据故事的自动生成流程;最后,运用软件工程方法设计出数据故事的工程化研发的参考架构。[结果/结论]数据故事的自动生成流程的提出对于数据故事化领域的理论研究具有重要借鉴意义,而数据故事的工程化开发参考架构的设计为研发数据故事产品组件及培育产业生态系统具有较大的参考价值。  相似文献   

2.
[目的 /意义]针对实践中数据故事应包含哪些内容、创作流程是什么等问题,提出一种数据故事生成方法,以期为数据故事的创作提供理论指导。[方法 /过程]在前人的研究基础上,基于数据科学、认知科学、自然语言处理和可解释性机器学习等理论,提出一种面向局部可解释性机器学习的数据故事生成方法,该方法对数据故事的生成步骤和创作方式进行详细的阐述和说明。同时对LIME算法的输出进行改进,使其更易理解。在此基础上对提出的数据故事化方法进行案例实现,以验证方法的可行性。[结果 /结论 ]提出的数据故事生成方法有助于丰富数据故事化研究的理论体系,同时为数据故事的生成研究和数据故事化工具的研发提供一定的启示。  相似文献   

3.
[目的/意义]数据故事化是围绕数据构建叙事从而传递数据洞察的有效方式,目前有多种相关学科的关键技术能够为数据故事化过程尤其是数据故事的叙述过程提供支持,梳理数据故事叙述的支撑技术并设计技术框架对数据故事叙述阶段的实现具有重要价值。[方法/过程]本文首先论述了数据故事叙述的两种方式,分别为视觉叙述和文本叙述。接着构建了数据故事叙述过程的技术框架,并详细阐述了其在数据故事化中的应用。最后分析了数据故事化叙述的相关技术与工具的发展特点。[结果/结论]提出数据故事化的过程包括数据故事的生成和数据故事叙述,叙述阶段已有多种关键技术提供支持,而生成阶段的相关技术存在空白,并总结数据故事化叙述相关技术的六个发展特点。  相似文献   

4.
[目的/意义]基于数据故事本体模型提出一种语义描述及推理方法,旨在生成机器可理解的数据故事语义脚本,完整的数据故事产品能够利用此脚本生成。[方法/过程]首先,基于OWL本体的建模和知识表示方法设计数据故事的XML格式和RDF(S)格式的描述脚本。然后,基于SWRL定义数据故事的语义描述规则,论述数据故事化的语义描述及推理流程与关键任务。最后,以UCI breast-cancer数据集为数据来源,将存储在MySQL数据库中的数据故事内容转换为XML数据故事描述脚本和RDF(S)数据故事语义描述脚本,并使用推理方法标记数据故事的要素及关系。[结果/结论 ]定义包含故事要素、故事要素关联以及故事实例的数据故事脚本,划分出数据故事语义描述与推理的流程以及形式化表示活动中的关键任务,并提出可操作的面向数据故事化的语义描述和推理方法。  相似文献   

5.
[目的/意义]数据故事化评价是监控数据故事化过程、衡量其效果、保障和提升其质量的关键目前,国内外关于数据故事化评价的研究较少,本研究可为今后相关研究提供参考。[方法/过程]本文的评价方法分为基于过程的评价和基于结果的评价。其中基于过程的评价采用软件能力成熟度模型,将数据故事化划分为数据准备、数据分析、故事建模、故事描述和故事呈现五个阶段,并根据具体实施需要定义了过程评价的阶段参考特征和改进方向;基于结果的评价,则是以本文提出的基于结果的评价模型为基础,从受众和使用者视角对个人的接受度和持续接受度进行评价,最后以评价结果为依据提出了改进流程[结果/结论]本文提出的评价方法能够在一定程度上帮助组织在开发过程中把握产品痛点,提升开发能力。同时也可以解释和预测个人的接受意向,为下一步的营销推广活动提供依据。  相似文献   

6.
[目的/意义]可视故事化在实践中正被越来越多地应用,特别是在网络平台,梳理并归纳可视故事化的特征、方法与应用对于数据可视化的进一步发展以及数据科学跨学科融合具有重要的理论价值与现实意义。[方法/过程]首先系统地梳理了可视故事化的特征,接着通过多个实践案例分析了可视故事化的不同类型,揭示了可视故事化的实现方法,并描述了不同应用设计上的差异,[结果/结论]研究发现交互式可视化研究、理论模型、理论研究重点和专用开发工具需要进一步深化以推动可视故事化的研究进展。  相似文献   

7.
[目的/意义]开展数据对象可溯源性保障研究,可降低大数据时代所凸显的跨领域、海量、异构和动态数据的失信风险,有助于自动化实现数据质量评价、数据审计及数据恢复等问题。[方法/过程]基于数据溯源、密码编码学等理论,以数据对象为操作单位,提出一种新的数据对象版本号计算方法;进一步提出了数据对象DNA的概念及其生成和回溯方法,并探讨其IT实现及应用。[结果/结论]本文提出统一溯源新方法数据对象DNA,具有易生成、防篡改、普适性强等特点,可应用于数据对象的世系检验和数据连续性自动审计等场景。  相似文献   

8.
[目的/意义] 数据故事化实现数据、可视化与叙事的关联融合,有利于公众感知及认知复杂数据,提高数据重用率。[方法/过程] 通过提取新华网260个数据新闻故事题目并提炼高频词,确定27个卫生健康类热点数据新闻故事。根据扎根理论并采用质性分析软件NVivo11对热点数据新闻进行三级编码,最终得到数据新闻实践的11个初始范畴,并凝练出6个主范畴。[结果/结论] 得出数据故事化实践路径的理论模型及特征。数据故事可用于知识发现、数据解读、服务增值等方面。  相似文献   

9.
[目的/意义]探讨网络行为数据适用性的意涵、影响因素和评估方法,为相关研究提供参考,以促进此类数据的科学使用。[方法/过程]利用文献法梳理出网络行为数据适用性的核心影响因素,进而以此为基础,结合情报素材评估和社会调查数据评估领域的已有成果,探索如何对网络行为数据的适用性进行评估。[结果/结论]最终提出符合网络行为数据特征的适用性评估框架与方法,并结合案例初步验证所提方法的可用性。  相似文献   

10.
[目的/意义] 对开放政府数据价值的相关研究成果进行总结和梳理,形成较为完整的文献综述,为国内该领域的未来研究提供参考。[方法/过程] 通过文献计量与内容分析描绘开放政府数据价值研究领域的文献分布状况,对现有研究成果进行全面梳理与评价,并提出未来研究方向。[结果/结论] 学界目前对开放政府数据价值的研究主要集中于价值类型、价值生成机制以及价值测量3个方面。多数研究停留于探讨开放政府数据的预期价值,缺乏对预期价值的实证验证;缺乏对利用和效果之间的因果关系的检验;对价值生成机制和价值测量的研究不足。建议未来研究更多关注本土实践,从多学科视角出发,加强开放政府数据价值相关理论与实证研究。  相似文献   

11.
[目的/意义]数字化浪潮催生了类型繁多的海量文化遗产大数据,合理的分类已经成为文化遗产大数据科学管理与有效利用的关键。[研究设计/方法]根据文化遗产与大数据的基础理论提出了文化遗产大数据的概念及特征,并采用文献调研法对文化遗产数据分类现状进行探讨。[结论/发现]分类焦点应从具体类别的文化遗产信息向文化遗产大数据这一类资源整体转变;同时,现有分类体系中出现的维度单一、粒度粗糙、类目设置不严谨等问题也亟需解决。[创新/价值]采用组配分类法,以文化遗产大数据为研究对象,以文化遗产领域特征和数据特性为切入点,提出了基于文化遗产领域特征与数据特性的二维分类框架。  相似文献   

12.
[目的/意义]探讨构建与发布中文馆藏书目资源关联数据集的方法与路径,以推动其朝网络化、语义化和国际化方向发展。[方法/过程]在阐释以RDA和BibFrame为引导的国际编目领域全面转型基础上,从中文书目资源关联组织模型设计、CNMARC元素的自动拆分与转化等4个层面深入探讨中文书目资源关联数据化转型中存在的核心问题,并以国鼎图书室书目资源为例,构建发布中文书目资源关联数据集。[结果/结论]在利用BCOM模型进行资源关联组织基础上,提出中文书目资源关联数据集的构建与发布流程。  相似文献   

13.
贾君枝  冯婕 《图书情报工作》2017,61(12):122-128
[目的/意义] 挖掘不同名称数据之间的关联关系,将关于某一实体或主题的领域知识表现出来,这对实现不同层次、不同粒度的知识体系的解构和重构、提供满足多种需求的知识服务工作具有重要的研究意义。[方法/过程] 提出一种基于人物实体数据运行关联规则挖掘实验的研究框架,通过对人物实体条目的抽取、预处理及属性识别与分类等处理方法,利用R语言得到人物实体集的关联规则,实现多种名称数据的关联,最后从Wikidata知识库提取113位诺贝尔文学奖得主的实体条目进行实证分析。[结果/结论] 分析右部为地点名称、机构名称、时间名称和主题名称等4种不同类型规则的关联特征,实现不同名称数据类型的关系挖掘问题。本研究可为知识的揭示、聚合和关联提供新的视角,探索了数据挖掘技术在名称数据中的应用。  相似文献   

14.
[研究/目的 ]掌握政府数据开放(Open Government Data,OGD)核心能力的生成演化过程及影响因素,为核心能力构建找到关键点和发力方向。[研究/方法 ]基于知识发酵模型,分析OGD核心能力生成演化过程,围绕OGD知识发酵六要素提炼供需双方在核心能力生成演化中的影响因素,并通过DEMATEL法识别其关键因素。[研究/结论 ]OGD核心能力生成演化中,知识环境、知识酶、知识母体是关键影响因素,并由此提出营造良好知识环境、完善知识酶催化机制、提升参与主体知识水平的具体建议。  相似文献   

15.
国内图书馆界小数据研究进展   总被引:1,自引:1,他引:0  
曹霞 《图书情报工作》2020,64(14):145-151
[目的/意义] 系统梳理归纳我国图书馆界小数据领域的研究进展,提出未来我国图书馆界小数据研究领域值得关注的问题,为未来我国图书馆界小数据研究领域的拓展提供参考。[方法/过程] 以CNKI为样本来源库,检索并整理国内在2015年1月至2019年9月间发表的全部学术文献,运用内容分析法对文献作系统梳理分析,重点从小数据内涵、图书馆小数据内涵、小数据为图书馆带来的机遇与挑战、基于小数据的服务模式、基于小数据的服务模型和图书馆应用小数据的策略6方面进行深度剖析。[结果/结论] 国内图书馆界对小数据的研究具有对小数据及其在图书馆中的运用研究十分敏感、重视度不断提高、尚未形成核心作者和核心团队、研究主体集中和重理论轻实践等特点。未来国内图书馆界对小数据的研究应注重理论与实践相结合、加强小数据运用的评价、提升与其他学科的交流与合作。  相似文献   

16.
丁文姚  李健  韩毅 《图书情报工作》2019,63(22):118-128
[目的/意义] 探索期刊论文科学数据引用特征与规律不仅有助于描述学科领域对科学数据的利用情况,还能够揭示学术成果表达中的数据引用模式。[方法/过程] 以我国图书情报领域6种期刊2017年与2018年第一期刊载论文为样本,结合国家标准《信息技术科学数据引用》的引用元素,采用内容分析法从9个维度对样本论文的科学数据引用行为进行数据编码,应用统计学方法描述图书情报领域期刊论文科学数据引用特征并探索不同维度特征间的关联关系。[结果/结论] 图书情报领域期刊论文广泛引用来自国内外的统计整理类科学数据,对期刊论文中个人研究科学数据的引用量较大;科学数据引用标注方式与科学数据类型存在一定对应关系,但多样化的标注方式缺乏统一性;二手引用现象较为突出,二手引用程度与科学数据创建者类型相关。  相似文献   

17.
[目的/意义]推进国内科研数据管理体系的发展,明确三大研究内容和数据知识库的基础理论研究。[方法/过程]采用实证研究方法,分析对比国内外科研数据管理的研究现状,详细探讨科研数据管理领域的基础研究和技术论证。[结果/结论]明确指出构建科研数据管理体系的基础研究三大内容,即为科研活动周期和数据生命周期、数据知识库的理论框架和流程研究、数据知识库的技术论证。同时提出管理体系的系统建设方案和机制建设方案。  相似文献   

18.
[目的/意义]数据是数字人文研究的基础和核心之一,图书馆人文数据组织与重构不但能提高数字资源的利用率,而且能拓展图书馆人文数据服务,可极大地促进数字人文科学的发展,也是图书馆知识型专业服务的具体体现,有利于提供更高层次领域的服务。[方法/过程]分析数字人文研究中的人文数据特点及人文学者研究对人文数据的需求,认为图书馆需从人文数据的完整性、可计算性、可用性及重用性、可发现以及获得性等角度出发进行人文数据组织与重构。[结果/结论]要克服人文数据碎片化带来的零散、不系统的弊病,必须采用数据复原与重构的方式恢复或重建人文数据所蕴含的知识之间的联系,采用数据化、数据融合、数据关联及发布等手段,最终实现知识单元的精细粒度化、知识组织的语义化、知识呈现的可视化。  相似文献   

19.
[目的/意义]信息资源时代下,数据类型多元化特征显著,透析数据结构化过程中蕴含的目录学思想,有助于解决非结构化数据管理与利用的难题。[研究设计/方法]首先辨析数据结构化的本质过程,并揭示其中蕴含的目录学机理和标引分类思想,说明用目录学思想指导数据结构化过程的可行性,并借由目录工作运用的文献揭示、书目索引编纂、文献标引分类、文献组织等传统方法,解析不同类型非结构化数据的特点,指导其关联整合、索引指示、标引分类、组织重构等主要结构化过程,最终实现非结构化数据的“辨章学术、考镜源流”。[结论/发现]数据结构化基本承袭了以分类标引等为核心的书目思想,在本质上是作为致用之学的目录学在当下环境的延续和发扬。[创新/价值]有助于制定数据结构化过程的范式流程,增强非结构化数据结构化解析过程的复用性。  相似文献   

20.
[目的/意义]以故事线梳理史实脉络,不仅对于描绘与把握历史发展方向具有一定的理论和现实指导意义,同时也为人文领域的知识发现提供新的技术实现方式和创新性研究视角.[方法/过程]提供一种基于文本数据的故事线构建及可视化、情感化、场景化的研究范式,通过爬梳《张学良口述历史》文本作为数据源进行实证探索.采用jieba分词对《张...  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号