首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 31 毫秒
1.
[目的/意义]明确定义数据故事化的内涵与特征,正确理解数据故事与文学故事的区别,实现数据故事化的自动生成和工程化研发是推动数据故事化这一新研究领域的关键所在。[方法/过程]首先,在调查分析数据故事化领域的研究现状的基础上,提出了数据故事化的内涵与特征;其次,采用数据科学与数据工程方法提出数据故事的自动生成流程;最后,运用软件工程方法设计出数据故事的工程化研发的参考架构。[结果/结论]数据故事的自动生成流程的提出对于数据故事化领域的理论研究具有重要借鉴意义,而数据故事的工程化开发参考架构的设计为研发数据故事产品组件及培育产业生态系统具有较大的参考价值。  相似文献   

2.
[目的/意义]数据故事化是围绕数据构建叙事从而传递数据洞察的有效方式,目前有多种相关学科的关键技术能够为数据故事化过程尤其是数据故事的叙述过程提供支持,梳理数据故事叙述的支撑技术并设计技术框架对数据故事叙述阶段的实现具有重要价值。[方法/过程]本文首先论述了数据故事叙述的两种方式,分别为视觉叙述和文本叙述。接着构建了数据故事叙述过程的技术框架,并详细阐述了其在数据故事化中的应用。最后分析了数据故事化叙述的相关技术与工具的发展特点。[结果/结论]提出数据故事化的过程包括数据故事的生成和数据故事叙述,叙述阶段已有多种关键技术提供支持,而生成阶段的相关技术存在空白,并总结数据故事化叙述相关技术的六个发展特点。  相似文献   

3.
[目的/意义]人物和情节是数据故事的两大支柱。数据故事的情节通过人物特征、行为、所期待目标、所面对现实和所认为偏见来展开,实现数据故事人物的自动化生成是数据故事化领域科学研究的核心主题之一,对于数据故事的理论研究、自动生成和工程化研发具有重要意义。[方法/过程]首先,探讨数据故事人物的类型、特征及操作。其次,提出基于反事实解释的人物生成方法,分别对数据故事中的主人公、同类人物、异类人物、正面人物和反面人物给出自动生成方法。接着,分析其技术实现,探讨实验设计、数据来源、方法选择及结果讨论。最后,总结论文的主要研究发现,并对未来研究提出建议。[结果/结论 ]在数据故事化领域首次较为系统研究数据故事人物的组成要素、基本类型、主要特征及核心操作,并提出基于反事实的数据故事人物自动生成方法。  相似文献   

4.
[目的/意义]基于数据故事本体模型提出一种语义描述及推理方法,旨在生成机器可理解的数据故事语义脚本,完整的数据故事产品能够利用此脚本生成。[方法/过程]首先,基于OWL本体的建模和知识表示方法设计数据故事的XML格式和RDF(S)格式的描述脚本。然后,基于SWRL定义数据故事的语义描述规则,论述数据故事化的语义描述及推理流程与关键任务。最后,以UCI breast-cancer数据集为数据来源,将存储在MySQL数据库中的数据故事内容转换为XML数据故事描述脚本和RDF(S)数据故事语义描述脚本,并使用推理方法标记数据故事的要素及关系。[结果/结论 ]定义包含故事要素、故事要素关联以及故事实例的数据故事脚本,划分出数据故事语义描述与推理的流程以及形式化表示活动中的关键任务,并提出可操作的面向数据故事化的语义描述和推理方法。  相似文献   

5.
[目的/意义]数据故事化评价是监控数据故事化过程、衡量其效果、保障和提升其质量的关键目前,国内外关于数据故事化评价的研究较少,本研究可为今后相关研究提供参考。[方法/过程]本文的评价方法分为基于过程的评价和基于结果的评价。其中基于过程的评价采用软件能力成熟度模型,将数据故事化划分为数据准备、数据分析、故事建模、故事描述和故事呈现五个阶段,并根据具体实施需要定义了过程评价的阶段参考特征和改进方向;基于结果的评价,则是以本文提出的基于结果的评价模型为基础,从受众和使用者视角对个人的接受度和持续接受度进行评价,最后以评价结果为依据提出了改进流程[结果/结论]本文提出的评价方法能够在一定程度上帮助组织在开发过程中把握产品痛点,提升开发能力。同时也可以解释和预测个人的接受意向,为下一步的营销推广活动提供依据。  相似文献   

6.
[目的/意义] 数据故事化实现数据、可视化与叙事的关联融合,有利于公众感知及认知复杂数据,提高数据重用率。[方法/过程] 通过提取新华网260个数据新闻故事题目并提炼高频词,确定27个卫生健康类热点数据新闻故事。根据扎根理论并采用质性分析软件NVivo11对热点数据新闻进行三级编码,最终得到数据新闻实践的11个初始范畴,并凝练出6个主范畴。[结果/结论] 得出数据故事化实践路径的理论模型及特征。数据故事可用于知识发现、数据解读、服务增值等方面。  相似文献   

7.
[目的/意义]以故事线梳理史实脉络,不仅对于描绘与把握历史发展方向具有一定的理论和现实指导意义,同时也为人文领域的知识发现提供新的技术实现方式和创新性研究视角.[方法/过程]提供一种基于文本数据的故事线构建及可视化、情感化、场景化的研究范式,通过爬梳《张学良口述历史》文本作为数据源进行实证探索.采用jieba分词对《张...  相似文献   

8.
[目的/意义]开展数据对象可溯源性保障研究,可降低大数据时代所凸显的跨领域、海量、异构和动态数据的失信风险,有助于自动化实现数据质量评价、数据审计及数据恢复等问题。[方法/过程]基于数据溯源、密码编码学等理论,以数据对象为操作单位,提出一种新的数据对象版本号计算方法;进一步提出了数据对象DNA的概念及其生成和回溯方法,并探讨其IT实现及应用。[结果/结论]本文提出统一溯源新方法数据对象DNA,具有易生成、防篡改、普适性强等特点,可应用于数据对象的世系检验和数据连续性自动审计等场景。  相似文献   

9.
[目的/意义]为旅游景点生成高质量的文化资源标签,解决文化旅游服务中信息检索困难、推荐形式单一的问题。[方法/过程]首先,设计包含显式和隐式两种标签类型的文化资源标签体系;然后,提出基于特征词筛选和噪声词过滤的显式标签生成方法,以及设计隐式标签中文化感知强度和文化感知相似度的计算方法,并基于以上方法生成景点文化资源标签;最后,针对旅游信息服务中的不同场景,提出基于文化资源标签的检索和推荐方法。[结果/结论]以武汉市的真实旅游数据为例进行实证研究,结果表明,基于本文方法生成的标签能够准确刻画景点的文化资源特征,基于标签的检索和推荐方法均具备较强的可解释性,可有效提升信息服务的透明度和用户对结果的信任度,对其他领域的推荐解释性研究具有参考价值。  相似文献   

10.
[目的/意义]可视故事化在实践中正被越来越多地应用,特别是在网络平台,梳理并归纳可视故事化的特征、方法与应用对于数据可视化的进一步发展以及数据科学跨学科融合具有重要的理论价值与现实意义。[方法/过程]首先系统地梳理了可视故事化的特征,接着通过多个实践案例分析了可视故事化的不同类型,揭示了可视故事化的实现方法,并描述了不同应用设计上的差异,[结果/结论]研究发现交互式可视化研究、理论模型、理论研究重点和专用开发工具需要进一步深化以推动可视故事化的研究进展。  相似文献   

11.
[目的 /意义]将海量学术文本观点提取工作由人工转向机器,提高效率的同时又能够保证观点提取的准确性、客观性。[方法 /过程]使用UniLM统一语言预训练模型,训练过程中对模型进行精调,以人工标注数据集进行机器学习。将学术文摘作为长度为a的文本序列,经过机器学习,生成长度为b的句子序列(a≥b),并且作为学术论文观点句输出。[结果 /结论 ]研究结果表明:UniLM模型对于规范型文摘、半规范型文摘、非规范型文摘观点生成精准度分别为94.36%、77.27%、57.43%,规范型文摘生成效果最好。将机器学习模型应用于长文本观点生成,为学术论文观点生成提供一种新方法。不足之处在于本文模型依赖文摘的结构性,对非规范型文摘观点生成效果有所欠缺。  相似文献   

12.
[目的/意义]政策是开放政府数据生态系统中至关重要的要素。对开放政府数据政策的研究成果进行述评,为我国开放政府数据政策制定提供政策方案,同时为深入开展政策研究提供参考和指南。[方法/过程]采用文献调研法,对开放政府数据政策相关的研究进行系统梳理和归纳,在此基础上对现有研究进行全面评价并提出未来研究方向。[结果/结论]研究表明,目前我国开放政府数据政策的研究主要集中在开放数据政策环境研究、开放数据政策制定和执行三个方面。现有研究的局限具体表现在:注重国外经验性研究,对我国政策的研究较少;研究较为零碎和抽象,缺乏系统性和具体性。未来应就开放数据政策内容体系特别是数据资产管理政策、政策执行的协调机制、参与机制和监督机制,以及现有政策的适应性等进行深入研究。  相似文献   

13.
高校科研数据资产化存储及数据复用权益许可研究   总被引:1,自引:0,他引:1  
[目的/意义]为我国高校的科研数据管理提供"数据资产"理论依据和"资产化"存储、管理和复用方法建议,以服务于我国高校数据知识产权开发利用和价值提升.[方法/过程]分析数据资产研究现状,讨论数据资产属性,界定数据资产权益,提出我国高校科研数据资产化权益存储管理的主要内容和数据复用权益许可的可行方案.[结果/结论]对科研数...  相似文献   

14.
[目的/意义] 对美国国家信息标准协会(NISO)发布的"替代计量评价指标的推荐实施规范"(AMMP)进行研究,以推动我国图书馆界对AMMP项目的深入了解,突破传统学术评价局限,促进替代计量在国内的应用以及新科学交流评价体系的构建。[方法/过程] 介绍AMMP产生的背景、发展、主要内容及特点,同时对该推荐实践规范推广和相关组织应用进行总结。在此基础上,对国内Altmetrics未来发展、一流期刊建设和研究数据集平台建设等提出建议。[结果/结论] AMMP通过分析利益相关者共性需求,明确替代计量适用成果类型,针对研究数据、永久标识符、数据质量等方面提出一系列推荐实施规范,为数据提供者或数据集成者的实践提供依据,有益于促进替代计量评价指标的标准化建设。  相似文献   

15.
[目的/意义] 针对当前国内在政府数据开放过程中的资源描述问题,提出四层结构的资源描述方法,满足政府开放数据资源描述要求,加快政府开放数据进程。[方法/过程] 在分析政府数据开放特点下的描述要求的基础上,引入DC、VoID、DCAT等元数据标准对数据资源进行目录描述、数据集描述、关联描述和访问描述。[结果/结论] 该描述方法可以为开放后的数据共享、查找、管理等提供有效的支持,帮助实现真正意义上的政府数据开放。  相似文献   

16.
[目的/意义]对图书馆数据形态演变情况进行探讨,以了解各种形态下图书馆数据研究的重点及未来研究方向。[方法/过程]在考察OCLC的4个数据科学项目及其反映出的3种数据表现形式的基础上,将图书馆数据形态分为原生形态、聚合形态、扩展形态、关联形态、知识形态等5种类型。[结果/结论]不同的图书馆数据形态有着不同的数据加工深度和广度。可通过多源聚合、内生与外联、关联数据化、知识三元组抽取与融合等途径实现5种数据形态之间的有序演变。  相似文献   

17.
数据呈现是大数据时代的新课题。通常,数据呈现的主要途经有两个,即数据的可视化和数据的故事化,二者的区别在于,数据可视化主要解决的是数据感知问题,而数据故事化更加关注的是如何将数据感知转换为数据认知。数据故事化涉及三个基本要素:数据、视觉效果和叙述。从数据故事的创作者和受众之间的信息交流模式看,可将数据故事化分为创作者驱动和受众驱动两种不同模式。目前,数据故事化中常用的结构有三种:马提尼酒杯结构、互动演示幻灯结构和向下钻取事结构。数据故事化的主要活动包括理解数据、明确目的、了解受众、确定关键数据、选择故事模型以及故事叙述。数据故事化是数据科学的主要研究内容之一,也是数据科学区别于其他学科的重要特征。图6。表4。参考文献60。  相似文献   

18.
[目的 /意义]总结社会科学数据管理平台建设经验,分析对我国的启示,提出我国国家级社会科学数据管理平台建设策略。[方法 /过程]采用文献调研法和网络调查法,分析全球社会科学数据管理平台建设概况,选取国外8个主要平台,从基础保障、服务内容、评估认证、合作交流方面进行研究,同时分析我国社会科学数据管理平台的建设现状。[结果 /结论 ]我国应建设全国性的社会科学数据管理平台,平台应提供全生命周期的科学数据管理服务,积极开展可信赖性评估认证并与国内国际相关机构开展广泛合作。全国哲学社会科学工作办公室可考虑出台相关数据政策,在充分整合现有资源、遵循国际标准和最佳实践的基础上,牵头建设国家级社会科学数据管理平台。  相似文献   

19.
[目的/意义] 对开放政府数据价值的相关研究成果进行总结和梳理,形成较为完整的文献综述,为国内该领域的未来研究提供参考。[方法/过程] 通过文献计量与内容分析描绘开放政府数据价值研究领域的文献分布状况,对现有研究成果进行全面梳理与评价,并提出未来研究方向。[结果/结论] 学界目前对开放政府数据价值的研究主要集中于价值类型、价值生成机制以及价值测量3个方面。多数研究停留于探讨开放政府数据的预期价值,缺乏对预期价值的实证验证;缺乏对利用和效果之间的因果关系的检验;对价值生成机制和价值测量的研究不足。建议未来研究更多关注本土实践,从多学科视角出发,加强开放政府数据价值相关理论与实证研究。  相似文献   

20.
沈敏  杨新涯  王楷 《图书情报工作》2015,59(11):143-148
[目的/意义] 针对大数据环境下高校图书馆检索系统的信息超载问题, 提出一种机器学习方法, 为用户提供个性化的偏好检索服务。[方法/过程] 通过提取用户检索行为大数据中的用户特征, 利用监督机器学习方法, 在线学习可随用户偏好同步变化的自适应检索模型, 预测用户对文献的选择概率, 优化检索结果的排序。[结果/结论] 设计出用户偏好检索原型系统, 介绍用户偏好检索系统工作流程, 对比分析系统效果, 并对系统进行客观评价。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号