首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到17条相似文献,搜索用时 468 毫秒
1.
[目的 /意义]针对实践中数据故事应包含哪些内容、创作流程是什么等问题,提出一种数据故事生成方法,以期为数据故事的创作提供理论指导。[方法 /过程]在前人的研究基础上,基于数据科学、认知科学、自然语言处理和可解释性机器学习等理论,提出一种面向局部可解释性机器学习的数据故事生成方法,该方法对数据故事的生成步骤和创作方式进行详细的阐述和说明。同时对LIME算法的输出进行改进,使其更易理解。在此基础上对提出的数据故事化方法进行案例实现,以验证方法的可行性。[结果 /结论 ]提出的数据故事生成方法有助于丰富数据故事化研究的理论体系,同时为数据故事的生成研究和数据故事化工具的研发提供一定的启示。  相似文献   

2.
[目的/意义]人物和情节是数据故事的两大支柱。数据故事的情节通过人物特征、行为、所期待目标、所面对现实和所认为偏见来展开,实现数据故事人物的自动化生成是数据故事化领域科学研究的核心主题之一,对于数据故事的理论研究、自动生成和工程化研发具有重要意义。[方法/过程]首先,探讨数据故事人物的类型、特征及操作。其次,提出基于反事实解释的人物生成方法,分别对数据故事中的主人公、同类人物、异类人物、正面人物和反面人物给出自动生成方法。接着,分析其技术实现,探讨实验设计、数据来源、方法选择及结果讨论。最后,总结论文的主要研究发现,并对未来研究提出建议。[结果/结论 ]在数据故事化领域首次较为系统研究数据故事人物的组成要素、基本类型、主要特征及核心操作,并提出基于反事实的数据故事人物自动生成方法。  相似文献   

3.
[目的/意义]数据故事化评价是监控数据故事化过程、衡量其效果、保障和提升其质量的关键目前,国内外关于数据故事化评价的研究较少,本研究可为今后相关研究提供参考。[方法/过程]本文的评价方法分为基于过程的评价和基于结果的评价。其中基于过程的评价采用软件能力成熟度模型,将数据故事化划分为数据准备、数据分析、故事建模、故事描述和故事呈现五个阶段,并根据具体实施需要定义了过程评价的阶段参考特征和改进方向;基于结果的评价,则是以本文提出的基于结果的评价模型为基础,从受众和使用者视角对个人的接受度和持续接受度进行评价,最后以评价结果为依据提出了改进流程[结果/结论]本文提出的评价方法能够在一定程度上帮助组织在开发过程中把握产品痛点,提升开发能力。同时也可以解释和预测个人的接受意向,为下一步的营销推广活动提供依据。  相似文献   

4.
[目的/意义]明确定义数据故事化的内涵与特征,正确理解数据故事与文学故事的区别,实现数据故事化的自动生成和工程化研发是推动数据故事化这一新研究领域的关键所在。[方法/过程]首先,在调查分析数据故事化领域的研究现状的基础上,提出了数据故事化的内涵与特征;其次,采用数据科学与数据工程方法提出数据故事的自动生成流程;最后,运用软件工程方法设计出数据故事的工程化研发的参考架构。[结果/结论]数据故事的自动生成流程的提出对于数据故事化领域的理论研究具有重要借鉴意义,而数据故事的工程化开发参考架构的设计为研发数据故事产品组件及培育产业生态系统具有较大的参考价值。  相似文献   

5.
[目的/意义]基于数据故事本体模型提出一种语义描述及推理方法,旨在生成机器可理解的数据故事语义脚本,完整的数据故事产品能够利用此脚本生成。[方法/过程]首先,基于OWL本体的建模和知识表示方法设计数据故事的XML格式和RDF(S)格式的描述脚本。然后,基于SWRL定义数据故事的语义描述规则,论述数据故事化的语义描述及推理流程与关键任务。最后,以UCI breast-cancer数据集为数据来源,将存储在MySQL数据库中的数据故事内容转换为XML数据故事描述脚本和RDF(S)数据故事语义描述脚本,并使用推理方法标记数据故事的要素及关系。[结果/结论 ]定义包含故事要素、故事要素关联以及故事实例的数据故事脚本,划分出数据故事语义描述与推理的流程以及形式化表示活动中的关键任务,并提出可操作的面向数据故事化的语义描述和推理方法。  相似文献   

6.
[目的/意义] 数据故事化实现数据、可视化与叙事的关联融合,有利于公众感知及认知复杂数据,提高数据重用率。[方法/过程] 通过提取新华网260个数据新闻故事题目并提炼高频词,确定27个卫生健康类热点数据新闻故事。根据扎根理论并采用质性分析软件NVivo11对热点数据新闻进行三级编码,最终得到数据新闻实践的11个初始范畴,并凝练出6个主范畴。[结果/结论] 得出数据故事化实践路径的理论模型及特征。数据故事可用于知识发现、数据解读、服务增值等方面。  相似文献   

7.
贾琼  王萍 《图书情报工作》2021,65(10):105-112
[目的/意义] 应用关联数据技术进行历史档案资源聚合,以发掘资源数据的潜在关联,发现新知识并实现价值增值,进而优化知识服务。[方法/过程] 梳理档案资源开发利用和聚合的相关研究,从资源聚合的目标、原则、流程和层级关系等方面构建历史档案资源聚合框架,并采用"经史子集"实例分析资源聚合过程。[结果/结论] 构建了关联数据视角下历史档案资源聚合的理论指导框架和检索服务平台,为历史档案资源的开发利用提供从理论到实践的实现路径。  相似文献   

8.
[目的/意义]借助于数据驱动决策的相关理论和方法进行文史学科精准化服务探索。[方法/过程]参考数据驱动决策相关理论和文史学科精准化服务的需求,搭建数据驱动的服务实施框架,系统收集图书借阅数据、门禁数据、研究成果数据、问卷调查数据、用户咨询数据、意见反馈数据等,通过数据分析结果指导学科服务实践。[结果/结论]经过数据分析获得学科忠诚用户和关键用户,了解文史学科用户的文献利用行为特点和需求,找到学科服务开创期要解决的关键问题及用户对教学、科研、管理支持的方面需要,并以此为依据提出精准化学科服务策略。  相似文献   

9.
朱祥  张云秋 《图书情报工作》2019,63(16):143-150
[目的/意义]对近年来知识融合相关研究进行梳理与评价,以期为今后相关研究提供参考。[方法/过程]首先解析知识融合的概念,然后对知识融合的框架、过程和方法进行梳理,继而总结知识融合的研究趋势,最后进行研究展望。[结果/结论]知识融合研究在大数据环境下呈现出新的研究特点,但还不能满足大数据环境的要求,未来应从构建分层多维立体的大数据知识融合框架、提高知识融合的效率、构建实时动态融合机制、开展大数据实证应用研究4个方面开展知识融合研究。  相似文献   

10.
基于关联数据的知识组织深度序化机制研究   总被引:1,自引:0,他引:1  
戎军涛 《图书情报工作》2015,59(13):134-141
[目的/意义] 从关联数据在知识组织与控制中的应用为切入点,进一步揭示基于关联数据的知识组织深度序化机制,促进关联数据技术在知识组织、知识发现领域的应用。[方法/过程] 通过系统分析法提出"三位一体"的语义组织框架,分析基于关联数据的知识组织语义序化机制,并以机构知识库关联数据的构建发布为例说明语义序化机制具体实现路径。[结果/结论] 本体与关联数据驱动的语义检索服务体现了基于关联数据的知识组织深度序化机制。研究表明,关联数据作为轻量级的语义网实现方式,为知识组织的深度序化提供了语义化的技术、方法、工具和实现路径,为知识发现、知识推理提供了基础。  相似文献   

11.
[目的/意义]可视故事化在实践中正被越来越多地应用,特别是在网络平台,梳理并归纳可视故事化的特征、方法与应用对于数据可视化的进一步发展以及数据科学跨学科融合具有重要的理论价值与现实意义。[方法/过程]首先系统地梳理了可视故事化的特征,接着通过多个实践案例分析了可视故事化的不同类型,揭示了可视故事化的实现方法,并描述了不同应用设计上的差异,[结果/结论]研究发现交互式可视化研究、理论模型、理论研究重点和专用开发工具需要进一步深化以推动可视故事化的研究进展。  相似文献   

12.
基于角色关联的叙事型文化遗产知识表示方法   总被引:1,自引:0,他引:1  
[目的/意义] 叙事型文化遗产具有丰富的隐含知识与语义信息,仅采用图像、文字等数字化形式难以描述故事元素间复杂的关联与模糊语义,因此探究叙事型文化遗产的有效组织与表示具有重大研究意义。[方法/过程] 围绕叙事型文化遗产,利用语义数据模型提出基于角色关联的知识表示方式,构建具有多粒度、多角度且语义流畅的知识表示框架。此方法选取故事中的主要元素作为知识因子,通过聚集与特化的抽象关联关系表示知识因子间的角色关联,形成自然的图结构。[结果/结论] 基于角色关联的知识表示方式具有语义自然、可扩展性强、支持多样化检索等优势,可解决现有知识表示方法存在的角色缺乏情境依赖与表示角度单一问题。  相似文献   

13.
科学数据出版过程中的数据质量控制   总被引:1,自引:0,他引:1  
王丹丹 《图书情报工作》2015,59(23):124-129
[目的/意义] 梳理不同科学数据出版过程中数据质量控制的特点,总结数据质量控制当前面临的挑战,分析相关责任者现状,以利于更好地理解数据质量控制的发展趋势与特征。[方法/过程] 从数据出版模式入手,选取每一种出版模式下的典型案例,归纳总结其数据质量控制的实践、标准,进行不同模式之间的对比分析,总结异同,并发现问题。[结果/结论] 展示、出版和存储数据的方法不同,导致质量控制方法也存在较大差别。大多数期刊未提出与数据质量控制相关的建议和要求;数据知识库从技术方面完成数据集的质量控制,将质量控制作为数据存储、保存和服务开发过程的一部分;数据期刊拥有最详细的数据质量控制过程,并且与数据知识库合作进行数据的获取和存储。随着数据出版机构的发展,数据质量控制将会出现更有效的建议和最佳实践,但前提是必须解决可获取性、数据格式及评议模式等方面的问题。  相似文献   

14.
[目的/意义] 初步论述信息安全界理论前沿,论述威胁情报及其相关热点问题,试图引入新的情报概念,开拓情报研究新的领域。[方法/过程] 通过文献调研、内容分析和归纳演绎,梳理出威胁情报的主要特点、基础性技术、实践现状与趋势、重要意义和未来研究方向。[结果/结论] 威胁情报:①将成为情报研究新的热点;②具有应用范围广泛、紧密跟踪和可用于信息安全管理决策的特征;③对国家信息安全管理和国家情报要素研究均具有重要意义;④与其相关的数据管辖与隐私保护、情报共享等问题将成为未来的研究重点。  相似文献   

15.
数据论文的内容规范性研究   总被引:1,自引:0,他引:1  
黄国彬  郑霞 《图书情报工作》2019,63(22):129-140
[目的/意义] 科学数据的规范化管理、引用和重用已受到学术界的广泛关注。在此背景下,用于促进科学数据合理使用的数据论文、数据期刊大量涌现。然而,数据论文目前尚未形成统一化、标准化的体例。本研究归纳和提炼当前在数据出版界较为活跃的数据期刊所发表的数据论文的内容框架和核心模块,以期为相关人员或机构在数据论文的撰写、使用和管理提供参考。[方法/过程] 综合应用内容分析法和比较研究法,依据科学数据使用者查找、获取与重用科学数据的思维模式,基于不同数据期刊发布的投稿指南或写作须知,从主题相关性、数据质量、数据产生及获取方法、应用场景、使用方法、补充说明6个维度剖析数据论文的内容框架和核心模块。[结果/结论] 目前并没有一种数据期刊的数据论文投稿指南或写作须知能够全部涵盖数据论文的所有模块;数据论文内容构成与传统学术论文的内容构成既有联系又有区别;数据论文内容框架的必备模块侧重于描述科学数据的突出特性;当前尚未形成体现科学数据特性的规范化描述框架。  相似文献   

16.
[目的/意义]分析新兴技术的产业化潜力对于产业投资决策、专利前瞻布局、资源优化配置以及技术市场开发具有重要意义。[方法/过程]系统总结现有技术产业化潜力评估方法,在此基础上构建基于多源数据的产业化潜力分析方法,主要包括对政策环境、产业技术和市场行情的分析以及对产业化特征的融合解读,以基因工程疫苗技术为例,对方法的可行性和有效性进行验证。[结果/结论]该方法立足技术领域全景,集成多种数据源,将技术产业化的局部特征融合为整体特征,可通过多维分析结果的相互印证、相互补充获得更具参考价值的产业化潜力分析结果。  相似文献   

17.
[目的/意义] 为了更好地指导计算机辅助信息分析工作的开展,构建计算机辅助信息分析技术框架,从顶层架构设计的视角指导计算机辅助信息分析。[方法/过程] 在文献综述和资料收集基础上,从数据库、数据仓库、OLTP、OLAP、BI和DSS 6个技术领域构建计算机辅助信息分析技术框架模型,从联机在线分析、数据挖掘和知识发现、社会网络分析、大数据分析4个方面详细分析当前主要的计算机辅助信息分析技术。[结果/结论] 对计算机辅助信息分析所面临的主要挑战和发展趋势进行展望,认为大数据分析将成为未来计算机辅助信息分析的重要研究内容,在大数据和云计算技术的推动下,计算机辅助信息分析将进一步向前发展,移动计算、社会计算将与信息分析深度融合。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号