共查询到20条相似文献,搜索用时 15 毫秒
1.
编者按随着网络用户的高速增长,以及网络终端日益丰富多样化,网络服务的内容与范围不断扩充,用户对互联网的依赖度极大提高,同时这些变化也大大增加了互联网产生的数据量。日益生成和积累用户网络行为数据,增长如此之快,以至于难以使用现有的数据库管理工具来驾驭。这些数据量是如此之大,已经不是以我们所熟知的多少G和多少T为单位来衡量,而是以P(1000个T),E(一百万个T)或Z(10亿个T)为计量单位。目前互联网的形态已经不是单方面接受信息,海量的UGC(用户产生信息)产生前所未有的庞大数据:过去三年里产生的数据量比以往12年的数据还要多,大数据时代的来临已经毋庸置疑。 相似文献
2.
在信息化时代,数据的重要性日益显著,它的精确性可以保证事实的可信度和可比较性,它的逻辑性可以将事实关联起来以发掘更多本质规律和信息。金融、财经领域一切活动更是以数据为根本依据和重要基础。海量数据的处理是不可能由人来手工完成的,计算机技术将这个庞杂的任务承担下来,通过数据库、计算机算法、网络等技术手段来解决手工无法做到的海量数据整合、存储、分析、高效传输等问题。海量数据的价值在于产生信息,只有当海量数据进行结构化处理和存储之后才能采用计算机技术进行分析,发掘数据背后隐藏的规律,给决策者提供信息。"新华08"产品的数据仓库系统采集多种金融市场交易活动相关历史数据以及宏观、微观经济等财经数据,将其进行清洗、加工及整合存储,提供数据查询展现、关联分析、数据挖掘等功能,为金融交易平台的金融分析模型及交易活动决策提供历史数据及算法的支持,为金融财经分析人员提供数据查询与分析平台。 相似文献
3.
在大数据时代,大学出版企业数字出版产业的发展不是一蹴而就的,其发展模式也不是独一无二的。其成败的关键在于对"大数据"中读者阅读需求的把握、对自身资源的深度开发以及对成熟的数字出版赢利模式的探索。随着人类社会的技术进步,"数据"已经不再只是计算、统计用的数值或数字,而是成为一切可以以电子形式存储的信息的代名词。随着信息的爆炸式增长,"大数据"这一概念逐渐走进人们的视野并成为焦点。大数据具有规模性(volume)、多 相似文献
4.
5.
刘瑜 《中国科技资源导刊 (中国信息导报)》2015,(6):82-86
在大数据时代,数据的爆炸式增长对图书馆数据存储能力提出了严峻的挑战。论文立足于图书馆数据存储
的实际操作层面对大数据存储的可能性路径以及现阶段图书馆进行大数据存储的适用方案进行探讨,认为图书馆有责
任尽可能多地存储数据。对于非重要数据可利用云系统进行外挂存储,对于一般数据可通过构建图书馆联盟来实现馆
际互借,对于特色数据可采用馆内存储,并用大数据压缩技术来提升存储空间,从而缓解大数据对单个图书馆存储能
力的压力。 相似文献
6.
近年上海图书馆通过数字人文搭建多个知识服务平台,通过关联数据,以知识图谱、GIS等展示方式提供服务。基于关联数据的专业服务对基础数据提出新要求,如数据本体化须具体到人名、地名、时间等实体;数据保留关联性,以关联数据形式存储。在新的数据要求与数据量日益增加的背景下,传统通过人力来加工数据的方法,或提取简单的实体,无法满足需求。为此,研发命名实体识别工具,以上图关联数据为词典,结合HANLP技术,实现文本的实体挖掘。工具投入使用后,可对数据批量进行实体识别,改进了数据处理流程,缩短了数据加工周期。 相似文献
7.
数字图书馆传统的关系数据库数据存储方式已不能满足大数据存储与处理需求,为解决传统关系型数据库在海量数据存储和访问效率中的瓶颈问题,论文提出了一种数字图书馆安全、有效的大数据公布式存储架构。该存储架构具有良好的可扩展性、容错性和存储性能,尤其针对海量的非结构化、半结构化数据,其性能优势更加明显。 相似文献
8.
[目的/意义]政府数据开放已经成为大数据发展的重要数据来源。探讨基于关联数据的政府数据开放模式和过程,为政府数据的有效开放和充分利用提供帮助。[方法/过程]对政府数据开放的模式和方法进行讨论,提出基于关联数据和"先发布、后关联"的两步式政府数据开放模式,以上海市政府开放数据为例,分析和阐述该模式的3个主要过程及其关键问题的具体实现方法,包括描述与发布、关联与组织、服务与使用。[结果/结论]为关联开放政府数据的研究和实践提供了一个可行的模式和方法参考。 相似文献
9.
10.
11.
近年来随着互联网技术的发展,大数据成为社会热点。大数据为整个社会发展提供了巨大利益和价值,但同时大数据也给个人信息安全提出了挑战。本文主要从大数据时代下个人信息受到侵犯的四个表现(数据采集、存储、使用、销毁)入手,分析大数据时代下个人信息安全保护的措施。 相似文献
12.
随着档案信息化和数字化的发展,档案部门保管的电子档案的数量急剧增长,这种急剧增长不仅需要越来越大的档案数据存储空间,而且还增加了档案数据存储管理的复杂性。如何合理地利用存储空间来存储这些档案数据,确保以最低的存储成本来实现档案数据的最佳存储,对于管理大量档案数据信息的档案部门 相似文献
13.
大数据与大数据技术
当前,互联网、物联网、移动通信、电子商务、社交网络等新兴服务促使人类社会的数据种类和规模正以前所未有的速度增长,大数据时代到来,大数据已经渗透到每一个行业和业务领域,成为重要的生产因素.①
大数据发端于科学领域,2008年《Nature》推出了Big Data专刊,从此开启了对大数据的探索,此后在一系列的会议、报告、学术研究中相继谈论了大数据的存储、管理和分析等能力与实现,从而更好地利用大数据在众多的领域产生良好的社会效益.大数据,是指利用常用软件工具捕获、管理和处理数据所耗时间超过可容忍时间的数据集.大数据的特性为数据体量巨大(Volume)、数据类型多(Variety)、处理速度快(Velocity)、价值密度低(Value),解构大数据的特性才能对大数据有更直观而深入的认识. 相似文献
14.
大数据正在引发中国互联网行业新一轮的技术浪潮,尤其是在网络广告领域,刚刚兴起的网络广告人群实时竞价(RTB)模式就是大数据时代一个崭新的领域。RTB模式的兴起折射出在技术的推动下网络广告正经历着如下变革:1.网络广告从作为一种营销工具到作为一种营销系统的变革;2.网络广告从内容关联到消费者行为关联的变化;3.网络广告从以单一媒体为中心到以数据为中心的变革。 相似文献
15.
16.
国外科研教育机构数据政策的调研与分析——以英国10所高校为例 总被引:1,自引:0,他引:1
[目的/意义]科研教育机构是实施科研数据管理的主体,探索其科研数据管理的实施细节,有助于推进我国科研数据相关政策的制定.[方法/过程]对科研教育机构的政策要素以文献综述的方式进行筛选、提炼和分析.[结果/结论]研究显示,科研教育机构的科研数据政策应着重提供科研数据存储规范(存储义务、存储数据类型、存储强制性要求、存储地点、存储其他要求)、质量保障规范(政策关联、适用范围、管理对象、权责机制、管理工具)以及传播规范(传播义务、数据所有权管理、数据知识产权管理、开放共享要求、开放共享限制、发布机制、引用要求). 相似文献
17.
数据新闻是计算机辅助报道和信息可视化的产物,被视为新闻业的未来.但它并非在大数据单一语境下产生,而是多重语境交织的结果.数据新闻契合了媒介融合的趋势,是当代新闻业的一个重要范式转向.目前数据新闻呈现出三种发展模式:调查式数据新闻、常规式数据新闻和即时式数据新闻.从数据新闻的成功实践经验看,数据新闻的生产理念应包含五种意识:内容与用户的关联意识、用数据讲故事的叙事意识、数据可视化呈现的用户体验意识、数据使用的批判意识和数据开发的增值意识. 相似文献
18.
本文从“数字出版”和“大数据出版”的概念辨析入手,指出两者最大的差异是后者能够通过对信息的数据化(结构化)处理来实现出版资源的重新整合与最大化利用;以自然灾害类历史典籍为例,说明“大数据出版”能通过建设专题数据库的途径实现对出版物资源的数据采集、存储和检索,并在数据库平台上进行数据挖掘和可视化呈现,以生产新的知识和产生新的价值;最后总结了“大数据出版”给出版行业重塑自身的核心竞争力、资源整合与服务方式、版权保护与交易方式带来的新契机. 相似文献
19.
书目数据的关联化,其实质是把书目数据发布为关联数据。关联数据的实现,使图书馆的丰富资源不再局限于图书馆内部应用,而是与互联网上的相关资源联系起来,形成更大的知识网络。以大英图书馆发布的关联数据为研究对象,对其发布的实体对象、词表重用、数据模型、MARC21到RDF的映射进行剖析,旨在为国内图书馆书目数据的关联实践提供参考,推动国内图书馆的书目数据实现网络化、国际化,使中文书目数据融入到语义网发展背景下,真正提高资源利用效率。图4。表10。参考文献9。 相似文献
20.
一、大数据带来的新思维(一)从样本到大数据以统计学为理论基础的抽样成为人们探索未知的主要方法这实际上是以样本取代全局数据的思路,甚至认为样本就是研究对象的本来面目。长久的习惯使人们丧失了对大规模数据的追求,甚至对大规模数据产生了无所适从的恐惧。大数据的思维强调回归知识探索的本源,通过大规模的数据而不是样本获得知识。大规模的 相似文献