共查询到20条相似文献,搜索用时 15 毫秒
1.
一、大数据的概念
当前,关于大数据的定义,众说纷纭,虽然没有一个统一的描述和定义,但其内涵基本一致.麦肯锡将其定义为:"大小超出了典型数据库工具收集、存储、管理和分析能力的数据集."这说明了大数据不仅体现了数据量巨大,而且是传统方法无法处理的数据集.大数据同过去的海量数据有所区别,正如IBM公司根据其本质将大数据的特征概括成三个"V",也就是规模(Volume),快速(Velocity)和多样性(Variety).
规模是指聚合在一起,供分析的数据量必须是非常庞大的,从TB级别,跃升到PB级别. 相似文献
2.
刘薇 《中国广播电视学刊》2014,(1)
正当下,"大数据"为众多企业带来了新的商业机会和盈利模式,也改变着人们的思维、工作和生活方式,作为掌握大量优质"数据"资源的媒资行业,将在大数据时代实现又一次蜕变。一、媒资产业进入大数据时代根据百度百科给出的定义,大数据(Big Data)是指所涉及的资料量规模巨大到无法透过目前主流软件工具,在合理时间内达到撷取、管理、处理,并整理成为帮助企业经营决策的资讯。大数据具有4V特征,即数据量(Volume)、多样性(Variety)、价值(Value)、速度(Velocity)。基于大数据的定义以及4V特征,媒 相似文献
3.
编者按随着网络用户的高速增长,以及网络终端日益丰富多样化,网络服务的内容与范围不断扩充,用户对互联网的依赖度极大提高,同时这些变化也大大增加了互联网产生的数据量。日益生成和积累用户网络行为数据,增长如此之快,以至于难以使用现有的数据库管理工具来驾驭。这些数据量是如此之大,已经不是以我们所熟知的多少G和多少T为单位来衡量,而是以P(1000个T),E(一百万个T)或Z(10亿个T)为计量单位。目前互联网的形态已经不是单方面接受信息,海量的UGC(用户产生信息)产生前所未有的庞大数据:过去三年里产生的数据量比以往12年的数据还要多,大数据时代的来临已经毋庸置疑。 相似文献
4.
5.
大数据时代:当“被遗忘的权利”成为一个问题 总被引:1,自引:0,他引:1
这是一本关于"遗忘"的书.提到"遗忘",人们不自觉地会想起米兰·昆德拉的"遗忘与记忆"三部曲(《慢》《身份》和《无知》)和《笑忘书》,米兰·昆德拉找寻的是"被遗忘的存在",探讨的是"遗忘"与"记忆"的哲学关系.而这本《删除:大数据取舍之道》(Delete:The Virtue ofForgetting in the Digital Age,以下简称《删除》)也探讨"遗忘",不过它不是在文学中探讨,而是在现实中,在这个已经到来的大数据时代. 相似文献
6.
<正>"非结构性大数据"时代的到来我们现在全球数据量到底有多大?答案或许会令不少人感到吃惊。有机构预计,到2020年,全球数据使用量将暴增44倍,达到35.2ZB(1ZB≈10亿TB)。 相似文献
7.
关于表达材料的口吻表述材料的口吻、语气不同,通讯的形式也会具有不同特色。常见的表述口吻有以下几种: (一)第一人称,自述。即以通讯所报道的人物的自身口吻、语气来表述材料。常见的“某某讲、记者记”“——记某某谈话”之类便是。它的特点是:现身说法,恳切自然,尤善于表述人物的思想活动和某些微妙的感情。 相似文献
8.
9.
10.
11.
贾英歌(河南省档案馆馆长、副研究馆员):档案馆工作集管理性、服务性和政治性于一体,具有涉及面广、数据量大、安全性强、提供利用率高的特点. 相似文献
12.
关于传统出版业的数据规模,目前国内外均无明确的统计,只笼统地认为规模不大,这也只是与网上数据比较而言.被引用较多的说法是"人类生产的所有印刷材料的数据量是200PB",但这个数据究竟如何得出也无从追查.为了弄清楚我国传统出版业的数据规模究竟有多大,笔者尝试着利用原国家新闻出版广电总局每年发布的《中国新闻出版统计资料汇编》中的统计数据,并通过一定的计算方法,来得出我国传统出版业的内容数据量,以便大家了解. 相似文献
13.
文章表述了以重庆图书馆推出的"你阅读,我买单"智慧阅读服务的新内涵,分析了公共文化服务线下与线上相结合、科技与文化相融合、图书馆与书店相联动的新业态,提出了大数据时代下公共图书馆服务的新路径. 相似文献
14.
维基百科对大数据的定义为:大数据,或称巨量数据、海量数据、大资料,指的是所涉及的数据量规模巨大到在合理时间内无法通过人工达到截取、管理、处理,并整理成为人类所能解读的信息.在总数据量相同的情况下,与个别分析独立的小型数据集相比,将各个小型数据集合后进行分析可得出许多额外的信息和数据关系性,可用来察觉商业趋势、判定研究质量、避免疾病扩散、打击犯罪或测定实时交通路况等,这样的用途正是大数据盛行的原因. 相似文献
15.
浙江省高校数字图书馆(ZADL)特色资源数据库是浙江省高校图书馆共同建设、富有浓郁吴越地域特点和鲜明浙江学科特色的数字化信息资源库,内容丰富、类型多样、数据量大,但也存在宣传力度不够、数据量分布不平衡、访问量偏少、后续经费投入不足、数据更新迟缓等问题.ZADL应统一建设特色资源数据库及其平台,合理解决版权纠纷问题,争取多方面资金支持,发展产业化道路,探索出一条适合我国高校数字图书馆特色资源数据库建设的可持续发展道路. 相似文献
16.
一、大数据背景下档案服务面临的挑战(一)如何在海量数据中查询到所需要的档案信息。随着档案信息化建设的不断推进以及数据量的进一步增大,在进行档案查询时,往往需要的信息会被埋没在大量的不需要的数据中,并且检索性能急剧下降,甚至无法响应。因此,如何在大量的档案中快速而准确地找到所需的信息,是档案服务要解决的首要问题。(二)如何在海量数据中抽取和挖掘有用的信息和知识。依靠人工抽取、挖掘知识,在传统纸质档案时代、档案数量不多的情况下还可实行,但在大数据时代海量档案存在、非结构化数据盛行的今天则会变得心有 相似文献
17.
18.
一、大数据研究的背景
随着信息技术的不断发展与快速普及,信息交流,数据交换爆炸性增长,大数据时代来了.目前全球的电子化信息量是千万亿兆的数据量,预计2020年整个数据量可能会达到35千万亿兆.著名分析调研机构IDC的研究报告《从混沌中提取价值》显示,仅2011年,全球就产生了1.8ZB(也就是1.8万亿GB)的大数据,由此可见,海量数据就在眼前. 相似文献
19.
多媒体数据由于具有数据量大、媒体种类多等特点,对数据库技术产生了巨大影响。本文分析了多媒体数据建模的需求,对比了现有数据模型技术,指出O—O模型是新一代多媒体数据库建模的最佳途径。 相似文献
20.
网络数据库的特点有 :数据量大 ,增长迅速 ,更新速度快 ;品种齐全 ,内容丰富 ;数据标准、规范、多元 ;检索功能强 ;检索结果的显示与输出灵活、多样 ;数据库系统有扩展整合功能 ,等等。学术电子期刊迅速增加 ,电子图书迅速发展 ,服务智能化与个性化等是其发展趋势。参考文献 10。 相似文献