共查询到20条相似文献,搜索用时 15 毫秒
1.
非结构化数据是大型企业宝贵的数据资产,其基本特征是数据格式多样、数据存储分散、数据总量大、增长速度快,蕴含有大量提升企业业务价值的重要信息。非结构化数据的统一存储、集中管理与深化应用是当今大型企业信息化建设的重要方向之一。基于企业架构理论设计了非结构化数据管理平台的业务架构、技术架构、数据架构以及应用架构,对面向大型企业应用的非结构化数据管理平台进行了多视角建模,建立了从需求分析到系统设计的桥梁。 相似文献
2.
传统的MIS一般通过C/S或者B/S的方式进行开发,前者虽然用户界面友好、数据传输效率高,但部署起来较为麻烦,使用起来也很有局限性;后者可以实现零客户端,但它不能使用本地资源,不能多线程,也不如C/S使用得方便。虽然这两种方式能很好地处理结构化数据,但是企业中还存在大量MIS之外的非结构化数据,非结构化信息数据主要是Office办公文档,而MIS和它们一直不能交互。通过VSTO(MicrosoftvisualStudioToolsfortheMicrosoftofficeSystem)与Web服务相结合,将这些非结构化的办公文档改造成智能客户端程序,从而使Office文档和MIS之间的信息可以相互通信。这样不但可以提高办公文档数据采集的准确性,而且能够有效地处理脱离MIS的大量非结构化数据,从而提高工作效率和效益。 相似文献
3.
《佳木斯教育学院学报》2016,(11)
伴随着社交网络、云计算、大数据等概念及技术的出现,无时无刻都有大量的数据产生,其中以图像类型为代表的非结构化数据接近总数据量的75%,且比值还在逐渐加大。急需有效的非结构化图像处理方法,而传统的图像处理大多停留在灌输式的理论教学层次,很难适应当下对非结构化图像处理的要求,本文提出一种科研导向式课程模式,从教学方法、实验设置和考核方式三方面进行改革实践,以大数据项目为背景,紧跟非结构化图像处理技术应用需求,激发学生学习兴趣,增强工程锻炼能力,有效提高课堂效率。 相似文献
4.
5.
应用系统对非结构化
数据存储的需求
非结构化数据,通俗的讲就是诸如文本、图像、音频、视频、各种格式的办公文档等等数据,这类数据广泛存在于各类应用系统中,而对于它们的存放,传统上有数据库和文件系统两种方式.我们知道,作为结构化数据存放、检索的手段,数据库扮演着重要的角色,是大多数应用系统的基石,但我们并不推荐在数据库中存放非结构化的数据,一方面数据库存取此类数据的效率低下;另一方面,大量的非结构化数据存在于数据库给数据库的性能和维护都带来负面影响.相对于数据库,我们更推荐在文件系统中存放非结构化数据,但是这也对开发人员提出了很高的要求:在性能方面,为了应对可能的大文件数量,文件存放的目录结构需要设计,为了支持负载均衡,文件数据的同步需要考虑;在安全方面,对于Web系统,允许上传文件到文件系统有着巨大的风险,由于运维人员无法实施严格的安全策略保证文件系统不被改写,一旦系统存在漏洞,上传非法代码执行的例子屡见不鲜. 相似文献
6.
《赤峰学院学报(自然科学版)》2016,(14)
随着现代社会信息技术的高速发展及网络、云计算在人们日常生活中应用的增加,产生了大量的非结构化数据,这些数据为我们了解、认知、改造世界提供了重要的依据.企业和个人通过计算机、移动设备、网络等工具不断制造并传输着大量的信息,这些信息既包括了企业的还涵盖了个人及其它事物的,同时信息还在不断繁衍并迅速的增加.大数据已经悄然融入到我们的生活的每一个角落,并无时无刻的影响着我们.如何发掘、利用、组织这些种类繁杂的数据并保证数据在传递和使用过程中的的安全是我们当前非常重视的问题之一,同时它也给我们带来了巨大的挑战. 相似文献
7.
刘宁 《辽宁教育行政学院学报》2005,22(6):130-131
Web上有大量的数据信息,怎样对这些数据进行复杂的应用成了现今数据库技术的研究热点。数据挖掘就是从大量的数据中发现隐含的规律性的内容,解决数据的应用质量问题。充分利用有用的数据,废弃虚伪无用的数据,是数据挖掘技术的最重要的应用。相对于Web的数据而言。传统的数据库中的数据结构性很强,即其中的数据为完全结构化的数据,而Web上的数据最大特点就是半结构化。所谓半结构化是相对于完全结构化的传统数据库的数据而言的。显然。面向Web的数据挖掘比面向单个数据仓库的数据挖掘要复杂得多。 相似文献
8.
9.
《赤峰学院学报(自然科学版)》2017,(4)
随着信息技术和云计算平台的发展,企业经营活动产生的海量数据改变了会计系统的原有模式,财务会计的核算职能开始弱化,模块式的会计业务处理方式趋向移动化、电子化的智能式会计.结构化数据已不能满足会计信息使用者的需求,半结构化、非结构化数据通过会计信息资源管理系统、知识管理系统被更多的应用于数据分析中.原人为职业判断环节也将逐渐被学习记忆、自动建模功能取代,与此同时,数据相关度也成为影响会计信息质量的重要因素,信息安全将面临更为严峻的挑战. 相似文献
10.
大数据时代已经到来,需要对大量的结构化和非结构化数据集合进行挖掘,数据挖掘领域需要进行彻底变革,数据挖掘课程的授课内容和实践环节都需进行相应的调整。本文通过分析大数据的内涵、特征,数据挖掘的核心课程,探讨大数据时代对数据挖掘课程提出的新要求与新挑战。 相似文献
11.
结构化数据及非结构化数据的分类方法 总被引:2,自引:0,他引:2
张枝令 《宁德师专学报(自然科学版)》2007,19(4):417-420
阐述了结构化数据和非结构化数据的基本概念以及分类过程;同时对目前应用于结构化数据和非结构化数据的主要的分类算法及其优缺点进行分析和比较. 相似文献
12.
13.
文章通过对基于WEB的西游记文化研究数据库的建设全过程的研究,包括现有西游记文化研究信息的采集、非结构化数据到结构化数据的转换、数据库的构建、基于WEB的西游记研究数据库信息检索界面的设计及信息检索系统的实现的阐述,对高校图书馆中小型特色数据库的建设作初步探讨. 相似文献
14.
15.
阐述了基于数据语义的XML语言规范,在此基础上,讨论了基于XML语言的Web数据挖掘技术,解决了Internet上绝大多数非结构化甚至是无结构的、Web信息的组织结构性差而导致的Web数据挖掘困难的问题。 相似文献
16.
随着Web上的信息量剧增,大量有价值的信息隐藏于非结构化文档中,Web数据挖掘的作用愈显重要。本文从Web数据挖掘的定义与分类开始分析,介绍了Web数据挖掘的主要技术以及其在检验检疫管理中的应用实例和实现方法。 相似文献
17.
开发海量数据处理系统时存在技术框架选择不确定问题。从理论及应用角度对两种主流的海量数据处理架构MPP和Hadoop进行对比,分析各自技术特点,阐述其与传统数据处理的优势。分析结果表明,Hadoop在存储数据规模上可轻松支持PB级别,而MPP架构大多只支持TB级别;Hadoop对海量半结构化、非结构化数据存储和处理有一定优势,但在处理速度和易用性上不及MPP;在结构化数据处理、响应性能和衍生工具等方面MPP 则占优,适用于查询业务场景较多项目。通过分析两大框架底层核心技术以及归纳优缺点,为企业相关应用的技术选型提供参考。 相似文献
18.
张弛 《山西师大学报(社会科学版)》2015,(1):61-64
资源是一个技术时代人类赖以生存发展的生产要素。大数据资源作为一种新的资源样式具有传统资源所不具有的特征。大数据资源的扩展性特质具体表现为数据结构的扩展、数据价值的扩展和数据体量的扩展,即数据的量和质的双重提升。数据结构的扩展不仅包括原有的结构化数据和半结构化数据,而且还包括原来的数据技术难以处理的海量而复杂的非结构性数据;数据价值的扩展表现为大数据提高了数据的有用性,降低了数据的使用成本,使大量的"数据废气"转化为"更廉价"的"非竞争性"数据;数据体量的扩展不仅表现为数据数量的级数式增长,还表现为大数据资源具有全媒体属性的"超文本性"和全数据属性的"整体性"。 相似文献
19.
分析大量的非结构化文本数据已经成为各类研究及数据分析中的重要任务。本文借助Hadoop分布式计算平台,搭建了一个基于IKAnalyzer开源工具的文本分析应用系统框架,系统基于Spring Boot架构进行了Web应用平台搭建,结合node.js技术构建了数据驱动的Web前端UI呈现。研究实践了从文档收集、文档预处理、分布式计算、中文分词及词频分析、可视化呈现的初步流程。借助该系统平台,研究分别以金庸小说文本数据及采集的贵州省极贫乡镇教育基础数据作为语料数据进行了相关文本统计分析实践。 相似文献