共查询到20条相似文献,搜索用时 15 毫秒
1.
潘洁珠 《安徽教育学院学报》2003,21(6):32-33
半结构化数据是网络中一种重要的数据形式,其数据模型研究是半结构化数据各项研究的重要基础,本文介绍了半结构化数据的概念及其几个常见数据模型。 相似文献
2.
3.
分析了半结构化数据以及半结构化数据模式的特点,XML数据模型在处理半结构化数据方面的应用,并介绍了XML数据与关系数据转换的研究现状。 相似文献
4.
XML为Web的数据管理提供了新的数据模,可以说,XML就是WWW上的半结构化数据。本就XML数据管理的几个重要问题进行了阐述。 相似文献
5.
刘宁 《辽宁教育行政学院学报》2005,22(6):130-131
Web上有大量的数据信息,怎样对这些数据进行复杂的应用成了现今数据库技术的研究热点。数据挖掘就是从大量的数据中发现隐含的规律性的内容,解决数据的应用质量问题。充分利用有用的数据,废弃虚伪无用的数据,是数据挖掘技术的最重要的应用。相对于Web的数据而言。传统的数据库中的数据结构性很强,即其中的数据为完全结构化的数据,而Web上的数据最大特点就是半结构化。所谓半结构化是相对于完全结构化的传统数据库的数据而言的。显然。面向Web的数据挖掘比面向单个数据仓库的数据挖掘要复杂得多。 相似文献
6.
互联网下的数据获取和Web获取 总被引:1,自引:0,他引:1
互联网是人类有史以来所面对的最巨大的信息海洋,互联网上的信息源形式多样,既有结构化的数据库中的数据,又有半结构化的HTML页面,还有无结构的文本和图片等数据。笔者在多年的计算机教学中发现,传统的数据处理理论有一个重要假设前提,邪就是对已生成的数据信息进行结构化处理,但就大部分实际问题而言,特别在当今互联网条件下,信息的处理是和信 相似文献
7.
8.
结合XML技术及半结构化数据索引和Lore系统中的索引结构,提出了一种特殊的XML数据索引建立的方法,及利用索引实现对XML查询的优化。 相似文献
9.
企业目前各种信息系统由于数据格式不一,形成知识孤岛,造成组织所需的大量知识散布在各个异构数据系统中。面对大量的非结构化数据,传统的知识发掘显得力不从心。本文拟通过XML标记语言的特点,将企业信息资源中非结构化数据半结构化,利用基于传统数据库的知识挖掘技术构建基于非结构化数据的知识发掘系统。 相似文献
10.
结构化数据及非结构化数据的分类方法 总被引:2,自引:0,他引:2
张枝令 《宁德师专学报(自然科学版)》2007,19(4):417-420
阐述了结构化数据和非结构化数据的基本概念以及分类过程;同时对目前应用于结构化数据和非结构化数据的主要的分类算法及其优缺点进行分析和比较. 相似文献
11.
肖阳 《重庆职业技术学院学报》2011,(5):155-157
XML已经成为表示结构化和半结构化数据的标准格式,XML中采用DTD和XML Schema模式来描述数据结构。结合XML Schema与面向对象的思想,提出了一种基于XML Schema建模的方法,并辅以实例。 相似文献
12.
肖阳 《重庆职业技术学院学报》2011,20(6)
XML已经成为表示结构化和半结构化数据的标准格式,XML中采用DTD和XML Schema模式来描述数据结构.结合XML Schema与面向对象的思想,提出了一种基于XML Schema建模的方法,并辅以实例. 相似文献
13.
14.
张弛 《山西师大学报(社会科学版)》2015,(1):61-64
资源是一个技术时代人类赖以生存发展的生产要素。大数据资源作为一种新的资源样式具有传统资源所不具有的特征。大数据资源的扩展性特质具体表现为数据结构的扩展、数据价值的扩展和数据体量的扩展,即数据的量和质的双重提升。数据结构的扩展不仅包括原有的结构化数据和半结构化数据,而且还包括原来的数据技术难以处理的海量而复杂的非结构性数据;数据价值的扩展表现为大数据提高了数据的有用性,降低了数据的使用成本,使大量的"数据废气"转化为"更廉价"的"非竞争性"数据;数据体量的扩展不仅表现为数据数量的级数式增长,还表现为大数据资源具有全媒体属性的"超文本性"和全数据属性的"整体性"。 相似文献
15.
一种deep web数据源下重复记录识别模型 总被引:1,自引:0,他引:1
使用deep web数据源下重复记录识别模型对从多个deep web数据源中抽取出来的半结构化和无结构化的数据进行处理.首先,在数据预处理模块中将所抽取的数据生成实体记录的形式,然后,在异构记录处理模块中利用在同构记录处理模块所得到的权值,计算各实体记录的相似度,得到重复记录.与传统的重复记录识别模型不同,所提方法是在模式匹配未知的前提下实现的;并且采用带有可选算法的多个相似度估算器以达到更好的匹配效率.实验证明,该重复记录识别模型是可行且有效的. 相似文献
16.
开发海量数据处理系统时存在技术框架选择不确定问题。从理论及应用角度对两种主流的海量数据处理架构MPP和Hadoop进行对比,分析各自技术特点,阐述其与传统数据处理的优势。分析结果表明,Hadoop在存储数据规模上可轻松支持PB级别,而MPP架构大多只支持TB级别;Hadoop对海量半结构化、非结构化数据存储和处理有一定优势,但在处理速度和易用性上不及MPP;在结构化数据处理、响应性能和衍生工具等方面MPP 则占优,适用于查询业务场景较多项目。通过分析两大框架底层核心技术以及归纳优缺点,为企业相关应用的技术选型提供参考。 相似文献
17.
e-Learning Grid数据访问中间件研究 总被引:1,自引:1,他引:0
e-Learning教育应用涉及大量资源和数据,通常需要跨组织边界的安全资源共享.而现有的资源种类庞杂,结构各异,在应用上存在一定的技术壁垒.网格中间件技术作为一种较新的数据访问技术,目前正在受到关注,其应用潜力也在不断地挖掘当中.为减少应用开发的复杂性,屏蔽底层基础设施的异构性.增强应用系统的可扩展性和可移植性,本文在已有基础设施和网格中间件的基础上,从结构化、非结构化和半结构化数据三个角度详细介绍了其数据访问中间件的组成和访问原理,并在应用实践中加以应用和检验.实践证明,数据访问中间件的存在使得e-Learning应用中对数据资源的访问更加透明、高效、可靠,数据处理能力更强,更好地满足了更广泛虚拟组织的数据处理需求. 相似文献
18.
将大数据应用于外语教学,便于教师追踪学生的学习表现,有利于教师精准教学,因此教师如何利用大数据促进精准教学成为学界关注的焦点。文章通过梳理智慧教学模式的相关文献、课堂观察及半结构化访谈归纳出了中学英语教师利用大数据促进精准教学的模式,结合半结构化访谈探究了中学英语教师对大数据分析技术促进精准教学的现状、态度与感知。研究发现,英语教师对数据支持的精准教学持有积极的态度,但数据处理和分析能力仍有待加强;大数据应用于英语教学的普及存在明显的地区差异。文章基于研究结果提出相应建议,以期推广大数据分析促进精准教学模式在中学英语教学的应用,加快信息时代外语教师从学生数据的搜集者到基于数据分析的学生个性化指导者的转变。 相似文献
19.