首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 15 毫秒
1.
半结构化数据是网络中一种重要的数据形式,其数据模型研究是半结构化数据各项研究的重要基础,本文介绍了半结构化数据的概念及其几个常见数据模型。  相似文献   

2.
大多数半结构化数据都具有一定的结构规律,将它们转化为基于关系数据库存储的结构化数据,可有效地应用DBMS技术进行处理,部分不便于转化的数据作特殊处理,以保证整个数据的无损映射,本在完成DTD的转换后,从一种最简单的映射方式入手,提出改进方案,利用一种基于数据挖掘的模式抽取方法,对不同类型的元素分别处理,设计了一套有效的溢出数据处理办法,实现了半结构化数据到结构化数据的无损映射。  相似文献   

3.
分析了半结构化数据以及半结构化数据模式的特点,XML数据模型在处理半结构化数据方面的应用,并介绍了XML数据与关系数据转换的研究现状。  相似文献   

4.
XML为Web的数据管理提供了新的数据模,可以说,XML就是WWW上的半结构化数据。本就XML数据管理的几个重要问题进行了阐述。  相似文献   

5.
Web上有大量的数据信息,怎样对这些数据进行复杂的应用成了现今数据库技术的研究热点。数据挖掘就是从大量的数据中发现隐含的规律性的内容,解决数据的应用质量问题。充分利用有用的数据,废弃虚伪无用的数据,是数据挖掘技术的最重要的应用。相对于Web的数据而言。传统的数据库中的数据结构性很强,即其中的数据为完全结构化的数据,而Web上的数据最大特点就是半结构化。所谓半结构化是相对于完全结构化的传统数据库的数据而言的。显然。面向Web的数据挖掘比面向单个数据仓库的数据挖掘要复杂得多。  相似文献   

6.
互联网下的数据获取和Web获取   总被引:1,自引:0,他引:1  
互联网是人类有史以来所面对的最巨大的信息海洋,互联网上的信息源形式多样,既有结构化的数据库中的数据,又有半结构化的HTML页面,还有无结构的文本和图片等数据。笔者在多年的计算机教学中发现,传统的数据处理理论有一个重要假设前提,邪就是对已生成的数据信息进行结构化处理,但就大部分实际问题而言,特别在当今互联网条件下,信息的处理是和信  相似文献   

7.
比较几种主要Web查询语言特点,介绍半结构化数据产生原因并分析半结构数据模式对改进Web查询的重要作用。  相似文献   

8.
结合XML技术及半结构化数据索引和Lore系统中的索引结构,提出了一种特殊的XML数据索引建立的方法,及利用索引实现对XML查询的优化。  相似文献   

9.
企业目前各种信息系统由于数据格式不一,形成知识孤岛,造成组织所需的大量知识散布在各个异构数据系统中。面对大量的非结构化数据,传统的知识发掘显得力不从心。本文拟通过XML标记语言的特点,将企业信息资源中非结构化数据半结构化,利用基于传统数据库的知识挖掘技术构建基于非结构化数据的知识发掘系统。  相似文献   

10.
结构化数据及非结构化数据的分类方法   总被引:2,自引:0,他引:2  
阐述了结构化数据和非结构化数据的基本概念以及分类过程;同时对目前应用于结构化数据和非结构化数据的主要的分类算法及其优缺点进行分析和比较.  相似文献   

11.
XML已经成为表示结构化和半结构化数据的标准格式,XML中采用DTD和XML Schema模式来描述数据结构。结合XML Schema与面向对象的思想,提出了一种基于XML Schema建模的方法,并辅以实例。  相似文献   

12.
XML已经成为表示结构化和半结构化数据的标准格式,XML中采用DTD和XML Schema模式来描述数据结构.结合XML Schema与面向对象的思想,提出了一种基于XML Schema建模的方法,并辅以实例.  相似文献   

13.
高速列车数字化仿真平台实际运行中牵电、列车自动运行、列控、虚拟样机、工务等各专业将产生大量的TXT类型仿真结果文件.针对各专业产生文件的非结构化、数据交换量大、数据的实时性、准确性要求高等特点,需要使用异构数据转换中间件将这些非结构文件结构化,以方便后续的数据处理与使用.设计并实现了一种文本文件数据转换中间件,能提取仿真结果文件内容生成半结构化的DataXML,提取文件结构生成模板文件,通过SQL语句在Oracle中建表,插入数据来完成异构数据的统一访问和管理.  相似文献   

14.
资源是一个技术时代人类赖以生存发展的生产要素。大数据资源作为一种新的资源样式具有传统资源所不具有的特征。大数据资源的扩展性特质具体表现为数据结构的扩展、数据价值的扩展和数据体量的扩展,即数据的量和质的双重提升。数据结构的扩展不仅包括原有的结构化数据和半结构化数据,而且还包括原来的数据技术难以处理的海量而复杂的非结构性数据;数据价值的扩展表现为大数据提高了数据的有用性,降低了数据的使用成本,使大量的"数据废气"转化为"更廉价"的"非竞争性"数据;数据体量的扩展不仅表现为数据数量的级数式增长,还表现为大数据资源具有全媒体属性的"超文本性"和全数据属性的"整体性"。  相似文献   

15.
一种deep web数据源下重复记录识别模型   总被引:1,自引:0,他引:1  
使用deep web数据源下重复记录识别模型对从多个deep web数据源中抽取出来的半结构化和无结构化的数据进行处理.首先,在数据预处理模块中将所抽取的数据生成实体记录的形式,然后,在异构记录处理模块中利用在同构记录处理模块所得到的权值,计算各实体记录的相似度,得到重复记录.与传统的重复记录识别模型不同,所提方法是在模式匹配未知的前提下实现的;并且采用带有可选算法的多个相似度估算器以达到更好的匹配效率.实验证明,该重复记录识别模型是可行且有效的.  相似文献   

16.
开发海量数据处理系统时存在技术框架选择不确定问题。从理论及应用角度对两种主流的海量数据处理架构MPP和Hadoop进行对比,分析各自技术特点,阐述其与传统数据处理的优势。分析结果表明,Hadoop在存储数据规模上可轻松支持PB级别,而MPP架构大多只支持TB级别;Hadoop对海量半结构化、非结构化数据存储和处理有一定优势,但在处理速度和易用性上不及MPP;在结构化数据处理、响应性能和衍生工具等方面MPP 则占优,适用于查询业务场景较多项目。通过分析两大框架底层核心技术以及归纳优缺点,为企业相关应用的技术选型提供参考。  相似文献   

17.
e-Learning Grid数据访问中间件研究   总被引:1,自引:1,他引:0  
e-Learning教育应用涉及大量资源和数据,通常需要跨组织边界的安全资源共享.而现有的资源种类庞杂,结构各异,在应用上存在一定的技术壁垒.网格中间件技术作为一种较新的数据访问技术,目前正在受到关注,其应用潜力也在不断地挖掘当中.为减少应用开发的复杂性,屏蔽底层基础设施的异构性.增强应用系统的可扩展性和可移植性,本文在已有基础设施和网格中间件的基础上,从结构化、非结构化和半结构化数据三个角度详细介绍了其数据访问中间件的组成和访问原理,并在应用实践中加以应用和检验.实践证明,数据访问中间件的存在使得e-Learning应用中对数据资源的访问更加透明、高效、可靠,数据处理能力更强,更好地满足了更广泛虚拟组织的数据处理需求.  相似文献   

18.
将大数据应用于外语教学,便于教师追踪学生的学习表现,有利于教师精准教学,因此教师如何利用大数据促进精准教学成为学界关注的焦点。文章通过梳理智慧教学模式的相关文献、课堂观察及半结构化访谈归纳出了中学英语教师利用大数据促进精准教学的模式,结合半结构化访谈探究了中学英语教师对大数据分析技术促进精准教学的现状、态度与感知。研究发现,英语教师对数据支持的精准教学持有积极的态度,但数据处理和分析能力仍有待加强;大数据应用于英语教学的普及存在明显的地区差异。文章基于研究结果提出相应建议,以期推广大数据分析促进精准教学模式在中学英语教学的应用,加快信息时代外语教师从学生数据的搜集者到基于数据分析的学生个性化指导者的转变。  相似文献   

19.
网络上正在产生的大量的数据主要是HTML格式的数据,可以预计将来的网络上还将产生大量的数据,不过越来越多的将是XML格式。如何有效地存储和检索网络上的XML数据成为一个研究热点。由于数据库技术不断趋于成熟,一种方法是采用数据库对XML数据进行存储和查询等操作。其基本思想就是利用XML数据模式到数据库的数据模式的映射来存储。另外也可以采用文件形式来存储;还可以采用半结构化数据库存储或者采用面向对象数据库存储。  相似文献   

20.
文本挖掘探析   总被引:2,自引:0,他引:2  
文本挖掘是信息挖掘的一个研究分支,用于基于文本信息的知识发现,文本挖掘主要处理半结构化、无结构化和字符型数据,首先介绍了文本挖掘的概念,然后分析了文本挖掘的处理过程和关键技术,最后对文本挖掘进行了展望。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号