首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 531 毫秒
1.
网络上正在产生的大量的数据主要是HTML格式的数据,可以预计将来的网络上还将产生大量的数据,不过越来越多的将是XML格式。如何有效地存储和检索网络上的XML数据成为一个研究热点。由于数据库技术不断趋于成熟,一种方法是采用数据库对XML数据进行存储和查询等操作。其基本思想就是利用XML数据模式到数据库的数据模式的映射来存储。另外也可以采用文件形式来存储;还可以采用半结构化数据库存储或者采用面向对象数据库存储。  相似文献   

2.
面向Web的数据挖掘是当今数据挖掘技术的热点。XML作为直接面向Web数据、基于Internet上的一种新的数据管理手段,为面向Web的数据挖掘带来了便利。分析了Web数据挖掘的特点和XML语言的优点,提出了运用XML解决Web数据挖掘中半结构化数据的模型抽取方法,最后对该方法进行了实例说明。  相似文献   

3.
XML的数据存储实例分析   总被引:1,自引:0,他引:1  
XML是一种标准化的可以在Web上表示结构化信息的文本格式,利用它可以存储有复杂结构的数据信息。随着XML的发展,出现了许多与之相关的技术,如样式表技术和文件对象模型(DOM)。通过实例分析可知,使用XML作为存储数据的手段非常有意义。人们可以通过DOM对XML文件进行读写、查询和排序,与用RDBMS存储数据相比XML有一定的优势,并且可以和RDBMS存储数据相结合。  相似文献   

4.
XML为Web的数据管理提供了新的数据模,可以说,XML就是WWW上的半结构化数据。本就XML数据管理的几个重要问题进行了阐述。  相似文献   

5.
大多数半结构化数据都具有一定的结构规律,将它们转化为基于关系数据库存储的结构化数据,可有效地应用DBMS技术进行处理,部分不便于转化的数据作特殊处理,以保证整个数据的无损映射,本在完成DTD的转换后,从一种最简单的映射方式入手,提出改进方案,利用一种基于数据挖掘的模式抽取方法,对不同类型的元素分别处理,设计了一套有效的溢出数据处理办法,实现了半结构化数据到结构化数据的无损映射。  相似文献   

6.
由于Web上半结构化数据的复杂性,XML已成为Internet上数据交换的标准。这就对于XML存储与检索等一系列文件管理提出了新的要求。主要结合SQL Server关系数据库管理系统,分析了XML在关系数据库中的存储策略,以及结合XQuery对于数据库中XML文档的检索方法。  相似文献   

7.
分析了半结构化数据以及半结构化数据模式的特点,XML数据模型在处理半结构化数据方面的应用,并介绍了XML数据与关系数据转换的研究现状。  相似文献   

8.
一种deep web数据源下重复记录识别模型   总被引:1,自引:0,他引:1  
使用deep web数据源下重复记录识别模型对从多个deep web数据源中抽取出来的半结构化和无结构化的数据进行处理.首先,在数据预处理模块中将所抽取的数据生成实体记录的形式,然后,在异构记录处理模块中利用在同构记录处理模块所得到的权值,计算各实体记录的相似度,得到重复记录.与传统的重复记录识别模型不同,所提方法是在模式匹配未知的前提下实现的;并且采用带有可选算法的多个相似度估算器以达到更好的匹配效率.实验证明,该重复记录识别模型是可行且有效的.  相似文献   

9.
XML技术浅析     
传统数据库处理不了现在的多种类型的复杂数据,新兴的XML技术解决了这一问题.XML是一种元标记语言,它有很多优点,如不依赖于任何编程语言、操作系统或软件供应商.在数据量小、用户少和性能要求不太高的环境下,可以将XML文档用作数据库.XML文件最重要的存储方式是原生XML数据库.处理XML文档的方式主要有SAX与DOM两种.  相似文献   

10.
XML已成为网络上对数据进行描述和传送的通用语言,XML数据库应运而生。XML数据库是一种新型的数据库技术,它适合于对半结构化数据的存取管理;它能表示和移植数据,具有集成异构数据库系统的能力。XML技术的这些特殊优势将会对网络信息资源的管理产生重大影响。  相似文献   

11.
因特网上有海量的数据信息,数据挖掘是从大量的数据中发现隐含的规律性内容,充分利用有用数据,废弃无用数据,解决数据的应用质量问题。通过对Web的数据挖掘和XML特点进行分析,讨论了使用XML实现基于Web的数据挖掘方法,提出了一种结合HTML、XMLJ、AVA的新型数据挖掘技术。  相似文献   

12.
侯刚  张桂芸 《大连大学学报》2006,27(2):56-58,67
针对当前互联网发展的高度动态性和复杂性,阐明并分析了W eb数据挖掘中存在的问题,并在此基础上主要探讨了XML在W eb数据挖掘中所起的作用.结合XML的可扩展性以及可被结构化等特点,从几个方面对基于HTML网页挖掘所遇到的困难,诸如链接信息分析、数据信息集成等,都提出了相应基于XML的解决方案,并给出了简要的示例说明.  相似文献   

13.
XML语言是目前网络上标准的数据描述语言和交换语言,在网络上的应用也越来越广泛,阐述基于XML的高职学分制选课系统的设计和实现方法。  相似文献   

14.
异构数据交换是进行异构信息资源集成和共享的关键技术.针对XML技术的优势,对基于XML的异构数据交换机制和异构数据交换实现方法进行了研究和探讨,给出了一个基于XML的异构数据交换技术的实现方案.  相似文献   

15.
在大多数以动态网页技术开发的电子商务系统中,HTML代码主要负责描述信息的显示样式,不承担运算任务,程序代码则由服务器来执行.文章提出了一种基于XML的改进ASP系统,可采用嵌入式XML对象存储数据信息,从客户端浏览器调用本地资源进行运算,可以将运算负荷分布到客户端,有效控制了对服务器的访问,减少了拥塞.实验表明能够显著提高整个系统的效率.  相似文献   

16.
在介绍XML特点及数据存取机制的基础上.着重探讨XML多数据源信息访问的三层架构以及XML模式与关系模式间数据转换的具体实现。  相似文献   

17.
该文首先剖析了数据挖掘技术,并阐述了XML在数据挖掘中的应用优势,然后构建了一个基于XML的面向多种Web教据的挖掘系统模型,最后详细介绍了模型中的三个层次构成,并介绍了其中关键技术的实现方法,以期为Web数据挖掘的研究提供参考.  相似文献   

18.
基于嵌入式系统的聚合新闻服务阅读器允许通过手工输入、URL在线更新和导入本地XML文件三种方式实现RSS订阅,并提供了在线和离线阅读两种阅读方式,采用数据池技术提高了提取速度;利用第三方服务减少了新闻中的广告信息,最后讨论了阅读器安全应用和功能扩展方面的问题.  相似文献   

19.
使用XML分别描述数据的结构信息和值信息,生成数据结构文件和数据值文件.通过对数据结构文件和用户定义的转换规则文件的分析,生成映射文件,并借助于映射文件完成数据值文件的转换从而最终完成数据交换.  相似文献   

20.
针对企业级JavaEE应用现有数据访问层解决机制,提出一种轻量级、可重用的数据访问层组件实现方案。方案基于XM L -关系数据映射和转换,数据库模型组件针对关系数据库表、视图进行建模,数据库访问控制组件和SQL动态构建组件根据数据库模型组件,结合XML格式数据,动态构造数据库存取SQL语句。项目实验表明,可以快速构建企业级JavaEE应用系统的数据访问层,提高系统可维护性和扩展性。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号