首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 109 毫秒
1.
Adaptive XML to relational mapping: an integrated approach   总被引:1,自引:0,他引:1  
Storing and querying XML (eXtensible Markup Language) data in relational form can exploit various services offered by modern relational database management systems (RDBMSs). Due to structural complexity of XML, there are many equivalent relational mapping schemes for the same XML data and queries. In this paper, we propose the adaptive XML to relational mapping (AX2RM) system, which considers finding optimal XML to relational (X2R) mapping as four separate but correlated procedures: logical database design, data scale estimation, workload transformation, and physical database design. We view the whole process as an autonomic computing problem and formalize the adaptive X2R mapping problem. Search spaces for each procedure are investigated individually, and five approaches for finding the optimal mapping are studied. We propose an integrated approach with greedy pruning (IT-GP), which views the mapping procedures as a whole and exploits heuristic rules in each procedure to prune impossible mappings as early as possible. Evaluation of these approaches shows the validity and high efficiency of IT-GP.  相似文献   

2.
Finding all occurrences of a twig query in an XML database is a core operation for efficient evaluation of XML queries. It is important to effectively handle twig queries with wildcards. In this paper, a novel path-partitioned encoding scheme is proposed for XML documents to capture paths of all elements, and a twig query is modeled as an XPattern extended from tree pattern. After definition, simplification, normalization, verification and initialization of the XPattern, both work sets and a join plan are generated. According to these measures, an effective algorithm to answer for a twig query, called DMTwig, is designed without unnecessary elements and invalid structural joins. The algorithm can adaptively deal with twig queries with branch([]), child edge(/), descendant edge(//), and wildcard(*)synthetically. We show that path-partitioned encoding scheme and XPattern guarantee the I/O and CPU optimality for twig queries. Experiments on representative data set indicate that the proposed solution performs significantly.  相似文献   

3.
In this paper, we propose a new relational schema (R-schema) to XML schema translation algorithm, VQT, which analyzes the value cardinality and user query patterns and extracts the implicit referential integrities by using the cardinality property of foreign key constraints between columns and the equi-join characteristic in user queries. The VQT algorithm can apply the extracted implied referential integrity relation information to the R-schema and create an XML schema as the final result. Therefore, the VQT algorithm prevents the R-schema from being incorrectly converted into the XML schema, and it richly and powerfully represents all the information in the R-schema by creating an XML schema as the translation result on behalf of the XML DTD.  相似文献   

4.
该文首先剖析了数据挖掘技术,并阐述了XML在数据挖掘中的应用优势,然后构建了一个基于XML的面向多种Web教据的挖掘系统模型,最后详细介绍了模型中的三个层次构成,并介绍了其中关键技术的实现方法,以期为Web数据挖掘的研究提供参考.  相似文献   

5.
结合XML文档树结构提出了一种基于节点相对路径的模式抽取算法,通过使用SAX解析器对XML文档进行一遍扫描,提取出XML文档节点及其相对路径来实现XML文档模式的抽取,该算法有效地解决了XML文档中存在的环路及缺边问题,计算结果模式的代价较低,效率较高.  相似文献   

6.
侯刚  张桂芸 《大连大学学报》2006,27(2):56-58,67
针对当前互联网发展的高度动态性和复杂性,阐明并分析了W eb数据挖掘中存在的问题,并在此基础上主要探讨了XML在W eb数据挖掘中所起的作用.结合XML的可扩展性以及可被结构化等特点,从几个方面对基于HTML网页挖掘所遇到的困难,诸如链接信息分析、数据信息集成等,都提出了相应基于XML的解决方案,并给出了简要的示例说明.  相似文献   

7.
针对Web上数据的特点,指出了采用XML技术进行网络数据挖掘的优势.  相似文献   

8.
面向Web的数据挖掘是一项复杂的技术,而XML的出现为解决Web数据挖掘的难题带来了机会。XML的扩展性和灵活性允许XML描述不同种类应用软件中的数据.从而能描述搜集的Web页中的数据记录.  相似文献   

9.
XML已成为互联网上数据表示和数据交流的新标准,随着XML数据的日益增多,关于XML数据的存储方式受到了广泛的关注.对现有的存储方法进行概述,着重论述基于关系数据库的XML数据存储方式,对各种方案的查询性能进行了比较,并得出最优方案,以期用来指导实践.  相似文献   

10.
阐述了基于数据语义的XML语言规范,在此基础上,讨论了基于XML语言的Web数据挖掘技术,解决了Internet上绝大多数非结构化甚至是无结构的、Web信息的组织结构性差而导致的Web数据挖掘困难的问题。  相似文献   

11.
XML数据量指数级的增长,要求更有效的数据管理能力和更快、更精确的查询。XML数据格式虽然具有易创建、解析和扩展的特点,但数据格式过于冗长,难以实现具体的查询。基于XBW变换导航、子路径查询和内容查询,在压缩率和压缩时间方面,XBWZIP是一种基于XBW变换并且支持查询的XML数据压缩方法。  相似文献   

12.
由于Web上半结构化数据的复杂性,XML已成为Internet上数据交换的标准。这就对于XML存储与检索等一系列文件管理提出了新的要求。主要结合SQL Server关系数据库管理系统,分析了XML在关系数据库中的存储策略,以及结合XQuery对于数据库中XML文档的检索方法。  相似文献   

13.
Web信息查询是Web应用领域中的一个重要研究课题,本文讨论了Ⅺ札作为在Web上交换数据的一种标准在Web查询中的应用。  相似文献   

14.
为了将大量的数据以关系数据库的形式存储和保存,将这些关系数据转换成XML文档,给出一个基于查询的关系模式到XML模式转换的有效算法。通过分析数据值基数和用户查询模式,采用列间的相等合并的方式,解决隐式参照完整性问题,最终结果用XML Schema表示。此算法能够避免关系模式转换成错误的XML Schema,并且能够全面有效地表达关系模式中的信息,实现有效信息的充分利用。  相似文献   

15.
因特网上有海量的数据信息,数据挖掘是从大量的数据中发现隐含的规律性内容,充分利用有用数据,废弃无用数据,解决数据的应用质量问题。通过对Web的数据挖掘和XML特点进行分析,讨论了使用XML实现基于Web的数据挖掘方法,提出了一种结合HTML、XMLJ、AVA的新型数据挖掘技术。  相似文献   

16.
网络上正在产生的大量的数据主要是HTML格式的数据,可以预计将来的网络上还将产生大量的数据,不过越来越多的将是XML格式。如何有效地存储和检索网络上的XML数据成为一个研究热点。由于数据库技术不断趋于成熟,一种方法是采用数据库对XML数据进行存储和查询等操作。其基本思想就是利用XML数据模式到数据库的数据模式的映射来存储。另外也可以采用文件形式来存储;还可以采用半结构化数据库存储或者采用面向对象数据库存储。  相似文献   

17.
在XML多核查询中,如果任务分配不均衡,各个核之间在完成处理时间上会产生较大差异,从而影响了最终结果的构建。本文针对XML多核查询中负载不均衡的情况,探讨了任务抢占策略在XML多核查询中的应用,分析并总结了现有的框架,提出了一种任务抢占策略。  相似文献   

18.
针对URMS的特点,在其查询组件中设计了一种基于流的XML查询算法.详细地介绍了由查询表达式构造查询自动机的步骤;实现了一个基于流的XML文档查询系统的原型.通过实验表明,提出的方法能够适应XML流的查询,在内存利用率上优于传统的基于内存的XML查询算法.  相似文献   

19.
Finding all occurrences of a twig pattern is a core operation of extensible markup language (XML) query processing. Holistic twig join algorithms, which avoid a large number of intermediate results, represent the state-of-the-art algorithms. However, ordered XML twig join is mentioned rarely in the literature and previous algorithms developed in attempts to solve the problem of ordered twig pattern (OTP) matching have poor performance. In this paper, we first propose a novel children linked stacks encoding scheme to represent compactly the partial ordered twig join results. Based on this encoding scheme and extended Dewey, we design a novel holistic OTP matching algorithm, called OTJFast, which needs only to access the labels of the leaf query nodes. Furthermore, we propose a new algorithm, named OTJFaster, incorporating three effective optimization rules to avoid unnecessary computations. This works well on available indices (such as B~-tree), skipping useless elements. Thus, not only is disk access reduced greatly, but also many unnecessary computations are avoided. Finally, our extensive experiments over both real and synthetic datasets indicate that our algorithms are superior to previous approaches.  相似文献   

20.
XML的数据存储实例分析   总被引:1,自引:0,他引:1  
XML是一种标准化的可以在Web上表示结构化信息的文本格式,利用它可以存储有复杂结构的数据信息。随着XML的发展,出现了许多与之相关的技术,如样式表技术和文件对象模型(DOM)。通过实例分析可知,使用XML作为存储数据的手段非常有意义。人们可以通过DOM对XML文件进行读写、查询和排序,与用RDBMS存储数据相比XML有一定的优势,并且可以和RDBMS存储数据相结合。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号