首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 156 毫秒
1.
随着网络技术的发展,XML的应用越来越广泛,它已经成为Internet上数据表示和交换的新标准,为了提高XML数据的查询效率,为XML数据建立索引是一种有效的方法。在压缩存储的思想下提出了基于Trie树结构的PATRICIA-TRIES索引结构。具体介绍了PATRICIA-TRIES索引结构建立的4个步骤:编码元素标签、编码元素值、建立索引树、设立头结点。该索引具有容量小、速度快的优点。实践证明,该方法是行之有效的。  相似文献   

2.
结合XML技术及半结构化数据索引和Lore系统中的索引结构,提出了一种特殊的XML数据索引建立的方法,及利用索引实现对XML查询的优化。  相似文献   

3.
基于HTML的传统搜索引擎限制了信息检索的查准率,XML(可扩展性标记语言)不仅支持自定义标记,还能表达语义,因而为提高网络搜索的准确性提供了可能。文章介绍了一种XML搜索引擎模型,研究了基于XML的搜索引擎实现的核心技术-索引技术,重点分析了一种基于DTD的XML索引技术及其优化算法。  相似文献   

4.
与标准的方法XQuery查询语言不同,XML文档的关键字查询能使用户方便地访问XML数据,不必考虑数据复杂模式和掌握复杂查询描述语言。文章对关键字查询中索引技术进行研究,提出了一种基于Dewey编码的查询索引进行解决,以综合分析XML数据的值信息和结构信息,达到子树返回和路径返回的精确查询的目标。  相似文献   

5.
XML文档压缩处理是XML数据管理研究领域的一个热点问题。本文在XML频繁标签模式的挖掘方法的基础上,采用频繁标签系列表示XML文档特征,提出了基于标签系列的XML文档的聚类技术,进而给出了XML文档压缩存储策略。  相似文献   

6.
对当前的XML索引需要改进的地方进行分析,给出了一个较通用的索引机制。首先提出一种XML文档编码规则,在此基础上设计支持路径查询和信息检索的索引结构,并给出了对文档重复元素和文本节点索引词汇进行归并处理的索引算法。索引算法只需对文档遍历一次,所得到的索引文件占用空间也比GUID和倒排文档少,并且利用这些索引文件能实现任意粒度、任意形式的内容、结构和属性查询。  相似文献   

7.
为了对异质异构数据资源进行语义集成并提供统一的智能访问接口, 利用语义Web技术发布机器可理解的数据资源及其之间的关系, 以支持智能搜索等功能. 介绍了中医药智能搜索引擎TCMSearch, 该搜索引擎的核心为一个集成语义知识库, 该知识库利用领域本体来表示中医药领域的实例及其之间的关系. 首先, 针对普通文本, 系统采用了机器学习的方法对其进行语义标注; 对于关系型数据库数据, 则采用了语义映射的方法统一其语义信息. 然后, 系统为集成的数据资源构建了一个语义索引, 该索引采用本体语言RDF/OWL进行表示, 从而支持一些强大的推理功能, 如类层次关系推理和实例关系推理. 最后,通过利用该语义索引以及其支持的推理功能, 系统能够在集成知识库的基础上提供智能化搜索, 如关联搜索、语义图浏览以及实例推荐等新功能.  相似文献   

8.
随着语料库语言学在语言研究领域的广泛应用,借用现代语料库技术分析文学作品中的语言使用特征,为语言学的研究提供了一种全新的视角和手段。借助Wordsmith Tools语料库索引软件的搜索功能,以英国小说家毛姆的代表作品《午宴》为语料,在语言学数据提取的基础上,通过基于词表的文本基本情况分析,基于主题词的故事情节分析,以及基于索引的修辞分析三个方面对这部作品中的语言使用特点进行数据解读,以期对于语料库的实证研究能有所借鉴。  相似文献   

9.
本文提出一种新的支持XML数据动态更新的编码方案(DUCX),并建立了支持XML数据动态更新的索引,提高了查询效率,支持单支、多支查询和多文档。  相似文献   

10.
大数据时代下信息爆炸式增长,全文检索技术是提高信息检索效率的有效方法。Lucene是一个采用Java编写的全文搜索引擎框架,它运用了面向对象的设计思想,提供了丰富的API。对Lucene的系统结构、索引流程、索引机制进行了详细分析,对应用Lucene引擎搭建全文搜索系统的关键问题进行了研究。  相似文献   

11.
随着网络技术的发展和XML的标准化,越来越多的信息以XML文档的形式表示和交换.针对如何对XML数据进行有效管理的问题,提出了一种将XML文档存储到关系数据库中的存储映射模型X2RDB,该模型首先对XMLSchema进行简化和处理,并由此构造对应的关系数据库模式,最终将XML文档中的数据提取并存储到关系数据库中.  相似文献   

12.
Querying XML data is a computationally expensive process due to the complex nature of both the XML data and the XML queries. In this paper we propose an approach to expedite XML query processing by caching the results of frequent queries. We discover frequent query patterns from user-issued queries using an efficient bottom-up mining approach called VBUXMiner. VBUXMiner consists of two main steps. First, all queries are merged into a summary structure named "compressed global tree guide" (CGTG). Second, a bottom-up traversal scheme based on the CGTG is employed to generate frequent query patterns. We use the frequent query patterns in a cache mechanism to improve the XML query performance. Experimental results show that our proposed mining approach outperforms the previous mining algorithms for XML queries, such as XQPMinerTID and FastXMiner, and that by caching the results of frequent query patterns, XML query performance can be dramatically improved.  相似文献   

13.
傅宇 《现代教育技术》2007,17(10):64-66,56
XML以其自身的简单性、可扩展性和标准化性等特点,将在远程网络教育中发挥重大的作用。本文讨论了应用XML文档作为网络考试中数据存储方式的实现,以及如何处理对试卷XML文档中节点数据存取和网络考试中意外断线后考生答案恢复。  相似文献   

14.
XML的出现,使得应用数据的信息表示更趋统一,但依然存在旧的数据与XML表示形式之间的差别,文章论述了关系模型和XML文档之间的数据描述的对应关系,以及以此为基础的XML文档与关系数据库之间转换的实现。  相似文献   

15.
XML只描述了文档的结构,却没涵盖数据的语义,而描述数据语义的本体语言不能直接对XML数据进行表述.针对这一问题,本文给出了从XML到RDF Schem a的转换算法,使用RDF的正式传输格式RDF/XML作为媒介,通过编程以相当直接的方式把存储在标准XML中的数据转换成RDF,为语义W eb环境下的智能处理提供了帮助.  相似文献   

16.
姜波  杨青 《教育技术导刊》2009,8(3):180-182
XML及其相关技术日益渗透至计算机科学的各个层面。分析了XML技术在文档内容管理领域的优势和应用,并重点对基于XML的文档内容管理系统的设计和具体实现进行了讨论。  相似文献   

17.
文章应用XML Schema设计元数据字典的通用模型,建立一个XML统一逻辑视图,使用XQuery查询语言对XML文档进行查询处理,为用户提供一个统一的查询接口,实现对分布式异构数据源的透明访问和集成检索,并给出了主要环节的实现方法.  相似文献   

18.
通过XML键与函数依赖之问的关系。提出了一种新的基于XML键的从XML模式到关系范式的转换算法。该算法先得到泛关系,再将XML键转换为简化函数依赖,最后保持函数依赖的把泛关系分解为关系范式,并且该关系范式保存了XML的语义约束信息。  相似文献   

19.
Technical editors ensure a document communicates with the reader. With XML, active server pages, and dynamic document creation, Web pages are no longer simple hand‐crafted text objects, but dynamic groupings of text assembled moments before the reader views the page. With dynamic documents, high‐level editing tasks will be, at best, vaguely defined during text creation. To maximize the information content, future technical editors require tighter control over information consistency and content.  相似文献   

20.
以高校社区医院的智能化信息平台为研究内容,提出一种以电子病历为中心的解决方案,阐述了采用的系统框架及技术路线,探讨了基于XML模板的数字化病历、基于改进EQQ模型的药品订购和基于多维数据挖掘的主动保健咨询等关键技术.通过原型系统的运行,验证了所提方法的可行性和实用性.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号