首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 78 毫秒
1.
随着Web的发展,XML文档的应用越来越广泛。目前针对XML文档的查询处理.已有的查询策略往往需要判断结点的祖先/后代关系,因而对结点要进行编码。但是目前的编码技术.有的在文档更新时需要重新对XML文档进行编码,有的支持XML文档更新但需要庞大的存储空间。本文提出了一种基于层次结构的编码方案,不仅可以在线性时间内判断两个结点的祖先/后代关系,并且可以优化存储。  相似文献   

2.
王知津  赵洪 《图书馆杂志》2007,26(11):20-26
传统的关键词检索技术在文本检索和HTML文档检索上得到了广泛的应用,但它运用于检索XML文档时却不尽如意.为此,本文引入一种改进的遗传算法,对XML文档上的关键词检索进行了研究,提出了XML文档标记的自适应遗传训练算法与XML文档上关键词语义检索及结果排序算法.  相似文献   

3.
近年来XML凭借其自身的简单性、半结构化、可扩展性、自描述性等特点,逐渐成为了互联网数据表示和数据交换的标准.XML文档聚类是数据挖掘研究中热点一个,为网络信息资源的搜集、组织及检索利用提供良好的技术支持.本文首先介绍了目前主要的XML文档聚类算法,然后在利用WordNet对XML文档中的标记进行语义消歧的基础上,提出了一种新的基于语义标记树的XML文档相似度计算方法,并通过最近邻算法进行聚类,最后在用于XML检索研究的数据集上进行实验,证实其确实是一种比较有效的XML文档聚类方法.  相似文献   

4.
XML(可扩展标记语言)正在成为Web数据交换的标准格式.随着XML格式的半结构数据的大量出现,如何处理和管理XML文档已经成为了一个研究热点.XML文档聚类作为XML数据处理的重要课题,是指将具有类似特征的XML文档聚集成簇.现有的大部分XML文档聚类是基于文档结构特征的.本文提出了一个新的结构与内容相结合的XML文档聚类方法.首先从文档中抽取构件向量,并把文档转换为向量化的表示.然后,在文档相似度计算的基础上,引入一个层次聚类方法对XML文档进行聚类.在DBLP XML记录集上进行的实验表明该方法具有可行性并且性能明显优于已有方法.  相似文献   

5.
新一代可扩展置标语言XML具有面向文档、面向数据和面向语义的功能,能够很好地保证文档一体化过程所产生的电子文件的凭证价值,因此,XML已经成为文档一体化过程中不可或缺的工具.本文从多层次、多角度对文档一体化领域中XML的研究现状进行了统计,并对统计的结果进行了阐述.  相似文献   

6.
作为Internet网络的标准之一,XML文档通常用于文本数据的描述、存储和交换。本文讨论了用XML文档存储图片的技术方案,包括XML文档结构、图片存储、在线提交、下载和显示,描述了各个功能步骤的技术要点,并给出了基于ASP.NET的程序代码。本文探讨的基于纯XML文档和ASP.NET的图片管理技术具有无数据库驱动、易于实现等特点。  相似文献   

7.
本文对文本型的电子文件保护技术进行了探讨,提出了简单而有效的文档保护算法,其保护重点在于其一致性和完整性,算法的基础是基于哈夫曼树的二进制编码,通过对原始电子文件的二进制压缩编码形成了以压缩文件为中心的,包括原始文档、压缩文件,数字指纹三为一体的文档保护机制,从而保证了文档的一致性与完整性。  相似文献   

8.
XML文档相似度计算方法研究   总被引:1,自引:0,他引:1  
XML(可扩展标记语言)正在成为Web上各种应用交换信息的标准.随着XML格式的半结构数据的大量出现,如何处理和管理XML文档已经成为了一个研究热点.XML文档的相似度计算是XML数据处理的重要课题,是XML文档聚类与检索的关键技术.XML文档由逻辑结构(structure)和文本内容(content)构成,可以根据结构特征或内容特征来度量XML文档之间的相似度.本文将XML文档的相似度计算方法分为基于结构的和结构与内容相结合的两类,并对各种已有的XML文档相似度计算方法进行了比较和述评.  相似文献   

9.
潘有能  丁楠 《情报学报》2007,26(3):350-355
本文首先介绍了XML文档和DTD标记树的生成方法,并对标记树中节点的概念进行了扩充,使之不但包括元素,同时也包括连接符,以适应DTD结构的要求。随后将标记树中的元素分为共有元素、文档元素和DTD元素,并提出层次权重和结构权重以衡量元素的层次和结构复杂程度,给出具体计算方法。在此基础上提出了一个衡量XML文档和DTD之间相似度的算法,将其应用于XML文档自动分类中,并给出该算法的时间复杂度计算公式。从实验结果可以看出,该分类方法准确率较高。  相似文献   

10.
由于受到信息安全和检索效率等因素的限制,怎样能在信息安全的基础上提升科技文档共享的广泛性和深入性成为一个亟待解决的问题。本文引入结构化的科技文档资源存储模式,在此基础上实现基于知识库的高效检索策略,通过构建科技文档的采集与分词算法,实现了基于XML的语义检索。  相似文献   

11.
视频元数据全文检索系统的研究与实现   总被引:3,自引:0,他引:3  
陈玮  陆达 《情报学报》2004,23(1):32-35
本文阐述了采用XML文档按照MPEG 7标准描述视频数据的趋势 ,研究了适合于半结构化视频描述的全文检索索引结构。该索引保存了文档中的结构信息 ,从而可以对视频数据进行全方位多层次的查询。提出了一些缩减索引空间的策略和算法。  相似文献   

12.
用JAVA+XML实现网站全文检索   总被引:2,自引:0,他引:2  
介绍了用JAVA和XML实现网站站内全文检索的实现过程,即用java编写索引工具,对WEB文档进行索引,索引结果写入XML文档;用Servlet和JDOM实现读取和查询XML文档,并在客户返回查询结果。  相似文献   

13.
利用关系数据库实现对PubMed中RSS定制服务的统一管理   总被引:2,自引:0,他引:2  
RSS是一种描述和同步网站内容的格式,它是XML的一种形式。作为一个生物医学专业文献数据库服务网站,PubMed也开始提供RSS服务。本文介绍了如何将PubMed中RSS定制服务结果这种XML格式的文档通过Dietz编码存储到本地关系型数据库中进行管理,这样用户可以通过对本地数据库进行访问便会得到PubMed所提供的定制服务。  相似文献   

14.
XML文档的数据库转换技术研究*   总被引:3,自引:0,他引:3  
概述目前XML的几种存储方法,简单分析科技论文的文档类型,最后采用SQL Server 2000对PDF格式的科技论文经元数据信息抽取后所生成的XML文档实现具体的XML的数据库转换。  相似文献   

15.
XML文档的约束及其应用探讨   总被引:1,自引:0,他引:1  
在XML文档中应用约束机制,可以保证其数据的规范性、一致性和有效性。文章讨论了两类XML约束,一类是基于XML模式语言XSD或文档类型定义DTD的基本约束,另一类是自定义约束——XML函数依赖,描述了这两类约束及约束验证方式。在探讨XML约束机制的同时,结合图书馆具体业务,给出并分析了几个XML约束和XML文档的实例。  相似文献   

16.
XML文档和数据库的集成   总被引:1,自引:0,他引:1  
向桂林 《图书馆杂志》2002,21(7):47-51,64
本文首先阐述了需要把XML文档和数据库集成的原因;然后针对描述MBAR书目记录的XML文档,详细说明了把XML文档与数据库集成的办法;最后指出了转换过程中可能出现的一些问题。  相似文献   

17.
XML信息检索探究   总被引:4,自引:0,他引:4  
廖述梅  万常选  徐升华 《情报学报》2007,381(2):229-234
XML文档是具有层次结构和文本内容的半结构化数据。现有的Web信息检索是基于HTML文档的关键词全文检索,无法胜任XML元素粒度的检索;同时,XML数据库检索实现的是精确查找,检索结果无排序支持。因此,融合信息检索和数据库技术研究XML检索问题成为必然。本文从XML检索的问题域出发,阐述了XML信息检索(XML IR)的国内外研究现状与特点,并分析了目前XML IR的热点和难点问题。  相似文献   

18.
介绍一种解释XML文档语义的方法。该方法使用RDF Schema描述的本体来对XML文档进行语义提取,并将结果以RDF数据模式(三元组)表现出来。  相似文献   

19.
可扩展标记语言XML及其在数字图书馆中的应用   总被引:3,自引:0,他引:3  
李慧 《图书情报工作》2001,45(12):43-46
介绍XML的特点、文档结构和相关技术,并对XML在数字图书馆中的应用进行探讨。  相似文献   

20.
基于OKAPI的XML信息检索实现研究   总被引:3,自引:1,他引:3  
OKAPI能实现强大的自由文本检索与评价功能,但要实现基于XML的信息检索,却要做适当改造。改造时,一方面尽量不破坏原有系统的体系结构,又要能实现对XML文档的索引、查询和表示。为此,必须完成面向XML的文档预处理和索引、面向XML的文档检索及检索模型的选择。图3。公式3。参考文献10。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号