首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 15 毫秒
1.
基于OKAPI的XML信息检索实现研究   总被引:3,自引:1,他引:3  
OKAPI能实现强大的自由文本检索与评价功能,但要实现基于XML的信息检索,却要做适当改造。改造时,一方面尽量不破坏原有系统的体系结构,又要能实现对XML文档的索引、查询和表示。为此,必须完成面向XML的文档预处理和索引、面向XML的文档检索及检索模型的选择。图3。公式3。参考文献10。  相似文献   

2.
图像对象特征值的抽取、存储、转换、显现的实现有多种方法,SIMIIRS系统主要采用了数据库方法和XML方法。文章主要讨论了图像资源的XML描述方法、建立图像信息的XML索引文档,检索XML文档以实现图像信息查询与提供。  相似文献   

3.
在分词技术、索引技术、结构化查询语言技术的基础上,提出了一个基于XML文档数据库的信息检索系统,这一系统模型主要由分词模块、索引模块及查询模块组成。  相似文献   

4.
视频元数据全文检索系统的研究与实现   总被引:3,自引:0,他引:3  
陈玮  陆达 《情报学报》2004,23(1):32-35
本文阐述了采用XML文档按照MPEG 7标准描述视频数据的趋势 ,研究了适合于半结构化视频描述的全文检索索引结构。该索引保存了文档中的结构信息 ,从而可以对视频数据进行全方位多层次的查询。提出了一些缩减索引空间的策略和算法。  相似文献   

5.
XML搜索引擎研究   总被引:1,自引:0,他引:1  
首先分析传统搜索引擎查准率不高的原因,然后介绍XML以及XML搜索引擎研究现状,并对XML搜索引擎所涉及的文档存储、索引、查询等关键技术进行详尽探讨。在此基础上,设计现行网络环境下的XML搜索引擎模型。认为该模型可充分利用XML文档的DTD模式信息,并能大幅度提高查询的准确率。  相似文献   

6.
电子信息资源数据库检索系统的开发与实现   总被引:3,自引:0,他引:3       下载免费PDF全文
采用XML查询技术和显示格式 ,可开发出电子信息资源数据库检索系统 ,能实现模板基本查询、格式化显示及XML文档高级查询等功能。其乱码输出、模糊匹配等问题也可解决。参考文献 5。  相似文献   

7.
XML文档通常用于数据的描述、存储和交换,缺乏有效的信息查询手段将限制其进一步的应用。本文简介了XML查询语言XQuery,探讨了基于ASP.NET的XQuery处理器网站的功能和实现,描述了.NET平台下XQuery处理器的技术要点和实现代码,给出并分析了XQuery在图书管理中的几个应用实例。  相似文献   

8.
XML文档素数编码具有较低的编码存储空间以及在XML查询中具有较高的效率,本文利用文档对象模型DOM提供的APIs设计了获取XML文档树对应的素数编码算法Prime-DOM,实验结果显示Prime-DOM算法能够给每个XML节点分配正确的素数编码。  相似文献   

9.
作为Internet网络的标准之一,XML文档通常用于文本数据的描述、存储和交换。本文讨论了用XML文档存储图片的技术方案,包括XML文档结构、图片存储、在线提交、下载和显示,描述了各个功能步骤的技术要点,并给出了基于ASP.NET的程序代码。本文探讨的基于纯XML文档和ASP.NET的图片管理技术具有无数据库驱动、易于实现等特点。  相似文献   

10.
有效避免伪反馈的"查询主题漂移"主要需要解决两大问题,一是如何确定相关文档,形成较高质量的伪相关文档集,另一个是在伪相关文档集里如何挑选扩展信息.本文主要研究在获取了高质量伪相关文档集合的基础上如何有效进行XML查询扩展.针对XML文档的特点,提出了扩展向量空间模型的查询词扩展方法.实验结果表明,与初始查询和传统的词项扩展方法相比,该扩展方法更能获得与用户查询意图相关的扩展信息,更能有效地提高检索质量和性能.  相似文献   

11.
查询扩展技术通过向初始查询请求加入相似或相关的词,组成更为准确的扩展查询表达式,来减少查询请求与相关文献在表达上的不匹配现象,改善检索性能.与传统的查询扩展不同,XML查询扩展不仅要对文档内容进行有效扩展,而且还要考虑结构扩展.本文提出了一种基于伪反馈的XML查询扩展方法,将初始检索结果聚类,获得与查询请求最为相关的文档簇,然后在文档簇中抽取词组,找到符合用户查询意图的扩展查询词组,并在扩展查询词组的基础上进行结构扩展,最终形成完整的"内容+结构"的查询扩展表达式.相关实验结果表明,相对没有扩展的查询,所提方法具有更好的精度.  相似文献   

12.
Lucene全文检索的应用及检索效率测试研究   总被引:1,自引:0,他引:1  
使用Lucene设计一个全文检索系统,系统由三大功能模块组成:索引模块、检索模块和存储模块.第二部分着重分析PDF数据转换,XML文档设计,索引的分词、建立及效率等技术难点,并对中文分词分析器、索引文件膨胀率、索引影响因子及检索系统并对检索响应时间进行测试.应关注XML数据库的安全性.  相似文献   

13.
一种基于Native XML的全文检索引擎   总被引:5,自引:0,他引:5  
王弘蔚  肖诗斌 《情报学报》2003,22(5):550-556
随着XML的日益流行 ,基于XML的全文检索应用需求也迅速扩大。在这些应用中 ,native XML数据库是发展方向。虽然商业化的native XML数据库已经出现 ,但其全文检索的性能还不尽人意。本文提出一种方法 :在传统的倒排索引的框架下 ,对XML的标记建立索引 ,使得一个全文数据库能够以Native的方式存储、索引、检索和输出XML文档 ,成为一个真正意义上的native XML全文数据库 ,既有传统全文数据库的优越性能 ,又能满足基于na tive XML的应用需求  相似文献   

14.
随着Web的发展,XML文档的应用越来越广泛。目前针对XML文档的查询处理.已有的查询策略往往需要判断结点的祖先/后代关系,因而对结点要进行编码。但是目前的编码技术.有的在文档更新时需要重新对XML文档进行编码,有的支持XML文档更新但需要庞大的存储空间。本文提出了一种基于层次结构的编码方案,不仅可以在线性时间内判断两个结点的祖先/后代关系,并且可以优化存储。  相似文献   

15.
HTML到XML转换技术的研究与实现   总被引:2,自引:0,他引:2  
网络上大多数的信息都是用HTML写的,这种语言不能处理网络上的很多需求,因为它只是一种用于浏览信息的语言,不能表达数据本身,网络还没有形成一个良好的结构化文档的存贮,而只是一个可变的HTML页的聚集,我们迫切希望来自网络资源的信息以一种结构化的方式来存贮。XML和它的各种扩展功能如数据模型、查询语言等是实现结构化方式的一种,是一种元语言,可以弥补很多HTML的不足。未来的网页会使用具有很好结构化的XML语言,但是现在这一阶段是过渡阶段,必须思考一种方法来实现HTML到XML的转换.以更好地利用网络资源。本文提出了一种实现HTML到XML转换的方法。  相似文献   

16.
深入研究一系列保持完整性约束的关系模式到XML Schema的转换规则和算法,对转换规则和算法中的不足进行补充完善。针对转换后XML Schema中存在基于XPath相对路径无效查询问题,提出在模式转换过程中建立相应索引文件的方法。文中给出了应用实例,说明对XML Schema查询时可以获取关系结构信息,提高查询效率。  相似文献   

17.
本文介绍了XML(扩展型标记语言)的基本概念和其实现技术方法,通过实例说明了XML的结构化文档技术,类型定义方法。运用不同的XSL方式将XML中的数据用HTML格式表示出来,并在IE5.0下实际运行。文章对XML的应用前景作了讨论。  相似文献   

18.
基于用户相关反馈的带结构语义的XML查询词扩展   总被引:1,自引:0,他引:1  
在XML文档的信息检索中,检索质量不高的一个主要原因是用户难以提出准确描述其查询意图的查询表达式,而查询扩展技术被认为是可以帮助用户构建符合其查询意图的查询表达式.本文在XML信息检索中提出了基于用户相关反馈的查询扩展技术,在查询扩展中除了考虑词频因素外还充分考虑了XML文档的结构特点对于扩展查询词选取的影响,包括文档中元素的语义权重、元素所在层次和词项与初始查询词间的距离因素对于扩展查询词选取的影响.实验证明本方法是可行的,且能较好地提高检索结果的准确率.  相似文献   

19.
XML文档的数据库转换技术研究*   总被引:3,自引:0,他引:3  
概述目前XML的几种存储方法,简单分析科技论文的文档类型,最后采用SQL Server 2000对PDF格式的科技论文经元数据信息抽取后所生成的XML文档实现具体的XML的数据库转换。  相似文献   

20.
基于XML的全文检索原型系统的设计与实现*   总被引:1,自引:0,他引:1  
针对当前单位网站搜索引擎存在的索引速度慢、更新不及时、检索效率低等问题,在深入分析和研究Lucene和XML等技术在建立搜索引擎方面优越性能的基础上,构建一个基于XML的全文检索原型系统。该系统以XML作为通用数据接口,以Lucene作为实现平台,能够实现快速及时索引和提高检索效率的目的。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号