首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到17条相似文献,搜索用时 140 毫秒
1.
XML搜索引擎研究   总被引:1,自引:0,他引:1  
首先分析传统搜索引擎查准率不高的原因,然后介绍XML以及XML搜索引擎研究现状,并对XML搜索引擎所涉及的文档存储、索引、查询等关键技术进行详尽探讨。在此基础上,设计现行网络环境下的XML搜索引擎模型。认为该模型可充分利用XML文档的DTD模式信息,并能大幅度提高查询的准确率。  相似文献   

2.
基于XML的智能元搜索引擎研究   总被引:1,自引:0,他引:1  
介绍一种基于XML和Agent技术的智能元搜索引擎系统。该系统采用元搜索引擎的结构,以Agent作为架构系统的基本组件,利用Agent的自治性和协作性来完成用户个性化信息的搜索;利用XML和XSL分别在结构化信息表达方面,在信息显示、转换方面的优点,来实现元搜索引擎的扩展性以及搜索结果的个性化输出。最后探讨XML和XSL在查询请求和搜索结果转换上的应用以及基于XML的Agent通信。  相似文献   

3.
基于XML的全文检索原型系统的设计与实现*   总被引:1,自引:0,他引:1  
针对当前单位网站搜索引擎存在的索引速度慢、更新不及时、检索效率低等问题,在深入分析和研究Lucene和XML等技术在建立搜索引擎方面优越性能的基础上,构建一个基于XML的全文检索原型系统。该系统以XML作为通用数据接口,以Lucene作为实现平台,能够实现快速及时索引和提高检索效率的目的。  相似文献   

4.
基于Lucene的Ftp搜索引擎的设计   总被引:2,自引:0,他引:2  
针对当前网络中所使用的基于数据库的Ftp搜索引擎没有标准资源文档且不支持中文分词和动态数据更新的缺陷,提出基于Lucene这个功能强大的全文索引引擎工具包的Ftp搜索引擎的设计方案。此Ftp搜索引擎不仅能够自动生成标准格式的XML资源文档,而且采用基于字典的前向最大匹配中文分词法在Lucene中动态更新全文索引。该设计还能够对检索关键字进行中英文混合分析和检索。  相似文献   

5.
要高效开发利用网络资源,需要国家制定宏观政策,健全法律机制,综合利用IA、搜索引擎、词表导航、Web信息挖掘、XML、Push、网格等相关学科最新技术.在网络资源整合和细化的过程中.资源的个性化提供是开发利用的方向。  相似文献   

6.
基于XML的Dublin Core——建设数字图书馆的一种技术趋势   总被引:3,自引:0,他引:3  
XML是基于网络环境的处理电子信息资源新技术,Dublin Core与XML相结合是现代图书馆的发展趋势。图书馆长期使用MARC格式进行书目数据的交换,但是,它仅仅适用于图书馆系统间数据交换,必须借助Z39.50协议,在网络环境中有局限性。以Internet为背景的全球性信息资源要求数据及文档实现根本性的格式化和标准化,同时还要保持灵活的自定义空间,XML恰好满足了这个要求。Dublin Core与XML相结合有利于在网络环境下采用通用的搜索引擎等软件工具,通过多种途径检索到网上目标文献,为实现真正的数字图书馆奠定了坚实的基础。  相似文献   

7.
一、档案信息数据库开发现状 经过近十年的发展,我国的档案信息数据库建设已初具规模。各地建立起各具特色的档案信息数据库,档案信息网络建设逐渐加强。从技术层面看,已提出采用数据仓库技术和中间技术整合数据库;采用元数据技术、都柏林核心元素集、XML技术存储数据;采用WEB数据库技术、搜索引擎、指引库、  相似文献   

8.
用Delphi和Google Web API开发自己的搜索引擎   总被引:1,自引:0,他引:1  
简述Delphi是Google Web API提供的一种Web服务,允许开发人员选择自己喜爱的编程语言开发应用程序,通过基于XML的SOAP信息交换协议与远程的Google服务器连接来调用Google的Web服务;通过实例详细介绍用Delphi和GoogleWeb API开发搜索引擎的方法和步骤。  相似文献   

9.
搜索引擎从1990年诞生到1993年大批涌现,发展至今,主要类型有:目录式搜索引擎、机器人搜索引擎、垂直搜索引擎和元搜索引擎.未来的搜索引擎将朝着程序智能化、检索知识化和提供多媒体化方向发展.  相似文献   

10.
搜索引擎从1990年诞生到1993年大批涌现,发展至今,主要类型有:目录式搜索引擎、机器人搜索引擎、垂直搜索引擎和元搜索引擎。未来的搜索引擎将朝着程序智能化、检索知识化和提供多媒体化方向发展。  相似文献   

11.
Query languages for XML such as XPath or XQuery support Boolean retrieval: a query result is a (possibly restructured) subset of XML elements or entire documents that satisfy the search conditions of the query. This search paradigm works for highly schematic XML data collections such as electronic catalogs. However, for searching information in open environments such as the Web or intranets of large corporations, ranked retrieval is more appropriate: a query result is a ranked list of XML elements in descending order of (estimated) relevance. Web search engines, which are based on the ranked retrieval paradigm, do, however, not consider the additional information and rich annotations provided by the structure of XML documents and their element names.This article presents the XXL search engine that supports relevance ranking on XML data. XXL is particularly geared for path queries with wildcards that can span multiple XML collections and contain both exact-match as well as semantic-similarity search conditions. In addition, ontological information and suitable index structures are used to improve the search efficiency and effectiveness. XXL is fully implemented as a suite of Java classes and servlets. Experiments in the context of the INEX benchmark demonstrate the efficiency of the XXL search engine and underline its effectiveness for ranked retrieval.  相似文献   

12.
一种基于Native XML的全文检索引擎   总被引:5,自引:0,他引:5  
王弘蔚  肖诗斌 《情报学报》2003,22(5):550-556
随着XML的日益流行 ,基于XML的全文检索应用需求也迅速扩大。在这些应用中 ,native XML数据库是发展方向。虽然商业化的native XML数据库已经出现 ,但其全文检索的性能还不尽人意。本文提出一种方法 :在传统的倒排索引的框架下 ,对XML的标记建立索引 ,使得一个全文数据库能够以Native的方式存储、索引、检索和输出XML文档 ,成为一个真正意义上的native XML全文数据库 ,既有传统全文数据库的优越性能 ,又能满足基于na tive XML的应用需求  相似文献   

13.
This paper relates to the difficulty in retrieving precise information from big repositories of magazine articles in full text, and proposes an Extended Markup Language (XML) vocabulary for improving retrieval rates. The hypothesis tested was as follows: Magazine articles marked up with an XML vocabulary, indexed only by selected parts, give more precise search results than the same search using full text index.

The study was exploratory with the following characteristics: 29 magazine articles were tested for results, 8 scholars were interviewed for defining 23 search strategies and evaluating results. The data showed that precision improved from 40.72% with full text search to 62.84% using XML markup and searching only in specific labels.

Revision of the vocabulary and more testing has to be done by the library and information science community in order to obtain a valid vocabulary and provide more research results. Cultural characteristics and politics of librarians and information managers’ community are as important as technical issues in order to consider any technical proposal to be implemented successfully to achieve interoperability.  相似文献   

14.
This paper relates to the difficulty in retrieving precise information from big repositories of magazine articles in full text, and proposes an Extended Markup Language (XML) vocabulary for improving retrieval rates. The hypothesis tested was as follows: Magazine articles marked up with an XML vocabulary, indexed only by selected parts, give more precise search results than the same search using full text index.The study was exploratory with the following characteristics: 29 magazine articles were tested for results, 8 scholars were interviewed for defining 23 search strategies and evaluating results. The data showed that precision improved from 40.72% with full text search to 62.84% using XML markup and searching only in specific labels.Revision of the vocabulary and more testing has to be done by the library and information science community in order to obtain a valid vocabulary and provide more research results. Cultural characteristics and politics of librarians and information managers’ community are as important as technical issues in order to consider any technical proposal to be implemented successfully to achieve interoperability.  相似文献   

15.
XML 语言在数字化图书馆系统中的应用   总被引:2,自引:0,他引:2  
介绍了如何在数字化图书馆系统中运用XML语言的方法。并且说明了XML语言的特性及它与HTML语言的区别。利用韩国虚拟图书馆和信息系统(VINIS)中的一个子系统——基于XML语言的元数据搜索的实验系统来演示XML用法。元数据检索系统包括两个模块:搜索模块和浏览模块。搜索模块允许对储存在Access文件中的元数据进行搜索并且可以用XML语言的形式显示搜索结果,浏览模块允许浏览以XMUXSL文件形式存在的元数据。文章最后讨论了如何在数字化图书馆中更有效的运用XML语言。  相似文献   

16.
Abstract

Mozilla's Firefox web browser is well-known among developers for its functionality and extensibility. Now, with a market share of more than 8 percent, Firefox is becoming more popular with library users and offers opportunity to increase access to library tools through browser plugins. This tutorial explains how to integrate the library catalog into the Firefox search bar. Step-by-step instructions are provided for interpreting your library catalog's URL structure, building an XML file that will control how the search box functions when your search is selected, creating an icon, and testing the new search tool. This tutorial is appropriate for beginning to intermediate users.  相似文献   

17.
XML信息检索探究   总被引:4,自引:0,他引:4  
廖述梅  万常选  徐升华 《情报学报》2007,381(2):229-234
XML文档是具有层次结构和文本内容的半结构化数据。现有的Web信息检索是基于HTML文档的关键词全文检索,无法胜任XML元素粒度的检索;同时,XML数据库检索实现的是精确查找,检索结果无排序支持。因此,融合信息检索和数据库技术研究XML检索问题成为必然。本文从XML检索的问题域出发,阐述了XML信息检索(XML IR)的国内外研究现状与特点,并分析了目前XML IR的热点和难点问题。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号