共查询到18条相似文献,搜索用时 187 毫秒
1.
图像对象特征值的抽取、存储、转换、显现的实现有多种方法,SIMIIRS系统主要采用了数据库方法和XML方法。文章主要讨论了图像资源的XML描述方法、建立图像信息的XML索引文档,检索XML文档以实现图像信息查询与提供。 相似文献
2.
基于XML的词典信息组织技术 总被引:3,自引:0,他引:3
如何有效地组织词典信息,是词典数字化出版首要关注的问题。本文针对词典信息的特点,引入基于XML的文档组织技术,并探讨该XML数据库的存储方式和索引机制,设计一种存储XML文档的中粒度的关系数据库模式。 相似文献
3.
4.
XML文档相似度计算方法研究 总被引:1,自引:0,他引:1
XML(可扩展标记语言)正在成为Web上各种应用交换信息的标准.随着XML格式的半结构数据的大量出现,如何处理和管理XML文档已经成为了一个研究热点.XML文档的相似度计算是XML数据处理的重要课题,是XML文档聚类与检索的关键技术.XML文档由逻辑结构(structure)和文本内容(content)构成,可以根据结构特征或内容特征来度量XML文档之间的相似度.本文将XML文档的相似度计算方法分为基于结构的和结构与内容相结合的两类,并对各种已有的XML文档相似度计算方法进行了比较和述评. 相似文献
5.
基于XML的PDF文档信息抽取系统的研究* 总被引:3,自引:0,他引:3
首先设计了科技论文的DTD文档,然后分析了PDF文档的结构。在此基础上, 我们介绍了PDF文档信息抽取系统的设计框架。该框架以上述DTD为模板,把以PDF格式表示的科技论文解析转换为有效的XML文档。 相似文献
6.
基于OKAPI的XML信息检索实现研究 总被引:3,自引:1,他引:3
OKAPI能实现强大的自由文本检索与评价功能,但要实现基于XML的信息检索,却要做适当改造。改造时,一方面尽量不破坏原有系统的体系结构,又要能实现对XML文档的索引、查询和表示。为此,必须完成面向XML的文档预处理和索引、面向XML的文档检索及检索模型的选择。图3。公式3。参考文献10。 相似文献
7.
孙辉 《现代图书情报技术》2004,20(9):58-60
基于RDBMS的XML数据存储方法有多种,本文认为它们大体上可分为两类。第一类方法是根据XML文档数据的物理结构设计关系模式,第二类方法是根据XML文档数据的逻辑结构设计关系模式,即根据XML的结构定义(DTD或XML Schema)来设计关系表,第一类方法还可分为基于边的存储和基于结点的存储。本文将结合XML文档实例对上述方法进行分析和探讨。 相似文献
8.
基于XML的Web日志挖掘研究* 总被引:2,自引:0,他引:2
潘有能 《现代图书情报技术》2006,1(5):62-64
设计一个基于XML的Web日志挖掘体系结构,简要介绍XGMML和LOGML,并在此基础上讨论LOGML文档的生成方法及利用Apriori算法对日志文档进行频繁集、频繁序列和频繁子图挖掘。 相似文献
9.
基于XML与ASP.NET的书评网的设计与实现 总被引:1,自引:0,他引:1
张健 《图书馆理论与实践》2006,(1):99-101
首先分析了基于Internet/Intranet的书评网站系统的总体功能和运行流程,然后设计了存储读者及书评信息的XML文档的结构,并给出了基于ASP.NET的技术要点及其代码的系统实现。所探讨的基于纯XML文档和ASP.NET的技术方案具有无数据库驱动、部署灵活、维护简单等特点。 相似文献
10.
本文围绕PDF文档转化为XML和数字图书重组等数字图书跨终端出版的关键技术,详细描述了一套跨终端数字图书出版的设计方案.文章首先分析了PDF文档的结构,再在此基础上对PDF进行版面分析和文本内容提取,形成描述文件结构和内容的XML文档,最终实现基于XML文档的跨终端出版设计. 相似文献
11.
12.
13.
XML retrieval is a departure from standard document retrieval in which each individual XML element, ranging from italicized words or phrases to full blown articles, is a retrievable unit. The distribution of XML element lengths is unlike what we usually observe in standard document collections, prompting us to revisit the issue of document length normalization. We perform a comparative analysis of arbitrary elements versus relevant elements, and show the importance of element length as a parameter for XML retrieval. Within the language modeling framework, we investigate a range of techniques that deal with length either directly or indirectly. We observe a length-bias introduced by the amount of smoothing, and show the importance of extreme length bias for XML retrieval. We also show that simply removing shorter elements from the index (by introducing a cut-off value) does not create an appropriate element length normalization. Even after restricting the minimal size of XML elements occurring in the index, the importance of an extreme explicit length bias remains. 相似文献
14.
基于域加权词频法的XML文档级检索实现与评价 总被引:1,自引:0,他引:1
利用BM25F模型,通过实验,在INEX 04数据集的基础上,实现了对多个域(元素)词频进行加权的XML文档级检索。XML文档结构的确蕴含了一定的语义信息。利用这些语义信息,可以提高检索性能。表2。图1。参考文献16。 相似文献
15.
This study introduces a novel framework for evaluating passage and XML retrieval. The framework focuses on a user’s effort
to localize relevant content in a result document. Measuring the effort is based on a system guided reading order of documents.
The effort is calculated as the quantity of text the user is expected to browse through. More specifically, this study seeks
evaluation metrics for retrieval methods following a specific fetch and browse approach, where in the fetch phase documents
are ranked in decreasing order according to their document score, like in document retrieval. In the browse phase, for each
retrieved document, a set of non-overlapping passages representing the relevant text within the document is retrieved. In
other words, the passages of the document are re-organized, so that the best matching passages are read first in sequential
order. We introduce an application scenario motivating the framework, and propose sample metrics based on the framework. These
metrics give a basis for the comparison of effectiveness between traditional document retrieval and passage/XML retrieval
and illuminate the benefit of passage/XML retrieval. 相似文献
16.
一种基于Native XML的全文检索引擎 总被引:5,自引:0,他引:5
随着XML的日益流行 ,基于XML的全文检索应用需求也迅速扩大。在这些应用中 ,native XML数据库是发展方向。虽然商业化的native XML数据库已经出现 ,但其全文检索的性能还不尽人意。本文提出一种方法 :在传统的倒排索引的框架下 ,对XML的标记建立索引 ,使得一个全文数据库能够以Native的方式存储、索引、检索和输出XML文档 ,成为一个真正意义上的native XML全文数据库 ,既有传统全文数据库的优越性能 ,又能满足基于na tive XML的应用需求 相似文献
17.