共查询到10条相似文献,搜索用时 31 毫秒
1.
针对传统web数据集成系统实用性、伸缩性和适应性差的问题,提出了一种新的web 数据集成系统体系结构,实现web规模的数据集成。系统支持用户提交关键词查询、提取用户查询模式、映射相关领域、选择web数据库、执行查询排序查询结果。介绍了组成系统的关键组件,及创建Deep Web索引、领域映射和用户模式匹配等处理大规模异构web数据的关键技术。 相似文献
2.
基于AOL查询日志数据集,在不给定查询意图类目体系情况下,尝试利用查询重构来识别用户查询意图。主要探讨如何识别出能表达原查询用户意图的查询重构以及如何对识别的查询意图进行聚类两个问题。人工评测结果表明,该方法能够取得较好的实验效果。 相似文献
3.
查询背后的信息需求被定义为查询意图,搜索引擎可以根据不同的查询意图,提供多样性的服务,优化检索效果.查询意图的识别多被看成是一种分类问题,现有的大多数方法都基于查询串文本本身的特征和查询的用户点击数据特征.这两种方法存在如下的困难:对于查询串的文本特征,查询比较短,特征比较稀疏,要进行比较准确的理解会比较困难;对于用户点击特征,由于用户提交查询的长尾性分布,大多数查询的提交次数都是较少的,对于这些查询,要判别它们的意图是比较困难的.为了克服长尾查询上查询意图判断的不可靠问题,本文提出利用查询结果的相关性分数的分布作为特征来判断查询意图的方法.这种方法依赖查询结果的特征,比查询串本身的特征更加丰富;同时不依赖于用户的点击数据,因此可以克服长尾查询上的困难.结果表明,使用结果分数分布,可以提高意图判别的准确程度. 相似文献
4.
随着社交网络的兴起和发展,互联网上出现了大量与商品有关的社会信息。如何利用这些社会信息结合商品元数据进行检索和推荐是信息检索领域中一个热门的研究问题。本文以社会图书检索为例,提出了一种通用的信息检索方法来解决这一问题。首先,通过分析原始图书数据集和图书的用户标签、用户评分和流行度等社会信息,从图书中提取不同的社会特征构建特征矩阵;然后分别计算图书在各种社会特征上的相似度,并使用不同的策略对搜索引擎返回的排序结果进行重排序;最后使用学习排序的方法进行重排结果融合,得到最终的图书检索结果。在实验中,使用该检索方法在INEX Social Book Search 2015和2016数据集上分别进行了训练和测试。结果表明,相比现有的技术,该检索方法能够有效提升图书检索的效果。 相似文献
5.
朱李礼 《现代图书情报技术》2008,(Z1)
随着军事数字图书馆的发展,如何检索放置于不同地方的不同格式的数据信息,以及为检索者提供统一的访问接口,是当前亟待解决的问题.提出并建立一个适合军事数字图书馆使用的基于全局数据模式的异构数据源集成体系结构,采用XQuery作为全局查询语言,依据查询分解算法完成数据的检索.同时,采用自主访问与强制访问控制策略提高系统的整体安全性.该技术较好解决军事数字图书馆的异构数据源集成问题,实现跨平台信息的共享和统一访问. 相似文献
6.
面对因特网的海量信息,为了更好地实现基于用户兴趣的个性化信息服务,提出一种隐式地获取并更新用户兴趣模型的方法利用用户模型捕捉用户的点击历史信息如何同其兴趣相关;基于用户模型的学习模型通过学习用户的点击历史数据来标识用户的个人兴趣;通过学习到的用户喜好信息来对搜索结果予以再排序,从而实现个性化搜索信息呈现.设计了用户兴趣学习算法与个性化排序算法.实时数据实验显示,即使在用户兴趣主题数增加的情况下,本方法仍能较好地描述用户的兴趣类型及兴趣度,提高个性化信息服务的质量与效率. 相似文献
7.
8.
如何在查询中得到最好、最快所需要的信息,Web查询方法以及Web数据库的选择方式最为重要。本文提出基于Web数据库的查询表示方法,在用户查询与组织条件的数据模型建立的基础上,提出了用户相关匹配与查询统计分析,进行在用户查询请求过程中Web数据库选择方法研究。 相似文献
9.
本文利用大规模搜索日志对用户中文长句查询的情况进行了统计研究.通过分析搜索日志中的中文长句查询确定了经常发生的查询类型特点,并对用户搜索行为与查询长度、查询类型和查询频率的关系进行了研究.进一步了解了session中用户查询词修改情况,总结了用户查询修改方法和长度修改方面的特征和规律.最后,将不同长度的查询放到了三个商业搜索引擎中分别进行检索,计算其重叠率.通过以上的分析研究发现虽然目前大部分查询都是短查询,但短查询并不能满足用户所有的检索需求,特别是在搜索引擎向语义检索不断发展的今天,长句检索的分析和利用能够从更深层次上了解用户的查询用语特点和搜索点击行为,这对于查询技术的改进和语义空间的构建都具有积极的作用. 相似文献