首页 | 本学科首页   官方微博 | 高级检索  
     检索      

一种支持高效检索的实时更新倒排索引策略
引用本文:李栋,史晓东.一种支持高效检索的实时更新倒排索引策略[J].情报学报,2006,25(1):16-20.
作者姓名:李栋  史晓东
作者单位:1. 厦门大学软件学院,厦门,361005
2. 厦门大学计算机科学系,厦门,361005
摘    要:最近的研究使得搜索引擎中搜取的网页文档与万维网的变化越来越同步。为使用户通过搜索引擎获取网络上的最新信息,必须加快倒排索引的更新。本文介绍了使用界标和增加/删除网页文档两种典型的倒排索引更新策略,并分析了它们的优缺点,提出了一种支持高效检索的实时更新倒排索引策略。这种策略综合了减少更新操作、加快实时更新和缩短用户查询响应时间等方面的优点,较好地适应了当前网络内容变化的特点。最后通过实验对这种策略进行了验证。

关 键 词:搜索引擎  倒排索引  更新策略  界标
修稿时间:2005年4月26日

An On-Line Updates Inverted Index Strategy Which Supports High Efficient Searching
Li Dong,Shi Xiaodong.An On-Line Updates Inverted Index Strategy Which Supports High Efficient Searching[J].Journal of the China Society for Scientific andTechnical Information,2006,25(1):16-20.
Authors:Li Dong  Shi Xiaodong
Abstract:Recent work on incremental crawling has enabled the document collection of a search engine be more synchronized with the changing World Wide Web.The inverted index should be updated more frequently than ever in order to enable users get the last information from the web through the search engine.This paper represents two strategies for updating inverted index,which are adding/deleting documents and using landmarks.Based on the analysis and synthesis of advantages and disadvantages of these two strategies,proposes an on-line updates inverted index strategy which supports the high efficient searching from viewpoints of decreasing update operations,speeding real-time update and shortening the response time of user's query.At last,verifies this strategy by experiments.
Keywords:search engine  inverted index  update strategy  landmark    
本文献已被 CNKI 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号