首页 | 本学科首页   官方微博 | 高级检索  
     检索      

搜索引擎中的网页加权索引
引用本文:王树梅,金澎,吴慧中.搜索引擎中的网页加权索引[J].情报学报,2003,22(5):557-560.
作者姓名:王树梅  金澎  吴慧中
作者单位:1. 南京理工大学计算机科学与技术系,南京,210014
2. 乐山师范学院计算机科学和技术系,四川乐山,6140044
摘    要:如何对索引词加权是信息检索中的一个关键技术。本文针对搜索引擎检索的对象是Web页面这一特点 ,通过分析HTML标签的修饰功能 ,结合传统的tf idf加权公式 ,对网页进行加权索引。实验证明对于精确匹配 ,在查全率较低时系统的查准率有较大的提高。

关 键 词:信息检索  搜索引擎  HTML
修稿时间:2002年7月22日

Web Pages to Weight the Index for Search Engine
Wang Shumei.Web Pages to Weight the Index for Search Engine[J].Journal of the China Society for Scientific andTechnical Information,2003,22(5):557-560.
Authors:Wang Shumei
Abstract:It is a key technique to weight the index in information retrieval. As for search engine, it is designed to find the Web pages which the user need. In order to weight the index, we explore the feature of the Web pages that they are written in HTML. The experiment demonstrates that the precision is improved compared with the traditional method (tf * idf) when the recall is low.
Keywords:information retrieval  search engine  HTML    
本文献已被 CNKI 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号