首页 | 本学科首页   官方微博 | 高级检索  
     检索      

基于页面内容和链接结构的超链接主题预测算法
引用本文:刘红,邵晓良,胡吉兵.基于页面内容和链接结构的超链接主题预测算法[J].现代图书情报技术,2005,21(5):41-45.
作者姓名:刘红  邵晓良  胡吉兵
作者单位:解放军第二军医大学网络信息中心,上海,200433
摘    要:主要介绍了设计开发Web主题信息采集系统的一个核心算法——超链接主题预测算法。文章在已有理论的基础上,通过实验分析,发现超链接的主题主要取决于三个因素:父网页的主题相关度、锚文本的主题相关度和Web子图的链接结构特性,从而提出了基于Web页面内容和链接结构的超链接主题预测算法,系统评价结果显示该算法有很好的效果。

关 键 词:Web结构  超链接  主题  预测  算法
收稿时间:2004-12-31
修稿时间:2004年12月31

The Algorithm of Forecasting URL-Topic Based on Web Structure  and Web Page Contents
Liu Hong,Shao Xiaoliang,Hu Jibing.The Algorithm of Forecasting URL-Topic Based on Web Structure  and Web Page Contents[J].New Technology of Library and Information Service,2005,21(5):41-45.
Authors:Liu Hong  Shao Xiaoliang  Hu Jibing
Institution:(The Network Information Center of  Second Military Medical University, Shanghai  200433, China)
Abstract:This paper introduces primarily a core Algorithm of Web topic information gathering system that we designed--the Forecast URL - Topic Algorithm. It bases on the related theories, analyzes the experiment data and discovers the topic of the hyperlink be decided by three factors primarily: the topic Similarity of the parent Web page, the topic Similarity of the (ex - ) anchor text and the structure characteristic of Web graph, then puts forward the algorithm of Forecasting URL - Topic based on Web structure and Web page contents, the system evaluation result shows that the algorithm has great efficiency.
Keywords:Web structure Hyperlink Topic Forecast Algorithm
本文献已被 CNKI 维普 万方数据 等数据库收录!
点击此处可从《现代图书情报技术》浏览原始摘要信息
点击此处可从《现代图书情报技术》下载免费的PDF全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号