首页 | 本学科首页   官方微博 | 高级检索  
     检索      

基于语义爬虫的商品信息主题采集研究*
引用本文:黄炜张李义.基于语义爬虫的商品信息主题采集研究*[J].现代图书情报技术,2010,26(1):3-8.
作者姓名:黄炜张李义
作者单位:武汉大学信息资源研究中心;湖北工业大学管理学院;
基金项目:教育部人文社会科学重点研究基地重大项目“电子商务中商务信息跨平台检索与信息重组”(项目编号:07JJD870220); 湖北省教育厅人文社会科学项目“Web数据危机下商务信息资源的语义化管理研究”(项目编号:2009b228)的研究成果之一
摘    要:结合网页主题链接分析和网页主题内容语义分析,提出一个以主题爬虫实现采集商品信息的方法。在爬行过程中通过对本体的统计学习,使主题本体参照物不断得到优化。实验结果表明,该方法较其他传统爬行算法更有效,并能防止主题漂移的发生,带来较高的主题收获率。

关 键 词:主题爬虫  商务信息  语义  主题链接分析  本体学习
收稿时间:2009-12-21
修稿时间:2010-01-04

Research on Focused Merchandise Information Crawling Based on Semantic Crawler
Huang Wei Zhang Liyi.Research on Focused Merchandise Information Crawling Based on Semantic Crawler[J].New Technology of Library and Information Service,2010,26(1):3-8.
Authors:Huang Wei Zhang Liyi
Institution:(Center for Studies of Information Resources, Wuhan University, Wuhan  430072, China) (School of Management, Hubei University of Technology, Wuhan 430068, China)
Abstract:This article proposes a method to gather merchandise information based on focused crawler,which integrates the Web topic link analysis and topic content semantic analysis.Through the statistical learning to Ontology during the crawling,the reference of domain-specific Ontology is optimized continuously.The experiment results show that comparing with other conventional crawling algorithms,this method is more effective,as it can prevent the occurrence of topic drift and bring a higher topic harvest rate.
Keywords:Focused crawler Merchandise information Semantic Topic link analysis Ontology learning  
本文献已被 CNKI 等数据库收录!
点击此处可从《现代图书情报技术》浏览原始摘要信息
点击此处可从《现代图书情报技术》下载免费的PDF全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号