首页 | 本学科首页   官方微博 | 高级检索  
     检索      

一种面向高校招投标公告主题爬虫的设计
引用本文:袁琰伟,陆培军.一种面向高校招投标公告主题爬虫的设计[J].教育技术导刊,2018,17(2):117-119.
作者姓名:袁琰伟  陆培军
作者单位:南通大学 计算机科学与技术学院,江苏 南通 226019
摘    要:由于通用搜索引擎返回的信息过多且主题相关性不强,使部分企业未能及时获取高校招标公告,错失中标机会。针对这种情况,提出了高校招投标公告主题爬虫的设计方法。爬虫首先通过主题确立、网页聚类,将高校招投标公告聚集页面存储起来,然后爬虫每日从高校招投标聚集页面采集最新公告。实验结果表明,该爬虫能及时更新高校招投标公告且准确率较高,较好地为高校招投标信息网站建设提供数据来源。

关 键 词:主题爬虫  搜索引擎  招投标  主题相关性  网页聚类  
点击此处可从《教育技术导刊》浏览原始摘要信息
点击此处可从《教育技术导刊》下载免费的PDF全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号