一种面向高校招投标公告主题爬虫的设计 |
| |
引用本文: | 袁琰伟,陆培军.一种面向高校招投标公告主题爬虫的设计[J].教育技术导刊,2018,17(2):117-119. |
| |
作者姓名: | 袁琰伟 陆培军 |
| |
作者单位: | 南通大学 计算机科学与技术学院,江苏 南通 226019 |
| |
摘 要: | 由于通用搜索引擎返回的信息过多且主题相关性不强,使部分企业未能及时获取高校招标公告,错失中标机会。针对这种情况,提出了高校招投标公告主题爬虫的设计方法。爬虫首先通过主题确立、网页聚类,将高校招投标公告聚集页面存储起来,然后爬虫每日从高校招投标聚集页面采集最新公告。实验结果表明,该爬虫能及时更新高校招投标公告且准确率较高,较好地为高校招投标信息网站建设提供数据来源。
|
关 键 词: | 主题爬虫 搜索引擎 招投标 主题相关性 网页聚类 |
|
| 点击此处可从《教育技术导刊》浏览原始摘要信息 |
| 点击此处可从《教育技术导刊》下载免费的PDF全文 |
|