首页 | 本学科首页   官方微博 | 高级检索  
     检索      

基于本体的网络爬虫技术研究
引用本文:杨学明,刘柏嵩.基于本体的网络爬虫技术研究[J].情报学报,2007,26(5):723-727.
作者姓名:杨学明  刘柏嵩
作者单位:1. 湖州师范学院信息工程学院,湖州,313000
2. 宁波大学网络中心,宁波,315211
基金项目:国家自然科学基金;浙江省自然科学基金;浙江省自然科学基金
摘    要:互联网已经成为最大的非结构化数据库,极大方便了信息访问.然而,网络上的信息大多都是无组织的,由于网络的分布式特性,很难对它进行信息和知识管理.因此,如何建立一个智能的信息发现机制很有必要.本文在分析了爬虫工作原理和传统算法后,提出了一种基于本体的网络爬虫的信息发现框架.该框架包含了预处理模块和本体管理模块,定义了网页相关度计算策略,最后通过实验对该框架进行了评估.

关 键 词:本体  网络爬虫  语义网  信息检索
修稿时间:2006年9月14日

A Study of Ontology-based Web Crawler
Yang Xueming,Liu Baisong.A Study of Ontology-based Web Crawler[J].Journal of the China Society for Scientific andTechnical Information,2007,26(5):723-727.
Authors:Yang Xueming  Liu Baisong
Abstract:
Keywords:
本文献已被 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号