首页 | 本学科首页   官方微博 | 高级检索  
     检索      

基于叠加编码的Web网页抓取路径损耗估计
引用本文:邢计亮.基于叠加编码的Web网页抓取路径损耗估计[J].科技通报,2015(6).
作者姓名:邢计亮
作者单位:邢台广播电视大学,河北邢台,054000
摘    要:对Web网页抓取是实现Web文本特征数据检索的最佳方式,Web网页抓取路径损耗误差的优化估计可以提高对Web数据的挖掘性能。传统方法中,对Web网页抓取采用基于线性滤波检测的单模匹配抓取方法,受弱信号幅度和临界阈值约束,路径损耗较大,且无法有效实现路径损耗误差有效估计。提出一种基于叠加编码特征统计的Web网页抓取路径损耗误差估计算法。构建Web网页文本特征抓取的目标函数,进行Web网络路径损耗模型构建,设计叠加编码算法进行特征统计,得到Web网页抓取路径概念格。仿真实验表明,该算法能有效提高Web网页抓取路径损耗误差估计精度,进而提高了Web网页文本数据抓取的查准率和文本特征数据的挖掘性能。

关 键 词:Web网页  文本特征  抓取路径  数据挖掘

Estimation of Web Webpage Grab Path Loss Error Based on Superposition Coding
Xing Jiliang.Estimation of Web Webpage Grab Path Loss Error Based on Superposition Coding[J].Bulletin of Science and Technology,2015(6).
Authors:Xing Jiliang
Abstract:
Keywords:Web page  text feature  capture path  data mining
本文献已被 CNKI 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号