首页 | 本学科首页   官方微博 | 高级检索  
     检索      

Web页面表格信息的自主抽取
引用本文:侯锟,罗海龙.Web页面表格信息的自主抽取[J].科技广场,2006,38(4):70-72.
作者姓名:侯锟  罗海龙
作者单位:1. 吉林师范大学计算机学院,四平,136000
2. 吉林省四平市商业学校,四平,136000
基金项目:吉林师范大学硕士启动项目(基于Web个性化服务技术与研究,2004年)资助
摘    要:本文研究对于Web页面表格信息的抽取方法,通过对初始页面标注以获取抽取知识,并通过自学习适应页面的变化,有效地完成对表格信息的抽取。

关 键 词:信息抽取  包装器  文档对象模型
文章编号:1671-4792-(2006)4-0020-03

Autonomous Information Extraction from HTML Pages Base on Structure of Table
Hou Kun,Luo Hailong.Autonomous Information Extraction from HTML Pages Base on Structure of Table[J].Science Mosaic,2006,38(4):70-72.
Authors:Hou Kun  Luo Hailong
Institution:1.Computer College, Jilin Normal University, Siping 186000; 2.Commerce School, Siping 136000
Abstract:
Keywords:Information Extraction  Wrapper  Document Object Model
本文献已被 CNKI 维普 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号