首页 | 本学科首页   官方微博 | 高级检索  
     检索      

Web数据清洗研究
引用本文:刘华,胡燕,王涛.Web数据清洗研究[J].教育技术导刊,2007(3).
作者姓名:刘华  胡燕  王涛
作者单位:武汉理工大学计算机科学与技术学院 湖北武汉430070
摘    要:随着时代的发展,越来越多的数据来源于网络。但是由于Web数据的特点,从网上信息抽取得来的数据存在着大量“脏数据”,并不能直接使用,因而有必要进行数据清洗,消除“脏数据”,转化为可直接使用的数据。针对实例层次的数据质量问题系统分析了Web数据清洗的方法

关 键 词:Web数据  数据清洗  相似重复记录

Research of the Web Data Cleaning
LIU Hua,HU Yan,WANG Tao.Research of the Web Data Cleaning[J].Introduction of Educational Technology,2007(3).
Authors:LIU Hua  HU Yan  WANG Tao
Abstract:Along with the time development, more and more data originates from the network. But as a result of the Web data characteristic, the information extracted from the net has the problem of "dirty data", and can use not directly, so it is necessary to carry on the data cleaning, eliminates the dirty data, and use data directly.
Keywords:web data  data cleaning  approximately duplicated records
本文献已被 CNKI 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号