首页 | 本学科首页   官方微博 | 高级检索  
     检索      

Web 数据挖掘中数据异构问题解决方法的研究
引用本文:李春梅,李艾丹,薛中玉,韩爽.Web 数据挖掘中数据异构问题解决方法的研究[J].中国信息导报,2012(4):85-90.
作者姓名:李春梅  李艾丹  薛中玉  韩爽
作者单位:1.北京中机科海科技发展有限公司,北京 100048;2.北京理工大学,北京 100081
基金项目:国家国际科技合作计划项目“异构信息知识挖掘与可视化关键技术研究”(2010DFA14390)。
摘    要:Web 是动态性极强的信息源,访问、分析信息必须研究异构数据的集成问题,并选择合适的技术进行数据 分析、集成和处理。怎样对Web 海量的数据信息进行深层次的应用已成为数据挖掘技术的研究热点。本文介绍了XML (可扩展标记语言)在Web 数据挖掘中的应用,探讨了Web 数据挖掘中的数据异构问题。通过XML技术建立数据抽取模 型,解决互联网上绝大多数因异构、非结构化所导致的Web 数据挖掘问题。

关 键 词:数据挖掘  半结构化  XML技术  数据抽取  模型

Research on Heterogeneous Data Problem Solving Method in the Process of Web Data Mining
Li Chunmei,Li Aidan,Xue Zhongyu,Han Shuang.Research on Heterogeneous Data Problem Solving Method in the Process of Web Data Mining[J].China Information Review,2012(4):85-90.
Authors:Li Chunmei  Li Aidan  Xue Zhongyu  Han Shuang
Institution:1.Beijing ZhongJiKeHai Technology Development Ltd., Beijing 100048; 2. Beijing Institute of Technology, Beijing 100081
Abstract:The web was an information resource with dynamic state, to access and analyze the data we must study how to integrate heterogeneous architecture data and choose fit techniques to analyze, manage and integrate the data. How to apply plentiful web data to the field of web data mining has been brought into focus. The article discusses the data heterogeneity problem in Web by introducing the application of XML in the field of web data mining. By using XML technology a data extraction model is established for solving most of the difficulties in Web data mining caused by heterogeneous, unstructured problems on Internet.
Keywords:data mining  semi-structured  XML technology  data extraction  mode
点击此处可从《中国信息导报》浏览原始摘要信息
点击此处可从《中国信息导报》下载免费的PDF全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号