大规模数据挖掘中的数据流管理 |
| |
引用本文: | 【美国】Jon R.Wright Gregg T.Vesonder Tamraparni Dasu.大规模数据挖掘中的数据流管理[J].中国信息导报,2008,40(6):30-38. |
| |
作者姓名: | 【美国】Jon R.Wright Gregg T.Vesonder Tamraparni Dasu |
| |
作者单位: | [1]美国电话电报公司实验室-研究所,美国新泽西州弗伦翰公园07932—0971 [2]清华大学计算机科学与技术系,北京100084 |
| |
摘 要: | 在企业环境中,管理数据流或者实时数据更新是任何数据挖掘操作的一个主要挑战。无论是数据还是元数据.都要确保数据流的稳定、正确、可验。在这种环境下,实时数据更新很复杂,且数据量大而难懂。管理频繁变化的数据和元数据对企业是巨大的挑战。本文阐述了在管理企业数据的任务中的技术问题,并提出了一种解决方法。这种解决方法可以结合多个领域里的知识,如工程技术和统计学,来理解和标准化企业挖掘的准备工作,以使信息采集和质量管理自动化。
|
关 键 词: | 信息质量 数据挖掘 传送管理 知识工程 |
本文献已被 维普 等数据库收录! |
| 点击此处可从《中国信息导报》浏览原始摘要信息 |
| 点击此处可从《中国信息导报》下载免费的PDF全文 |
|