首页 | 本学科首页   官方微博 | 高级检索  
     检索      

中文网页聚类系统的研究与设计
引用本文:于铁军,耿玉良.中文网页聚类系统的研究与设计[J].江苏广播电视大学学报,2007,18(3):55-57.
作者姓名:于铁军  耿玉良
作者单位:1. 江苏信息职业技术学院,江苏,无锡,214101
2. 南京中医药大学,江苏,南京,210046
摘    要:设计中文网页聚类系统是为了便于从动态Web文本集中快速、有效地挖掘知识。该系统以经典聚类算法为基础,通过比较网页相似度,将相似度高的网页聚合,并提交用户界面显示。通过应用模糊数学中的不确定度,表达了样本类属不同的模糊性,从而更为真实地反映客观情况,改善了以往确定归属某一类的不完整信息收集,结果更具客观性。

关 键 词:文本挖掘  聚类  信息检索
文章编号:1008-4207(2007)03-0055-03
修稿时间:2007-04-01

Design of Chinese Web Clustering System
YU Tie-jun,GENG Yu-liang.Design of Chinese Web Clustering System[J].Journal of Jiangsu Radio & Television University,2007,18(3):55-57.
Authors:YU Tie-jun  GENG Yu-liang
Institution:1.Professional Training Center In Jiang Su Information Professional Technology College , Wuxi 214101, Jiangsu, China; 2. Information Technology College In NJUTCM, NanJing210029, Jiangsu , China
Abstract:Chinese web clustering system is raised for mining knowledge quickly and efficiently from flexible web documents.So the system is based on clustering algorithm.It can cluster similar webs automatically and submit the results to user interface finally by comparing their similaritis.Uncertainty degree belonging to each cluster by fuzzy clustering algorithm expresses uncertainty in kind belonging and can reflect real world more impersonally.Finally query results are improved.
Keywords:web mining  clustering  information retrieval
本文献已被 CNKI 维普 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号