首页 | 本学科首页   官方微博 | 高级检索  
     检索      

基于N-gram的Web用户浏览模式分类算法研究
引用本文:朱志国,邓贵仕,孔立平.基于N-gram的Web用户浏览模式分类算法研究[J].情报学报,2009,28(3).
作者姓名:朱志国  邓贵仕  孔立平
作者单位:1. 大连理工大学系统工程研究所,大连,116024;东北财经大学,大连,116600
2. 大连理工大学系统工程研究所,大连,116024
3. 东北财经大学,大连,116600
摘    要:Web站点用户浏览模式自动分类可以更好地组织站点上的内容信息来满足不同用户的访问需求.Web使用挖掘技术已经在这项研究中得到了广泛的应用,但是集成Web内容挖掘的成果还不多见.本文首先给出了结合Web内容和使用挖掘技术的用户浏览模式分类的原型系统框架.系统中主要的过程是:对数据集中原始的Web服务器日志进行清理,使用Web使用挖掘技术从用户浏览会话中挖掘出有代表性的用户浏览模式,根据模式中每一个相关的页面内容抽取出一个N-gram集合,构建基于N-gram的用户浏览模式简档.最后本文对用户浏览会话作了分类实验分析,实验结果表明这个方法在N-gram=6,df=10%的情况下取得了较高的分类精确度.

关 键 词:N-gram方法  Web内容抽取  用户浏览模式  分类算法

Algorithm Research on Classifying Web Users Navigation Patterns Based on N-Gram
Zhu Zhiguo,Deng Guishi,Kong Liping.Algorithm Research on Classifying Web Users Navigation Patterns Based on N-Gram[J].Journal of the China Society for Scientific andTechnical Information,2009,28(3).
Authors:Zhu Zhiguo  Deng Guishi  Kong Liping
Institution:1;2;1.System Engineering Institute;Dalian University of Technology;Dalian 116024;2.Dongbei University of Finance and Economics;Dalian 116600
Abstract:Automatic classification of user navigation patterns provides a useful tool to better organize the contents of the websites to cater to the needs of different users.Web usage mining techniques have been widely applied for such research. However,few efforts were made to integrate Web content mining with Web usage mining.Firstly,this paper presents the architecture of the prototype system proposed for classifying user navigation patterns.The main processes in the prototype system are:primary Web-log preproces...
Keywords:n-gram method  Web content extraction  user navigation profiles  classification algorithm  
本文献已被 CNKI 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号