首页 | 本学科首页   官方微博 | 高级检索  
     检索      

基于文本聚类与LDA相融合的微博主题检索模型研究
引用本文:唐晓波,房小可.基于文本聚类与LDA相融合的微博主题检索模型研究[J].情报理论与实践,2013,36(8).
作者姓名:唐晓波  房小可
作者单位:武汉大学 信息资源研究中心,湖北 武汉,430072
基金项目:国家自然科学基金项目"社会化媒体集成检索与语义分析方法研究"的成果;项目
摘    要:伴随着微博的日趋流行,对微博信息的检索逐渐成为人们获取第一消息的手段.其中文本聚类和主题发现是信息检索领域的有效方法,采用适当的方法是影响微博短文本信息检索质量的关键因素.文章针对文本聚类和LDA主题模型的互补特征,综合考虑了微博特殊文体和短文本聚类效率问题,提出了基于频繁词集的文本聚类和基于类簇的LDA主题挖掘相融合的微博检索方法,给出了针对微博文体的一种新的主题检索模型.实验表明,该方法不仅能有效地划分微博文本,并且能清晰地挖掘类簇中潜在主题.

关 键 词:文本聚类  主题检索  微博
本文献已被 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号