首页 | 本学科首页   官方微博 | 高级检索  
     检索      

基于GV-LDA的微博话题检测研究
引用本文:李少华,李卫疆,余正涛.基于GV-LDA的微博话题检测研究[J].教育技术导刊,2018,17(2):131-135.
作者姓名:李少华  李卫疆  余正涛
作者单位:昆明理工大学 信息工程与自动化学院,云南 昆明 650500
摘    要:随着社交网络的不断发展,微博成为越来越多的人获取信息的平台。为了有效解决微博话题检测中海量短文本带来的词稀疏问题,提出结合全局向量模型(GloVe)和潜在狄利克雷分布(LDA)的GV-LDA模型。在使用LDA进行话题检测前,模型利用多义词词项的含义与词性相关的事实,在标注过并去除低频词的语料上,对全局向量模型进行训练获得词向量,对词性相同且相似度大于阈值的词进行替换以解决稀疏性问题。实验结果表明, GV-LDA模型较传统的LDA主题模型,可有效提高话题检测的准确率和召回率,并降低“主题词”处理的维度,因此GV-LDA更适合微博话题检测。

关 键 词:微博  话题检测  全局向量  潜在狄利克雷分布  
点击此处可从《教育技术导刊》浏览原始摘要信息
点击此处可从《教育技术导刊》下载免费的PDF全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号