首页 | 本学科首页   官方微博 | 高级检索  
     检索      

微博短文本预处理及学习研究综述
引用本文:王连喜.微博短文本预处理及学习研究综述[J].图书情报工作,2013,57(11):125-131.
作者姓名:王连喜
作者单位:广东外语外贸大学图书馆
基金项目:国家自然科学基金青年项目"微博虚假信息及早检测与有效控制关键技术研究",国家自然科学基金项目"不平衡数据的学习算法及应用研究"
摘    要:认为因短文本具有特征稀疏性和高度冗余性,微博短文本的预处理及学习方法研究已经成为微博信息挖掘及应用的关键,并在许多方面有着非常重要和广泛的应用。重点分析微博短文本的特性,并对微博短文本的预处理和学习方法及其应用现状进行归纳和总结,包括短文本特征表示、短文本特征拓展与选择、短文本分类与聚类学习、热点事件发现及自动文摘等。最后指出相关研究的局限性,并对未来的发展方向进行展望。

关 键 词:微博短文本  预处理  短文本学习  热点事件发现  自动文摘  
收稿时间:2013-04-07

A Literature Review on Pre-processing and Learning of Microtext
Wang Lianxi.A Literature Review on Pre-processing and Learning of Microtext[J].Library and Information Service,2013,57(11):125-131.
Authors:Wang Lianxi
Institution:Guangdong University of Foreign Studies Library, Guangzhou 510420
Abstract:As the features of microtext are sparse and highly redundant, the pre-processing and learning methods are the key problems of the data mining for microblog, and have a very important and wide application in many ways. The paper analyzes the characteristics of the microtext, and conducts an introduction and summarization to pre-processing and learning methods and their applications, including short text representation model, short text feature expanding and selection, classification and clustering for short text, hot events detection and automatic summarization, and so on. At last, this paper also proposes the limitations of the recent study, and points out the directions for future research.
Keywords:microtext  pre-processing  short text learning  hot event detection  automatic summarization  
本文献已被 万方数据 等数据库收录!
点击此处可从《图书情报工作》浏览原始摘要信息
点击此处可从《图书情报工作》下载免费的PDF全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号