基于隐含狄利克雷分布的文本主题提取对比研究 |
| |
引用本文: | 王静茹,陈震.基于隐含狄利克雷分布的文本主题提取对比研究[J].情报科学,2018,36(1):102-107. |
| |
作者姓名: | 王静茹 陈震 |
| |
摘 要: | 【目的/意义】目前LDA模型在文本数据挖掘方法中占有重要的地位,已成为数据挖掘领域的研究热点。
为了进一步提高LDA模型在文本挖掘中的应用效果,有必要对LDA模型文本主题提取效果进行对比研究。【方法/
过程】本文提出了一种基于LDA模型的不同类型文本数据主题提取效果对比评价方法,先通过LDA模型对文本数
据进行主题挖掘;再通过定量的主题提取效果评价方法进行对比研究。【结果/结论】本文以期刊论文、网络舆情事
件话题、微博文本、调查问卷为文本数据源,实验结果表明LDA模型在处理语义信息明确逻辑关系合理的长文本数
据时,主题提取效果较好。这为提高LDA模型的挖掘效率提供了一定的理论依据。
|
|
| 点击此处可从《情报科学》浏览原始摘要信息 |
| 点击此处可从《情报科学》下载免费的PDF全文 |
|