首页 | 本学科首页   官方微博 | 高级检索  
     检索      

基于词对主题模型的题名信息自动分类方法研究
引用本文:刘爱琴,董婕,梁雅琨.基于词对主题模型的题名信息自动分类方法研究[J].晋图学刊,2023(4):29-38.
作者姓名:刘爱琴  董婕  梁雅琨
作者单位:1. 山西大学经济与管理学院;2. 东北大学秦皇岛分校管理学院;3. 山西大学文学院
摘    要:从题名抽取关键词,把题名作为基于本体自动分类的文本主体,实现海量科技论文高效、精准地分类,已经成为图书馆事业发展的重要课题。本文利用文本内部词汇的语义关联特性,在高频词和隐含主题两个不同粒度层面,构建了基于BTM模型的题名信息自动分类方法:首先从细粒度层面进行词频统计,提取领域高频词;随后从粗粒度层面进行BTM模型分析,得到主题关键词;之后,将两者去重合并获得领域核心词集;最后,利用SVM算法进行文本分类。该方法有效地实现了知识的快速聚类和关联自动分类,为用户提供了满意度更高的知识发现及相关扩展服务。

关 键 词:题名分类  词对主题模型  支持向量机算法
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号