基于文本挖掘和可视化技术的主题自动标引方法——以《英雄格萨尔》为例 |
| |
引用本文: | 陈博,陈建龙.基于文本挖掘和可视化技术的主题自动标引方法——以《英雄格萨尔》为例[J].现代情报,2019,39(8):45-51,102. |
| |
作者姓名: | 陈博 陈建龙 |
| |
作者单位: | 北京大学信息管理系, 北京 100871 |
| |
基金项目: | 国家社会科学基金重大项目"《格萨尔》说唱语音的自动识别与格萨尔学的创新发展"(项目编号:15ZDB111)。 |
| |
摘 要: | 目的/意义]基于文本挖掘技术自动发现更具代表性的文献内容主题词,通过定位主题词在章节中的具体位置,并基于可视化技术进行主题标引,帮助读者直观高效发现文献主题间的潜在关系。方法/过程]基于文本挖掘技术深入文献内容层挖掘主题词,并利用可视化工具直观呈现所获信息,在此基础上尝试构建可视化主题自动标引系统,并在格萨尔领域的多个主题中对该系统的自动标引效果进行验证。结果/结论]研究结果显示,该标引方法在格萨尔领域实现了文献内容级的可视化主题自动标引,快速精准地定位到章节、段落和句子。标引相关信息获取过程直观可视,并且具有交互性,可提升用户体验和参与度。文章以《英雄格萨尔》为例完成系统验证,但该标引方法技术本身无领域限定,可应用于其他领域的文献。
|
关 键 词: | 可视化标引 自动标引 可视化自动标引 格萨尔 |
本文献已被 维普 等数据库收录! |
| 点击此处可从《现代情报》浏览原始摘要信息 |
| 点击此处可从《现代情报》下载免费的PDF全文 |
|