首页 | 本学科首页   官方微博 | 高级检索  
     检索      

基于BERT和分面分类的多标签的南海证据性数据分类研究
引用本文:彭玉芳,石进,徐浩,杨海平.基于BERT和分面分类的多标签的南海证据性数据分类研究[J].图书馆杂志,2022(5):102-108.
作者姓名:彭玉芳  石进  徐浩  杨海平
作者单位:1. 南京工程学院经济与管理学院;2. 南京大学信息管理学院
基金项目:国家社会科学基金重大项目“南海疆文献资料整理中的知识发现与维权证据链建构研究”(项目编号:19ZDA347);;南京工程学院校级科研基金创新基金面上项目“学术文献方法论知识驱动的跨学科知识扩散特征识别研究”(项目编号:CKJB202003);;江苏省社科基金青年项目“融合在线学术社交信息的电子文献资源推荐策略研究”(项目编号:21TQC003)的研究成果之一;
摘    要:为了能更好地组织南海证据性数据,提高南海疆智库的检索性能,便于科研人员对南海问题展开深入研究,本文融合了中国图书馆分类法的族性检索和分面分类法的特性检索,构建了南海文献分类法,应用BERT预训练模型实现细粒度的多标签南海证据性数据的自动分类,并通过数据库技术将南海证据性数据分为12个面进行组配检索。通过以上方法赋予每一条南海证据性数据唯一的分类号和类名,形式化表示为南海证据性数据的数据分类=证据来源分类+证据的数据体系分类+证据的数据分面分类。从更细粒度的视角,实现数据分类,与粗放式文献载体的分类相比,数据分类更有利于展开数据挖掘,找到数据间潜在的关联关系,发现新的研究视角,是科学研究创新的基础和保障。

关 键 词:BERT  分面分类  数据分类  多标签分类  南海证据性数据
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号