共现聚类分析的新方法:最大频繁项集挖掘 |
| |
引用本文: | 徐硕,Qiao Xiaodong,乔晓东,朱礼军,张运良,薛春香.共现聚类分析的新方法:最大频繁项集挖掘[J].情报学报,2012,31(2). |
| |
作者姓名: | 徐硕 Qiao Xiaodong 乔晓东 朱礼军 张运良 薛春香 |
| |
作者单位: | 1. 中国科学技术信息研究所,北京,100038 2. 南京理工大学经济管理学院,南京,210094 |
| |
基金项目: | "十二五"国家科技支撑计划项目"面向外文科技知识组织体系的大规模语义计算关键技术研究",中国科学技术信息研究所预研项目"科技文献深层领域主题监测及主题演化规律揭示",江苏省社会科学基金项目"数字报纸的自动标引研究",教育部人文社会科学研究项目"电子报纸内容深加工研究" |
| |
摘 要: | 针对某一领域的文献,如果两个研究对象同现的频率越高,则通常假设二者存在联系的可能性越大,从而促使共词分析、文献共引分析以及文献作者共著分析等共现分析方法的流行.然而,传统共现分析三个阶段中的前两个阶段存在一定的缺陷,从而导致最后得到的共现聚类分析的结果可能存在一定的误导性.为克服该缺陷,本文从关联规则挖掘领域引入了一种新的共现聚类分析方法--最大频繁项集挖掘,它将传统共现分析法的三个阶段压缩为一个阶段,充分利用了可以利用的各种信息,克服了传统方法的缺陷.通过实验分析发现,设置合适的最小支持度阈值,基本上可以得到比较满意的结果.
|
关 键 词: | 共现分析 共词分析 聚类分析 最大频繁项集 层次聚类 |
A Novel Approach for Co-occurrence Clustering Analysis:Maximal Frequent Itemset Mining |
| |
Abstract: | |
| |
Keywords: | |
本文献已被 万方数据 等数据库收录! |
|