基于修正SVM-KNN组合算法的汉语专有名词自动抽取 Automatic Extraction on Chinese Proper Names Based on a Modified SVM-KNN Classifier期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

按检索

基于修正SVM-KNN组合算法的汉语专有名词自动抽取

引用本文：	李丽双,党延忠,李丹.基于修正SVM-KNN组合算法的汉语专有名词自动抽取[J].情报学报,2011,30(6).

作者姓名：	李丽双党延忠李丹

作者单位：	1. 大连理工大学计算机学院,大连116023;大连理工大学系统工程研究所,大连116023 2. 大连理工大学系统工程研究所,大连,116023 3. 大连理工大学计算机学院,大连,116023

基金项目：	国家高技术研究发展计划(863计划)

摘要：	专有名词的自动抽取是文本挖掘、信息检索和机器翻译等领域的关键技术.本文研究了组合SVM和KNN两种分类器进行汉语专有名词自动抽取的方法.对样本在空间的不同分布使用不同的分类方法,当测试样本与SVM最优超平面的距离大于给定的阈值时使用SVM分类,否则使用KNN;在实际训练语料中,常常是负类样本数远多于正类样本数,而传统KNN方法对不平衡训练集存在敏感性,所以提出了用归一化的思想对传统的KNN方法进行修正.实验表明,用SVM与修正的KNN组合算法进行汉语专有名词抽取比单一的SVM方法以及原始的SVM-KNN方法更具优越性,而且这种方法可以推广到其他非平衡分布样本的分类问题.
关键词：	KNN SVM 专有名词抽取不平衡数据
Automatic Extraction on Chinese Proper Names Based on a Modified SVM-KNN Classifier

Li Lishuang,Dang Yanzhong,Li Dan.Automatic Extraction on Chinese Proper Names Based on a Modified SVM-KNN Classifier[J].Journal of the China Society for Scientific andTechnical Information,2011,30(6).

Authors:	Li Lishuang Dang Yanzhong Li Dan

Abstract:

Keywords:
本文献已被万方数据等数据库收录！

设为首页 | 免责声明 | 关于勤云 | 加入收藏