首页 | 本学科首页   官方微博 | 高级检索  
     检索      

基于SVM的中文查询分类
引用本文:杨思春,高超,戴新宇,陈家骏.基于SVM的中文查询分类[J].情报学报,2011,30(9).
作者姓名:杨思春  高超  戴新宇  陈家骏
作者单位:1. 南京大学计算机软件新技术国家重点实验室,南京,210093;南京大学计算机科学与技术系,南京,210093;安徽工业大学计算机学院,马鞍山,243002
2. 安徽工业大学计算机学院,马鞍山,243002
3. 南京大学计算机软件新技术国家重点实验室,南京,210093
基金项目:计算机软件新技术国家重点实验室开放课题基金项目,安徽省高校省级自然科学研究项目,安徽省高校省级自然科学研究重点项目
摘    要:在问答系统中用户的查询是以自然语言问句的形式出现的,查询分类对生成合适的答案有着重要的指导性作用.现有文献大多基于SVM统计学习模型实现查询分类.文章详细分析了中文查询分类的典型特征及其编码过程,并给出了LibSVM分类器的参数优化及核函数选取方法.比较了词袋特征(bag-of-word)和词性与词袋绑定特征(bag-of-word/pos)在LibSVM(RBF)、LibSVM(Linear)和Liblinear三个分类器上的分类精度.实验结果表明,在问题训练集规模较大、特征维数较高的情况下,Liblinear分类器具有更好的性能.同时,得出一个结论:bag-of-word/pos特征对英文查询分类有一定的贡献;对于中文查询分类,虽然理论上增加特征有利于提高SVM分类器的精度,但由于绑定词性特征后可能会引入噪声,进而降低查询分类的精度.

关 键 词:问答系统  查询分类  SVM  核函数

Chinese Query Classification Based on SVM
Yang Sichun,Gao Chao,Dai Xinyu,Chen Jiajun.Chinese Query Classification Based on SVM[J].Journal of the China Society for Scientific andTechnical Information,2011,30(9).
Authors:Yang Sichun  Gao Chao  Dai Xinyu  Chen Jiajun
Abstract:
Keywords:
本文献已被 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号