基于加权Word2vec的文本分类方法研究期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

按检索

基于加权Word2vec的文本分类方法研究

引用本文：	马思丹,刘东苏.基于加权Word2vec的文本分类方法研究[J].情报科学,2019,37(11):38-42.

作者姓名：	马思丹刘东苏

摘要：	【目的/意义】利用词向量的优点，提出一种加权Word2vec的文本分类方法，以期在文本分类时获得较高的分类效果。【方法/过程】首先对文本进行词向量训练，通过设置词语相似度阈值，将文本关键词划分为重叠部分和非重叠部分，随后分别计算两部分加权相似度值，再采用参数化线性加权方式计算文本相似度，最后采用KNN进行分类。【结果/结论】实验结果表明文中提出的加权Word2vec方法比TF-IDF传统文本分类模型和均值Word2vec模型的分类效果有所提升，是一种有效的文本分类方法。

	点击此处可从《情报科学》浏览原始摘要信息
	点击此处可从《情报科学》下载免费的PDF全文