期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

熊志斌刘冬《人天科学研究》2013,(2):49-51

朴素贝叶斯理论是一种典型机器学习技术,能够应用于文本分类中。运用朴素贝叶斯理论阐述了贝叶斯分类器的样本训练和分类计算的过程,构造了一个文本分类器。试验表明,朴素贝叶斯理论在文本分类中有较好的分类效果。相似文献

2.

张冰波《大众科技》2010,(10):43-45

为了能在海量的文本中及时准确地获得有效的知识和信息,文章表示技术以及文本自动分类技术受到了广泛的关注。文章介绍了文本分类的过程和相关的技术,利用向量空间模型构建文本表示模型,介绍了常用的文本分类算法,由于传统类中心分类算法训练文档分散,不能准确的表示各类别的中心向量,提出了优化算法,从而提高了分类准确度。相似文献

3.

文本分类算法研究

赵岩周斌陈儒华《人天科学研究》2013,(10):54-56

文本分类是文本数据挖掘领域的重要技术之一。从分类算法对文本语义信息的利用程度这一角度出发,将文本分类划分为基于词形的算法和基于语义的算法两类,对每类算法进行了描述,并对当今文本数据的多样性及文本分类算法改进的可选方向进行了研究。相似文献

4.

基于词频的中文文本分类研究 总被引：1，自引：0，他引：1

姚兴山《现代情报》2009,29(2):179-181

本文对中文文本分类系统的设计和实现进行了阐述,对分类系统的系统结构、特征提取、训练算法、分类算法等进行了详细的介绍。将基于词频统计的方法应用于文本分类。并提出了一种基于汉语中单字词及二字词统计特性的中文文本分类方法,在无词表的情况下,通过统计构造单字和二字词表,对文本进行分类,并取得不错的效果。相似文献

5.

用分众分类模式优化学科导航库建设 总被引：7，自引：1，他引：7

张燕萍《情报理论与实践》2007,30(4):552-557

通过分析学科导航库建设中存在的问题，研究了以分众分类模式运作的Web2.0网站的成功经验，即迎合用户需求，体现用户价值，尊重群众的智慧等，并分析了其成功的行为学基础。最后参照分众分类的成功模式，提出了优化学科导航库建设的具体措施，即建设理念要具有开放性，建立易于管理及用户参与的平台，制定交流模式，创造交流中信任与协作的氛围，提高学科导航库的知名度。相似文献

6.

基于SVM与KNN的中文文本分类比较实证研究 总被引：1，自引：0，他引：1

刘怀亮张治国马志辉孙蕾《情报理论与实践》2008,31(6)

本文详细介绍了中文文本分类过程以及SVM和KNN两种方法在中文文本分类中的具体步骤,给出了中文文本分类的模型。通过实验对SVM算法和传统的KNN算法应用于文本分类效果进行了比较性实证研究。研究表明,SVM分类器较KNN在处理中文文本分类问题上有更良好的分类效果,有较高的查全率和查准率。相似文献

7.

范例推理在文本自动分类中的应用研究

耿焕同李杰《情报理论与实践》2007,30(6):837-840

文本自动分类是文本信息处理中的一项基础性工作。将范例推理应用于文本分类中,并利用词语间的词共现信息从文本中抽取主题词和频繁词共现项目集,以及借助聚类算法对范例库进行索引,实现了基于范例推理的文本自动分类系统。实验表明,与基于TFIDF的文本表示方法和最近邻分类算法相比,基于词共现信息的文本表示方法和范例库的聚类索引能有效地改善分类的准确性和效率,从而拓宽了范例推理的应用领域。相似文献

8.

基于向量空间模型的科技文献自动分类研究

王方阮梅花朱海刚熊燕缪有刚《情报探索》2013,(12):1-3,8

提出一种基于向量空间模型的科技文献自动分类方法.首先构建分类代表文本,计算单文本与分类代表文本之间的相似度;然后利用训练集计算出分类归属度,以判断某一文本分类的可能性,实现科技文献的自动分类.以3个学科的文献为例,验证该方法的可用性. 相似文献

9.

基于潜在语义分析和HS-SVM的文本分类模型研究

张玉峰何超《情报理论与实践》2010,33(7)

为了提高文本分类的准确性和效率,提出了一种基于潜在语义分析和超球支持向量机的文本分类模型.针对SVM对大规模文本分类时收敛速度较慢这一缺点,本文将超球支持向量机应用于文本分类,采用基于增量学习的超球支持向量机分类学习算法进行训练和分类.实验结果表明,超球支持向量机是一种解决SVM问题的有效方法,在文本分类应用中具有与SVM相当的精度,但是明显降低了模型复杂度和训练时间. 相似文献

10.

分类导航的设计与实现 总被引：3，自引：0，他引：3

张会平周宁《情报杂志》2005,24(3):88-90

总结了分类导航的设计原则、分类依据 ,提出了分类导航设计过程的可行性解决方案———自顶向下的原型法 ,分析了分类导航的实现方式及其发展趋势。相似文献

11.

一种改进的SVM文本数据分类技术研究

高晓琴《科技通报》2012,28(4):70-71

主要研究了文本分类精度问题。介绍了文本分类的基本过程,提出了一种改进的支持向量机文本分类技术,设计并实现了一个开放的中文文档自动分类系统。实验结果表明,提出的方法不仅具有较高的训练效率,同时也能得到很高的分类准确率和查全率。相似文献

12.

基于语义扩展的数字文献自动分类方法研究

巴志超朱世伟于俊凤魏墨济《现代情报》2015,35(9):70-74

针对图书、期刊论文等数字文献文本特征较少而导致特征向量语义表达不够准确、分类效果差的问题,本文提出一种基于特征语义扩展的数字文献分类方法。该方法首先利用TF-IDF方法获取对数字文献文本表示能力较强、具有较高TF-IDF值的核心特征词;其次分别借助知网(Hownet)语义词典以及开放知识库维基百科(Wikipedia)对核心特征词集进行语义概念的扩展,以构建维度较低、语义丰富的概念向量空间;最后采用MaxEnt、SVM等多种算法构造分类器实现对数字文献的自动分类。实验结果表明:相比传统基于特征选择的短文本分类方法,该方法能有效地实现对短文本特征的语义扩展,提高数字文献分类的分类性能。相似文献

13.

综合运用VIP、CNKI、万方数据系统功能提高课题检索效率

程惠兰胡小华《现代情报》2009,29(10):156-158

基于科技文献检索的信息发现与信息检索,探讨VIP、CNKI、万方数据知识服务平台系统功能在课题检索中的应用。在信息发现方面,综合运用各数据库系统功能寻找检索概念的同义词、课题相关的分类号和所属学科类别、抽象检索概念的相关词、课题相关的研究机构和研究者。在信息检索方面,根据各系统的功能特点不同,制定相应的课题检索策略——主题相似文献

14.

一种基于词上下文向量的文本自动分类方法 总被引：1，自引：0，他引：1

郭少友《情报科学》2008,26(7)

分析了传统文本自动分类方法的不足、词上下文向量的含义及其在自动分类中的作用,提出了一种基于词上下文向量的文本自动分类方法,该方法利用词上下文向量来生成分类器的类别中心向量和待分类文本的文本向量,使分类质量有所提高。相似文献

15.

基于KNN和SVM的中文文本自动分类研究

张野杨建林《情报科学》2011,(9)

借助文本分类系统软件,采用来自10个大类的中文文本数据,按照训练集与测试集2:1的比例,使用KNN和SVM分类算法,对数据集进行自动分类的实验。旨在通过具体的语料库实验,探讨文本自动分类的关键技术,分析、比较与评价实验结果,探讨文本分类中具体参数的设置和不同分类算法之优劣。相似文献

16.

知识网格环境下文本分类模式构建

范少萍郑春厚王娟《情报科学》2012,(2):196-199,205

利用网格技术与语义网技术,结合知识网格和文本资源的特点,在知识网格环境下研究了文本分类问题。首先分析了知识网格环境下文本资源要进行合理有效的分类需要解决的关键问题,并以此为基础,构建了知识网格环境下的文本分类模式。该模式主要包括:语义互联模块、元样本集成模块、文本动态更新模块、文本分类模块。此模式可以对后续在知识网格环境下研究文本分类能有所指导与借鉴。相似文献

17.

文本自动分类技术研究综述 总被引：2，自引：0，他引：2

庞观松蒋盛益《情报理论与实践》2012,35(2):123-128

文章从文本表示、特征选择、分类算法、常用基准语料以及评估指标等方面对近年来的研究成果进行综述并讨论。认为短文本分类和多语言文本分类管理是新出现的重要且紧迫的问题,并对这两个问题以及数据集偏斜、多层分类、标注瓶颈等几个关键问题进行重点讨论。最后总结并展望这些研究内容。相似文献

18.

多层次文本分类法的模型构建及实验分析 ——以进出口商品归类问题为例

下载免费PDF全文

朱立平张紫玄邓三鸿赵梓博王昊《情报科学》2021,39(10):178-184

【目的/意义】政府机构的数据规模在数字时代得到了空前的增长,这也为多类目政务数据的自动化处理工作带来了挑战。在此背景下,本文通过引入多层次文本分类方法,对进出口商品的自动归类问题进行了探索。【方法/过程】基于HS编码的层次结构,构建了一个包含三个层次的分类模型,通过逐层判别进而累加的方式进行文本分类;同时,对SVM与TextRNN等算法的分类效果进行了对比。【结果/结论】多层次分类模型对于解决商品归类问题的总体效果较好;在数据充分的情况下,TextRNN 比 SVM 的效果相对较好（第 1 层 93.00%>92.90%,第 2 层 96.46%>96.38%）,而在学习不充分的环境下,SVM具有较大优势（第3层92.49%<95.92%）;SVM取得了85.88%的最佳叠加正确率。【创新/局限】本研究尝试基于多层次分类方法解决商品自动归类问题,但数据规模及应用场景仍有待拓展。相似文献

19.

网络学科资源导航库中的超链接研究 总被引：2，自引：0，他引：2

史艳丽《情报科学》2004,22(8):964-966

本文首先介绍了网络学科资源导航库和超链接结构，然后讨论了网络学科资源导航库中超链接自动生成技术、超链接的导航优化和超链接信息的检索技术。相似文献