首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 140 毫秒
1.
对基于中文的Web文本分类技术进行了研究,介绍了web文本分类的基本过程和Web文本预处理及文本特征选取的方法,重点介绍了一种常用的基于内容的分类算法KNN。最后通过实验测试了使用KNN算法的中文Web文本分类技术的效果。  相似文献   

2.
文本自动分类研究进展   总被引:1,自引:0,他引:1  
通过介绍文本分类的过程及其关键技术,讨论了文本表示、分类算法、分类器性能评价原理和方法,最后对文本分类今后的发展进行了展望。  相似文献   

3.
结合文本分类的过程和面向对象方法学理论,讨论面向对象思想在文本分类过程中的体现。阐述文本分类过程和面向对象程序设计中抽象类过程的区别与联系。  相似文献   

4.
吴波 《鸡西大学学报》2009,9(5):151-152
介绍了网络环境下文本自动分类的过程,针对文本信息自动分类的研究方法,分析了当前我国文本信息自动分类研究中存在的问题,提出了其未来发展的趋势。  相似文献   

5.
英语文本阅读是以理解为核心的认知活动,读懂文本是成功阅读的关键。解读文本、探究文本、超越文本,构成了阅读过程中循序渐进的三重境界。应从解读文本入手,进而对文本进行深入地探究,才能达到阅读的最高境界——超越文本。  相似文献   

6.
朴素贝叶斯理论是一种典型机器学习技术,能够应用于文本分类中。运用朴素贝叶斯理论阐述了贝叶斯分类器的样本训练和分类计算的过程,构造了一个文本分类器。试验表明,朴素贝叶斯理论在文本分类中有较好的分类效果。  相似文献   

7.
改进了传统的信噪比文本分类方法。提出了一种改进的基于信噪比的文本分类方法。它考虑了禁用词的排除、近义词和同义词的合并以及特征项在文本中不同位置对文章分类的贡献不同。  相似文献   

8.
提出了一种基于投影寻踪改进KNN中文文本分类方法,与现有的中文文本分类算法相比,该方法具有较高的计算效率。给出了具体实现过程并将其用于文本分类中,实验证明了该算法用于文本分类的有效性及其高效率。  相似文献   

9.
文本自动分类是目前最常用的文本信息自动处理技术,也是人工智能、自然语言处理和信息检索领域的研究热点。对文本自动分类所涉及的相关问题进行了全面论述,并简单介绍了基于神经网络的文本分类器的设计与实现。  相似文献   

10.
乔良 《教育技术导刊》2009,8(4):160-161
文本挖掘是一个对具有丰富语义的文本进行分析从而理解其所包含的内容和意义的过程,已经成为数据挖掘中一个日益流行而重要的研究领域。给出了文本挖掘的定义和框架,对文本挖掘中预处理、文本摘要、文本分类、聚类、关联分析及可视化技术进行了详尽的分析,并归纳了最新的研究进展,指出了文本挖掘在信息检索中的作用。  相似文献   

11.
周靖 《茂名学院学报》2011,21(4):56-58,66
在文本分类过程中,为解决传统支持向量机(SVM)多类分类的不可分区域问题及提高分类性能,提出了一种改进的偏二叉树多类SVM算法。算法依据根据样本的分布情况计算训练集文本特征参数的信息熵,并将熵值结合欧式距离公式以确定各类文本间的相似性测度;以相似性测度作为偏二叉树结构的分类走向,对训练集进行学习,构建各个二类子SVM分类器。实验结果表明,该算法具有较高的分类性能,能更好地解决实际文本分类过程中的问题。  相似文献   

12.
周莹 《天津电大学报》2007,11(1):28-30,48
本文是以Web文本信息和Web语义处理为背景,从理论及应用两个层次对教学资源库资源编目方法进行了较为深入的研究,实现教学资源的自动摘要和智能编目,同时分析了关于构造分类字典和教育语义网的构想。  相似文献   

13.
对通俗小说进行理论研究,不可忽视其本形态和本质属性。前是有形的,一眼便可望穿;后是无形的,只有读后才能知晓。通俗小说具有标识性的体形态,表现为以白话为其语言标识;以章回体为其体标识和以类型化为其题材标识。通俗小说同时具备自己的本质属性,即本源性、通俗性、商品性。对通俗小说的本形态和本质属性进行探讨研究,有助于我们对小说的雅与俗作出准确的判断。  相似文献   

14.
支持向量机及其应用研究   总被引:1,自引:0,他引:1  
对支持向量机技术进行研究,介绍支持向量机的原理,讨论支持向量机中核函数的选择和多类问题,讨论支持向量机中求解大规模数据的有效算法。从文本分类,手写字符识别,人脸检测,入侵检测,图像处理等方面对支持向量机的应用研究作了综述。讨论了支持向量机的优点和缺点,并对支持向量机的发展作了展望。  相似文献   

15.
基于模糊分类规则树的文本分类   总被引:2,自引:0,他引:2  
针对传统的基于关联规则的文本分类方法在分类文本时需要遍历分类器中的所有规则,分类效率非常低的问题,提出一种基于模糊分类规则树(FCR-tree)的文本分类方法.分类器中的规则以树的形式存储,由于树型结构避免了重复结点的存储,节省了存储空间.模糊分类关联规则与一般分类规则相比,不仅包含了词条信息,还包含了词条出现频度对应的模糊集,所以FCR-tree的构建过程及树的结构不同于一般规则树CR-tree.为降低构建及遍历FCR-tree的难度,采用了构造多棵k-FCR-tree的方法.在搜索规则树时,如果结点中的词条没在待分类文本中出现,则不需要再搜索该结点引导的子树,大大减少了需要匹配的规则的数量.实验表明该方法是可行的,与遍历分类器的分类方法相比,分类效率有了明显提高.  相似文献   

16.
影响语料库代表性的主要因素有;语料库总体的定义、语篇的分类和层次、语料库的规模。建立具有代表性的语料库,首先必须从时间、地域、社会语言学、类型等方面对语言总体进行明确地限定;设计语篇的抽样层次必须对语料进行多堆、全面地分类,井确定各层次和部分的合理比例;决定语料库的总体规模应该考虑建库的目的以及财力和技术的限制,确定语篇类型的大小和单个语篇的长度,主要依据所研究的语言现象的常见程度。  相似文献   

17.
与传统媒体和网络等新媒体中的新闻文本相比,微新闻在文本来源、文本结构、文本内容等方面有其自身所独有的特征。  相似文献   

18.
This study investigated the online process of reading and the offline learning from an illustrated science text. The authors examined the effects of using a concrete or abstract picture to illustrate a text and adopted eye-tracking methodology to trace text and picture processing. They randomly assigned 59 eleventh-grade students to 3 reading conditions: (a) text only; (b) text with a concrete illustration; and (c) text with an abstract illustration in a pretest, immediate, and delayed posttest design. Results showed that the text illustrated by either the concrete or the abstract picture led to better learning than did the text alone. Eye-fixation data revealed that the abstract illustration promoted more efficient processing of the text. Analyses of the gaze shifts between the 2 types of external representation indicated that the readers of the text with the abstract illustration made a greater effort to integrate verbal and pictorial information. Furthermore, relations between online and offline measures emerged.  相似文献   

19.
功能翻译理论下的旅游语篇翻译   总被引:1,自引:0,他引:1  
旅游语篇翻译体裁属典型的"呼唤型"文本。笔者以英汉旅游篇为例,对照英汉语篇表达上的差异,提出建议:旅游语篇翻译应以译文读者为核心,注重接受者的文化背景和语言习惯。  相似文献   

20.
认知语义学是George Lakoff首倡的认知语言理论。认知语义学家越来越多地将他们的研究拓展到语篇层面,提出了许多分析方法和理论。基于Lakoff的体验哲学和理想认知模型理论,以及认知语言学的重要创见——原型理论和心理空间理论,运用语篇动态分析方法,提出应从"认知世界"(包括ICM和背景知识)的视角去分析语篇的连贯,同时结合认知语义学分析词句层面的几种基本认知方式(主要包括体验、激活、凸显、原型、搭桥,关联等)来分析语篇连贯性,提出从认知语义学角度探析语篇连贯的方法。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号