首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 187 毫秒
1.
KNN算法是文本分类技术中比较常用的算法。但是,当训练集容量较大时,KNN算法分类的效率大大降低。在对中文短信文本的分类时,结合中文短信文本的特点,给出了先由LAS算法进行降维,然后利用KNN算法进行分类的算法。实验结果表明,该算法提高了中文短信文本的分类质量和分类速度。  相似文献   

2.
在介绍SVM和KNN分类算法的基础上,提出了一种新的、较简单的,但更为合理的基于表模型的文档表示方法,阐述了一种基于表模型的分类算法——TableKNN算法。通过实验比较TableKNN算法与传统KNN算法应用于文本分类的效果,证实了TableKNN算法在处理文本分类问题上的优越性。  相似文献   

3.
提出了一种基于投影寻踪改进KNN中文文本分类方法,与现有的中文文本分类算法相比,该方法具有较高的计算效率。给出了具体实现过程并将其用于文本分类中,实验证明了该算法用于文本分类的有效性及其高效率。  相似文献   

4.
提出了一种基于机器学习的Web文本自动分类的架构,提出了中文Web文档自动分类的主要技术问题。介绍了中文Web文档自动分类工具的总体设计,它主要包括网络蜘蛛、中文分词、特征选取和贝叶斯分类器等功能模块。最后对中文Web文档自动分类器进行了实验。  相似文献   

5.
文本自动分类技术是自然语言处理的一个重要的应用领域,是替代传统的繁杂人工分类方法的有效手段和必然趋势.本文简要介绍了文本分类的特征提取算法,并通过实验比较了各种提取算法在KNN中的性能.实验表明IG、MI、CE、χ2、WE五种特征提取方法在KNN分类器中性能接近,互信息(MI)特征提取方法随着特征数的提高分类性能提高地较快,当特征数目较小的时候分类性能极差.  相似文献   

6.
本文提出了一种基于主题采集的Web文档自动分类算法,该算法对朴素贝叶斯分类模型进行了改进。利用该算法,我们实现了一个基于主题信息采集的网页分类系统。文中着重对该系统的页面解析、中文分词和文本分类模块进行了论述,并对改进后的贝叶斯分类方法进行了评估。实验结果表明,该算法对网页分类有较高的准确性。  相似文献   

7.
中文文本分类是对中文按类别来进行分类。基于交叉覆盖算法的文本分类运用交叉覆盖算法作为分类器,能够实现对中文文本的分类。通过它和SVM(Support Vector Machine)分类器的对比实验,说明了交叉覆盖算法,相比于SVM分类器对中文文本分类效果更好。  相似文献   

8.
提出一种基于中心核对齐的模糊支持向量机(Centered kernel alignment-based fuzzy support vector machine, CKA-FSVM)算法并应用于中文农业文本分类.首先通过爬虫技术获取2 246个中文农业文本并进行数据预处理,然后进行文本向量化和特征处理,最后构建分类器模型,实现中文农业文本的自动分类.实验结果显示CKA-FSVM算法在中文农业文本分类上的平均准确率为91.69%,平均F1值为94.96%,比5个对比算法中的最好结果分别提升了0.04和0.24个百分点,表明该模型在中文农业文本分类领域具有较好的性能.  相似文献   

9.
本文借助中文维基百科知识库,提出基于ESA算法的文本分类算法.并选取2015年3月5日在中文维基百科网站下载的主题文章,对其进行适当处理,将处理结果作为该算法使用的语义概念知识库.在复旦大学中文文本分类语料上显示的实验结果表明,该方法比纯粹的词袋模型方法效果要好.  相似文献   

10.
伴随着互联网的飞速发展,网络上的信息资源呈现出井喷态势,如何从海量的信息中抽取出自己需要的信息已经变得越发的困难。在分析现有Web信息抽取技术现状及面临的挑战的基础上,设计了一种基于文本标签属性的Web新闻信息抽取模型。主要介绍了基于标签的Web信息抽取技术的算法,给出了信息抽取的具体实现过程,对基于DOM树节点遍历的文本标签过滤算法进行了描述,并选取了主流的新闻网站进行了抽取实验,验证了算法的可行性。  相似文献   

11.
语文课堂中"教什么"是远比"怎么教"更重要、更须先行解决的问题。对语文文本"师本化"、"生本化"的思考,就是在探讨教师"教什么"、学生"学什么"的问题。  相似文献   

12.
英语规范性法律文本属于“冰冻体”语体类型,使用的立法语言具有专属性、准确性和模糊性的特点,这些特点服务于法律文本规定性这一目的。英语规范性法律文本的汉译是一种跨语言、跨文化、跨法系的交际活动,译者应该遵从法律功能对等的原则,灵活运用词类语体转换、适当调整句序、酌情增补成份和长句切割等翻译策略,以取得跨法律文化交际的成功。  相似文献   

13.
医药健康类语篇在雅思阅读考试中占的比重较大,难度较高。为了使学生能够更快更准地熟悉和把握此类体裁的阅读文章,本文以Hasan教授的语篇体裁结构潜势理论为指导,从语篇结构分析的角度出发,用归纳法来总结医学类雅思阅读语篇的体裁结构潜势。通过对医学类雅思阅读语篇的结构潜势模型进行构建,把体裁结构潜势理念引入英语教学,从而达到理论研究与教学实践相互促进的目的。  相似文献   

14.
Janet Evans 《Education 3-13》2013,41(2):233-248
There is probably a comic or graphic novel to suit the needs and requirements of all kinds of readers. However, in addition, there is now a new kid on the block! A different kind of book is emerging, one that exhibits some, but not always all, of the characteristics normally thought of as belonging to comics and graphic novels. These books blur the boundaries and include elements of comics, graphic novels and picturebooks, fusing them and creating a category that is a synthesis of aspects from all of them, hence the term, “fusion” texts. This article challenges the view that comics, graphic novels and picturebooks are aimed at a younger and/or immature audience and shows how they are often complex fusion texts dealing with challenging, controversial issues which frequently deliver thought provoking and uncomfortable messages.  相似文献   

15.
In this study, the use of inquiry methods, learning cycles, a conceptual change model and analogy in creating alternative science texts was discussed. An alternative text on the topic of acids and bases was created by integrating the methods and models discussed in this paper. The alternative text and a sample of a traditional text taken from a textbook, which is still used in Turkish high schools, were given to two groups, totaling 42 pre-service teachers—the alternative text was given to an experimental group and the traditional text to a control group—in an experimental setting and their understandings of acids and bases were compared. In addition, in the second step of the study, the pre-service teachers read both texts and indicated their preferences in terms of interest, understandability and helpfullness.  相似文献   

16.
作为制度文本的教学内容规约着教师的教学。当我们将教学内容置身于教学活动本身进行考察时,教学内容所呈现的就不再是一个制度的文本,而是一个可以本质直观的现象世界。将教学内容从制度文本转向现象文本的关键是从意识活动的层面考察教学内容的经验价值。教学内容的经验价值体现在教学内容的个体性、意向性和生成性等方面。恢复教学内容的经验价值,让教学内容成为了一种语言过程。从对象性教学内容、意指性教学内容和充实性教学内容等方面可以重建教学内容的语意世界。  相似文献   

17.
This review maps and critically evaluates 36 empirical studies from English language teaching (ELT), focusing on the role of texts and activities in intercultural learning. The rationale for this review is the call for theoretically-based recommendations for English language (EL) teachers and researchers on the selection of texts and the design of activities for intercultural learning. It draws on principles from Critical Interpretive Synthesis (CIS), and the studies were gathered from systematic searches of databases, supplemented by manual searches of relevant journals. The results show that fiction texts are more widely used and more strongly rationalized for use than nonfiction texts. There is also a strong focus on dialogic and student-centred activities, and less focus on experiential teaching. It argues that an awareness of the affordances of different text types can assist teachers in mediating EL students’ intercultural learning and recommends a greater variety of research and teaching approaches to identify intercultural learning processes. Furthermore, the review calls for more research on intercultural learning in primary and secondary ELT.  相似文献   

18.
创作主体的文本创作与阅读主体的创作阅读这两者之间由于客观上存在着“时间距离”,所以读者在阅读文本时,是紧跟作者的思路、附和作者的思想,还是读者克服由于时间距离带来的消极因素,合理的完形补白,积极的进行自己的审美体验,读出自我,是摆在文本阅读者面前的重要问题。阅读主体进行文本阅读时,必须努力消除“时间距离”带来的不利影响。  相似文献   

19.
旅游文本的翻译是一种跨文化交际行为,目前国内翻译质量参差不齐,这就要求我们面对问题、解决问题,并提出相应的对策和改进措施。翻译行为的目的决定了翻译策略的选用,本文主要以“目的论”为指导举例分析翻译策略和技巧在旅游文本翻译中的运用。  相似文献   

20.
以分析广西旅游英语翻译中的文化障碍出发,结合奈达理论和德国功能翻译理论体系,对广西旅游英语翻译中的一些文化障碍问题提出了看法。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号