首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 15 毫秒
1.
乔良 《教育技术导刊》2009,8(4):160-161
文本挖掘是一个对具有丰富语义的文本进行分析从而理解其所包含的内容和意义的过程,已经成为数据挖掘中一个日益流行而重要的研究领域。给出了文本挖掘的定义和框架,对文本挖掘中预处理、文本摘要、文本分类、聚类、关联分析及可视化技术进行了详尽的分析,并归纳了最新的研究进展,指出了文本挖掘在信息检索中的作用。  相似文献   

2.
在网络环境中文本挖掘的过程主要包括特征提取、特征选择、挖掘方法选择、结果评价和知识模块等几个部分;最新的发展方向是基于EM算法对文本进行挖掘,基于该算法的的比较挖掘模型为:首先对已知数据集任意分为几个类,然后根据各个类集和背景集对文档集的各个词进行似然,再通过求和可以得到整个数据集的似然,该过程反复进行,直到收敛,从而可以根据各类和背景集结果中的较大的概率值得出文本的共同主题和各个类的主题。  相似文献   

3.
文本挖掘探析   总被引:2,自引:0,他引:2  
文本挖掘是信息挖掘的一个研究分支,用于基于文本信息的知识发现,文本挖掘主要处理半结构化、无结构化和字符型数据,首先介绍了文本挖掘的概念,然后分析了文本挖掘的处理过程和关键技术,最后对文本挖掘进行了展望。  相似文献   

4.
以COM技术和vB、vC语言为基础设计开发了一个用于挖掘关联规则的可视化人机交互系统.该系统能对Access和SQL Server创建的数据库以及以文本方式记录的数据进行关联规则挖掘.通过人机交互界面使用户参与到规则的挖掘过程中,使系统按照用户的需求完成规则的挖掘.  相似文献   

5.
黄碧慧 《学苑教育》2023,(33):34-36
在小学英语教学中,文本解读是尤为重要的一个环节。虽然很多教师已经具备了较强的文本解读能力,但是在单元整体教学视角下,他们对文本解读的认识还存在一定的不足,对各类文本之间的联系缺乏深入的挖掘,整体教学效果不够理想。基于此,本文以单元整体教学为背景,分析了小学英语文本解读的有关内容,并提出一些具体的教学实践与思考,促进小学英语教学水平的迅速提高。  相似文献   

6.
XML作为基于web的描述数据、交换数据标准,正日益流行和普及,因此从web的大量数据中挖掘XML数据变得日益重要。本从Apriorl算法出发,提出了基于Apriorl应用的XML关联关系的挖掘算法。  相似文献   

7.
目前,全球一体化的趋势日益显著,英语不再是一门语言,从某种意义上看,已经成为了衡量区域经济发展水平以及民族文化的重要标志。在高中英语教学当中,教师过分注重知识的传授,忽视了对学生文本解读能力的培养,导致了英语阅读效率不断降低。为此,本文系统分析了当前高中英语教学中文本解读所存在的问题,并从文本体裁、文本主题以及文本语言三个方面分析了文本解读的教学策略。  相似文献   

8.
Blog是Web2.0环境下用户自创内容的重要形式,已经成为互联网上一种重要的信息源和知识源.如何快速、准确地获得Blog信息及隐藏在信息中的知识是人们的迫切需要.本文构建了一个Blog知识挖掘框架,该框架基于文本聚类和主题模型两种文本分析方法,挖掘Blog日志中潜在的概念主题,并对所挖掘的概念主题进行观点分析,这将有助于对于领域知识的深层次研究.笔者应用该方法以e-LearningBlog日志为研究对象,进行了实例研究.  相似文献   

9.
Web文本挖掘是人工智能一个崭新的研究领域。分词、特征表示和特征子集提取技术是文本挖掘过程中前期的基础性工作。介绍了文本挖掘中分词、特征表示及特征子集提取的常用技术及发展趋势。  相似文献   

10.
语文教学,尤其是阅读教学中对文本的挖掘要掌握好"度"。当前的语文教学在这一方面多少做得还不够到位,主要从其中存在的三大问题,即"文本的个性未被完全挖掘""仅从‘道’的角度挖掘""文本的‘过度’挖掘"入手,通过相应案例的分析,得出语文教师在教学中要学会根据学生特点挖掘相应的文本个性,尤其是对于"深文"要敢于善于"浅教",从而构建平实的语文课堂。  相似文献   

11.
特征提取是文本挖掘、信息检索、自然语言处理(NLP)、文本情感分析、网络舆情分析等领域的研究热点。特征提取作为文本挖掘系统的主要因素,文本特征提取性能是文本分类结果的重要性度量。从两方面对特征选择算法进行总结,分析国内外对常用特征提取算法的改进和创新,最后针对影响特征提取的因素,指出在实际应用中应考虑的问题。  相似文献   

12.
Web文本挖掘中的特征表示与特征提取技术   总被引:2,自引:0,他引:2  
Web文本挖掘是人工智能一个崭新的研究领域。分词、特征表示和特征子集提取技术是文本挖掘过程中前期的基础性工作。介绍了文本挖掘中分词、特征表示及特征子集提取的常用技术及发展趋势。  相似文献   

13.
中文分词技术综述   总被引:2,自引:0,他引:2  
中文分词是中文信息处理的基础,分词系统也是中文信息处理中的一个主要组成部分,对中文文本的分词处理目前已经应用到了中文自然语言理解、文献检索、搜索引擎以及文本挖掘系统等领域。本文对现有的中文分词技术进行了综述,分析了现有分词方法的技术特点,指出了部分分词方法存在的优缺点。  相似文献   

14.
产品特征抽取是产品评论挖掘中的关键一步,针对现有产品评论挖掘方法对产品特征抽取的不足,提出了一种Apriori算法和文本模式相结合的产品特征抽取方法,并运用特征修剪算法对候选产品特征进行过滤。实验结果表明,该方法具有较好的效果。  相似文献   

15.
文本挖掘是从非结构化或半结构化文本材料中获取有效、新颖、潜在有用的、可理解的知识模式的过程。本文首先对文本挖掘的定义、过程和实现途径作了论述,然后试图从信息检索、游览检索结果的效率、垃玻邮件的过滤、个人化主页服务、文档的管理和BBS文档的鉴别和过滤六个方面,对文本挖掘在教育中的应用作了探讨。最后,还对文本挖掘的一些应用系统作了简要介绍。  相似文献   

16.
文本细读起源于俄国的形式主义,它强调要以文本为中心,挖掘文本本身的价值,在中学语文教学中,尤其应该重视文本细读。文章以毛泽东《沁园春·长沙》为例,从文本语言层、文本意象,意境层面的角度,分析于教学过程中进行创新性文本细读。  相似文献   

17.
当前,非连续性文本在生活中运用非常广泛。学会从非连续性文本中搜集、整理、提取信息,已经成为学生语文综合素养的一个重要方面。但是,对教材内容来说,非连续性文本资源所占比例很小。这需要教师在教学中善于挖掘教材资源、活用身边资源、整合学科资源,从而有效提高学生的综合素养。  相似文献   

18.
在传统聚类模型的基础上,提出一种基于向量空间模型的层次聚类算法,用于文本数据的挖掘。实验结果表明,基于向量空间模型的层次聚类算法从挖掘的准确率上更具有性能优势。  相似文献   

19.
近年来,随着互联网和社交网络的发展,网络上文本信息迅速增长,对文本情感进行分析成为研究热点。根据文本情感分析方法的不同,总结了近年来文本情感分析的研究进展。将文本情感分析分为基于词典的方法和基于机器学习的方法两大类:基于词典的文本情感分析方法分为人工构建和自动构建两种;基于机器学习的文本情感分析方法分为基于贝叶斯算法、基于最大熵算法和基于SVM的文本情感分析3种。通过梳理国内外研究现状,对两类情感分析方法进行了深入分析,对文本情感分析进行了总结和展望。  相似文献   

20.
语文教师解读文本时,要能够从专业阅读的角度出发,不仅要关注文本自身的价值,更要聚焦文本的教学价值.文章以《散步》为例,分析了语文教师开展教学时应如何挖掘文本的语用价值和教学价值.语文教师只有思路清晰,目标明确,不断提升自身的阅读素养,才能在教学中游刃有余,充分挖掘文本的教学价值,真正做到“我”的课堂“我”做主.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号