首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 15 毫秒
1.
文本挖掘探析   总被引:2,自引:0,他引:2  
文本挖掘是信息挖掘的一个研究分支,用于基于文本信息的知识发现,文本挖掘主要处理半结构化、无结构化和字符型数据,首先介绍了文本挖掘的概念,然后分析了文本挖掘的处理过程和关键技术,最后对文本挖掘进行了展望。  相似文献   

2.
Web文本挖掘中的特征表示与特征提取技术   总被引:2,自引:0,他引:2  
Web文本挖掘是人工智能一个崭新的研究领域。分词、特征表示和特征子集提取技术是文本挖掘过程中前期的基础性工作。介绍了文本挖掘中分词、特征表示及特征子集提取的常用技术及发展趋势。  相似文献   

3.
Web文本挖掘是人工智能一个崭新的研究领域。分词、特征表示和特征子集提取技术是文本挖掘过程中前期的基础性工作。介绍了文本挖掘中分词、特征表示及特征子集提取的常用技术及发展趋势。  相似文献   

4.
Blog是Web2.0环境下用户自创内容的重要形式,已经成为互联网上一种重要的信息源和知识源.如何快速、准确地获得Blog信息及隐藏在信息中的知识是人们的迫切需要.本文构建了一个Blog知识挖掘框架,该框架基于文本聚类和主题模型两种文本分析方法,挖掘Blog日志中潜在的概念主题,并对所挖掘的概念主题进行观点分析,这将有助于对于领域知识的深层次研究.笔者应用该方法以e-LearningBlog日志为研究对象,进行了实例研究.  相似文献   

5.
总结了数据挖掘的基本方法、文本数据挖掘的关键技术,讨论了文本挖掘的定义和文本分类的一些形式,并对文本数据的数据挖掘算法进行了研究。  相似文献   

6.
文本挖掘是从非结构化或半结构化文本材料中获取有效、新颖、潜在有用的、可理解的知识模式的过程。本文首先对文本挖掘的定义、过程和实现途径作了论述,然后试图从信息检索、游览检索结果的效率、垃玻邮件的过滤、个人化主页服务、文档的管理和BBS文档的鉴别和过滤六个方面,对文本挖掘在教育中的应用作了探讨。最后,还对文本挖掘的一些应用系统作了简要介绍。  相似文献   

7.
在网络环境中文本挖掘的过程主要包括特征提取、特征选择、挖掘方法选择、结果评价和知识模块等几个部分;最新的发展方向是基于EM算法对文本进行挖掘,基于该算法的的比较挖掘模型为:首先对已知数据集任意分为几个类,然后根据各个类集和背景集对文档集的各个词进行似然,再通过求和可以得到整个数据集的似然,该过程反复进行,直到收敛,从而可以根据各类和背景集结果中的较大的概率值得出文本的共同主题和各个类的主题。  相似文献   

8.
如何在数量巨大的Internet中快速准确的搜索到符合要求的Web页是一个值得探讨的重要课题.构造了一种能够准确区分Web文本之间亲和力的挖掘模型,运用人工免疫算法使该模型具有较高的聚类精度和自发现能力.实验结果表明,该模型不仅能够有效的进行文本内容挖掘,保持较低的错误肯定率和错误否定率,还具有很强的自适应性和更新能力,进行适当的参数设置后检测周期也随之大幅缩短,提高了挖掘模型的效率.该模型的提出为Web挖掘领域提供了一种新的研究思路.  相似文献   

9.
田娜  周驿  严蓉 《教育技术导刊》2020,19(5):168-172
为深入挖掘和分析在线课程讨论区中的文本数据,有效识别出参与该课程学习者关注的话题,改进在线课程教学效果,通过对学习者讨论文本进行高频词汇分析,得到词云图,形成对学习者关注内容的整体认识;利用 LDA 话题模型对学习者的讨论文本数据进行话题挖掘,得到 9 个热点话题。实验结果表明,学习者在线讨论关注话题主要涉及 Python 语言编程基础知识、课程证书、作业测试、开发环境配置以及第三方库的安装等。利用 LDA 模型可以从大量课程讨论文本数据中有效识别出学习者关注话题,进而改进在线课程。  相似文献   

10.
在动态数据流挖掘过程中,对数据流进行聚类,把未知的数据流划分或者生成到一个簇中。发现隐含的知识、价值和模式,是一种非常有效的数据流挖掘技术。分析和研究了数据流挖掘的聚类算法,并对数据流聚类技术发展进行了展望,提出了数据流挖掘的研究方向。  相似文献   

11.
为了深入挖掘与分析在线课程评论文本,探索学习者参与在线课程学习时关注的话题及其情感态度,为提高在线课程质量提供帮助。首先采用词频分析方法,实现对学习者在线课程评论内容的整体认识|然后利用非监督学习方法潜在狄利克雷分布主题模型对评论文本信息的特征结构、语义内容进行自动挖掘和分析,得到学习者的关注话题|最后对每个话题的课程评论文本进行情感倾向分析,得到学习者的情感倾向分布。实验结果表明,在参与课程学习的过程中,学习者主要关注教师授课、课程内容和学习资源 3 个话题。情感分析结果显示,学习者对于该课程普遍表示满意和赞赏,但是对于该课程学习资源表达了较多负面情感。  相似文献   

12.
近年来出土的秦简牍材料,为研究战国晚期至秦代的历史提供了丰富而可靠的资源。文章以目前已经校读出版的里耶秦简一、二卷为语料来源,通过特征词提取、词频统计、文本摘要及主题模型等文本挖掘技术,从词频、事件、主题三个维度对简牍内容进行挖掘与分析。实验表明,一、二卷中主要为官府文书,内容涉及文书邮传、债务、粮食、徒簿、案件、刑徒管理等内容,能够较好地反映里耶一、二卷的大体内容,并且与校释第一卷中给出的主题内容大体一致。为简牍材料的研究提供了新思路,证实了可借助文本挖掘方法来理解、诠释中国丰富的文化遗产。  相似文献   

13.
面向教育技术学文献数据的主题挖掘   总被引:3,自引:0,他引:3  
对网络环境下海量的科技文献数据进行文本挖掘可以有效地提高科技文献信息的可用性,发现隐藏的知识。LDA (Latent Dirichlet Allocation)模型是一种能够提取文本隐含主题的非监督学习模型。论文基于LDA模型,以三种国际教育技术期刊在2004-2008年间出版的学术文献为研究对象,进行了主题挖掘和文献分析。  相似文献   

14.
序列模式挖掘是数据挖掘研究的一个重要课题,用于从序列数据库中发现相对时间或者其他顺序所出现的高频率子序列.首先给出序列模式挖掘的相关定义,然后介绍了四种序列模式挖掘算法,并对其特点进行分析总结,最后指出未来的研究方向.  相似文献   

15.
为了实现个性化的主动信息服务,网络信息挖掘(Web Mining)技术成为近年来一个新的研究课题。挖掘通常涉及输入文本的处理过程,中文分词是中文信息处理的基础,汉语文本基于单字,汉语的书面表达方式也是以汉字作为最小单位,词与词之间没有显性的分界标志,中文分词的准确与否,常常直接影响到对搜索结果的相关度排序,因此分词成为汉语文本分析处理中首要解决的问题。就中文分词技术进行讨论,并以2-gram模型为例,研究用JA-VA实现中文分词的过程。  相似文献   

16.
审视当下的小学英语教学,课堂中教师对教材文本的解读要么浮光掠影,蜻蜓点水;要么"只见树木,不见森林",过分关注语言点忽视整体结构。在文本解读的过程中。教师可通过找准文本切入点,整体细品文本,挖掘文本内涵三个维度进行文本解读研究。在多层次多维度的文本解读过程中,帮助学生获取有用的信息,达到深层理解、灵活运用语言及体会文本中折射出的语言内涵。  相似文献   

17.
讨论电子商务环境中数据挖掘技术在网站管理分析中的应用。将网络挖掘技术和电子商务进行融合,用一个顾客行为类型的应用挖掘案例为背景,诠释了在数据处理和整合的过程中,不同的数据挖掘算法都要有选择地针对不同的应用而采纳。  相似文献   

18.
信息时代海量增长的文本资料成为质性研究者开展研究的数据宝藏,但未得到充分研究,其原因在于针对海量中文文本数据的有效分析方法尚待突破。文章率先在质性研究范式中使用了以结构主题模型(STM)为代表的人机协同方法,对某大学在线教学效果评估的课堂观察记录数据展开文本挖掘。以教学评估研究数据分析为例,完整呈现了在教育质性研究中应用STM进行数据挖掘的四个步骤,并分析了其在挖掘海量中文文本资料方面的独特优势。研究表明,跨学科研究方法的尝试有助于解决教育学科甚至人文社科领域内海量中文文本在质性分析上的固有难题。  相似文献   

19.
正语文课堂上只有对文本进行深入挖掘,才能让课堂充满生机,才能让学生饥渴的双眸闪现晶莹的光芒。下面笔者就苏教版《唐诗宋词选修》(上)冯延巳《鹊踏枝》一课的教学,谈谈自己对文本挖掘的感受。一、培养学生用心阅读文本的习惯,独享那份属于自己  相似文献   

20.
课堂教学,是师生依据教学文本(教材),实施对话、共同提高的过程.课堂教学既要依据教材,又不能拘泥于教材.好的课堂教学,要求教师善于对文本进行挖掘,善于捕捉课堂中鲜活的事例,由点到面,由此及彼,丰富课堂教学内容,提升课堂厚度.唯此,才能使学生有更大的收获.那么,数学课堂教学中挖掘什么,如何挖掘呢?  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号