首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 281 毫秒
1.
吴育芳  陆春华 《晋图学刊》2010,(3):34-36,49
本文在介绍了Web挖掘的基础上,重点分析了Web文本挖掘的概念、过程及其关键技术,包括文本的特征表示与提取、文本的分类与聚类等。  相似文献   

2.
基于领域本体实现Web文本挖掘研究   总被引:1,自引:0,他引:1  
阮光册 《图书情报工作》2011,55(18):116-120
为弥补改进传统Web文本挖掘方法缺乏对文本语义理解的不足,采用本体与Web文本挖掘相结合的方法,探讨基于领域本体的Web文本挖掘方法。首先创建Web文本的本体结构,然后引入领域本体“概念-概念”相似度矩阵,并就概念间关系识别进行描述,最后给出Web文本挖掘的实现方法,发现Web文本信息的内涵。实验中以网络媒体报道为例,通过文本挖掘得出相关结论。  相似文献   

3.
通过总结Web文本挖掘在竞争情报中的应用,尝试将Web文本挖掘方法应用于行业态势分析,提出基于行业态势分析的Web文本挖掘流程,并以2011年上海车展中的相关报道,采用时空分布、词频分析、共现分析等方法对汽车行业态势分析进行实证研究,最后探讨我国汽车行业的发展趋势。  相似文献   

4.
面向概念挖掘的文本层次模型研究   总被引:1,自引:0,他引:1  
针对当前Web文本挖掘工具的不足之处,提出了一种基于层次结构、面向概念挖掘的模型,即文本层次模型。该模型具有数据源适应性强、结构灵活、可操作性强、用途广泛优点,具有很强的实用性和一定的可扩展能力。图2。参考文献13。  相似文献   

5.
目前许多CBR系统面临着案例过时、数量停滞、用户参与程度低等可持续性发展问题。为了鼓励用户参与CBR系统的使用,促进CBR系统的发展,提出了一种基于Web2.0技术和文本挖掘的CBR系统框架。利用该框架可以提高用户体验。案例分析结果显示,文本挖掘和Web2.0技术可以为CBR系统带来额外的价值,并对CBR系统的开发和设计提供了新的思路。  相似文献   

6.
基于Web挖掘技术的信息检索系统设计与实现   总被引:2,自引:0,他引:2  
王艳  张帆 《情报学报》2007,26(3):339-343
本文详细介绍一个基于Web文本挖掘技术的信息检索系统的设计与实现。基于Web文本挖掘技术的信息检索技术融合了文本挖掘的思想,它将单一的资源发现或者单一的信息提取的传统的信息检索方法结合起来,从而达到在WWW发现资源并将其中的信息提取出来进行处理的目的。  相似文献   

7.
Web内容挖掘在数字图书馆中的应用   总被引:3,自引:1,他引:3  
黎琳  赵英 《图书馆学研究》2006,(2):19-21,24
Web信息是数字图书馆数字资源的重要来源,文章详细阐述了对Web内容中的文本信息的挖掘,包括:文本自动摘要、文本分类和文本聚类。在挖掘过程中基于用户需求和用户特征,针对文本分类,重点分析了分类过程和在数字图书馆中的应用;针对文本聚类,介绍两种基本聚类原理以及与文本分类的不同之处,重点论述其在数字图书馆中如何应用。最后提出内容挖掘与用户挖掘的结合更有助于服务用户。  相似文献   

8.
文本挖掘工具述评   总被引:5,自引:0,他引:5  
简要介绍一些商业文本挖掘工具和开源文本挖掘工具,针对其中四款典型的开源工具进行详细的比较,包括数据格式、功能模块和用户体验三个方面;选取三种各具特色的工具就其文本分类功能进行测评。最后,针对开源文本挖掘工具的现状,提出几点建议。  相似文献   

9.
一种基于N-Gram改进的文本特征提取算法   总被引:3,自引:0,他引:3  
介绍一种改进的文本特征提取及匹配算法。该算法基于N-Gram算法思路进行文本处理和特征提取,设计了gram关联矩阵用于统计与合并特征词,从而在固定长度N-Gram算法的基础上能够提取出不同长度的特征词。实验证明,该特征提取算法能够更为准确地描述文本特征,可应用于文本检索、Web挖掘等信息处理领域。  相似文献   

10.
针对美国和加拿大等高校共同承担的大型跨学科人文文本挖掘项目MONK,详细介绍其文本挖掘流程及相应的工具、技术和算法,并具体探讨利用MONK提供的工具进行文学文本挖掘研究的应用实例。最后总结人文领域文本挖掘方法的几类应用,提出该项目对我国人文领域应用文本挖掘的启示。  相似文献   

11.
试论Web中的数据挖掘   总被引:6,自引:0,他引:6  
随着 Internet/Intranet的迅速发展 ,Web已成为一个巨大的信息源 ,如何有效地利用这些信息变得非常重要 ,本文详细介绍了 Web挖掘技术的概念、分类及实现技术 ,并介绍了一些实用的 Web挖掘工具  相似文献   

12.
数字人文中的文本挖掘研究   总被引:1,自引:0,他引:1  
概述数字人文的概念、研究内容和现状,指出文本挖掘方法是数字人文研究的一个研究热点与趋势。在综述文本挖掘在数字人文各个研究领域中的具体应用基础上,重点介绍欧美发达国家文本挖掘应用于数字人文研究的前沿实践,以期为我国人文学科研究方法与范式的转型提供借鉴。  相似文献   

13.
文献数据库中书目信息共现挖掘系统的开发   总被引:9,自引:0,他引:9  
针对权威的生物医学数据库和引文索引数据,介绍一个基于文献数据库中书目信息共现关系进行文本挖掘的系统。该系统具有基本的文献计量学分析功能,并对相应的结果进行可视化表达;对高频主题词、高产作者和高被引论文和高被引作者进行共现分析,据此进行聚类分析和关联分析,获得有关的研究主题聚类和主题词/副主题词关联规则、合著聚类分析、高被引论文同被引聚类分析和高被引作者同被引聚类分析的结果和可视化表达。其中对关联规则的分析可以发现主题词之间的潜在语义规则,其他的文献计量学指标和共现分析结果可以用于科学计量学的分析。  相似文献   

14.
基于图挖掘的文本主题识别方法研究综述   总被引:1,自引:1,他引:0  
本文通过文献调研分析,将基于图挖掘的文本主题识别方法总结为中心度方法、紧密关联子图查找和图聚类三种,后两者又细分为基于clique子团或类clique子团、基于图拓扑结构或结点属性聚类的方法。中心度方法通过对比文本网络中术语结点的重要度来实现文本主题的识别,紧密关联子图查找和图聚类方法则是根据文本图中术语结点和边的属性相似度来识别文本核心主题。基于语言文本网络自身特性,如何构建复杂文本关系图来同时揭示术语间的句法、共现和语义关系,如何基于术语关联和图拓扑结构识别其中的紧密关联子团,基于何种标准将紧密关联子团聚类以揭示文本核心主题,都是未来需要进一步深入研究的问题。表1。  相似文献   

15.
共现分析在文本知识挖掘中的应用研究   总被引:1,自引:0,他引:1       下载免费PDF全文
共现分析是将各种信息载体中的共现信息定量化的分析方法,是支撑知识挖掘和知识服务的重要手段和工具。能够体现信息的内容特征和外表特征共同构成了文本知识关联揭示和知识挖掘的基础。探索了共现分析方法在基于空间分析、时间分布和内外关联映射的文本知识挖掘中的应用。图8。参考文献13。  相似文献   

16.
基于数字纸张的信息检索和数据挖掘技术   总被引:2,自引:0,他引:2  
随着数字纸张概念的提出和相关产业的日益发展,基于数字纸张的应用需求日益迫切,满足这些应用的软件解决方案中的一个核心内容就是数字纸张的内容管理,其中最基本最核心的两项技术是信息检索技术和数据挖掘技术,本文重点地阐述了这两项技术的最新应用成果。  相似文献   

17.
文本与数据挖掘的著作权困境及应对   总被引:1,自引:0,他引:1  
近年来,文本和数据挖掘广泛应用于多个领域,在推动社会经济快速发展的同时也极大地冲击着现有的著作权制度。文章分析了文本和数据挖掘面临的法律困境,并基于国际上两大法系对文本和数据挖掘的立法和司法实践,为我国解决文本和数据挖掘引发的法律困境提出建议。  相似文献   

18.
基于文本挖掘的理论,提出不同购物网站商品评论对比分析的方法,对不同购物网站同一商品评论是否一致进行研究。首先对商品单个特征的评论进行对比分析,然后衍生到商品的整体特征对比。研究发现,不同购物网站对同一商品的评论并不完全一致,这种不一致主要体现在商品特征上面,这说明商品评论会因为购物网站的不同而有所差异。  相似文献   

19.
从文本特征对文本分类结果的整体影响的角度出发,提出一种基于粒子群优化的文本特征选择方法(PSOTFS),使用粒子群算法来挖掘文本特征选择规则。PSOTFS首先使用开方检验对文本特征进行预选择,然后使用粒子群算法对预选择得到的文本特征进行精选。PSOTFS以一个粒子表示一条特征选择规则,特征选择规则集对应某个粒子群,采用分类准确率作为适应度函数,采用分组的方式对粒子的维度进行降维。实验结果表明,PSOTFS比开方检验、信息增益、文档频率和互信息方法能得到更好的分类效果。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号