共查询到19条相似文献,搜索用时 281 毫秒
1.
2.
基于领域本体实现Web文本挖掘研究 总被引:1,自引:0,他引:1
3.
4.
面向概念挖掘的文本层次模型研究 总被引:1,自引:0,他引:1
针对当前Web文本挖掘工具的不足之处,提出了一种基于层次结构、面向概念挖掘的模型,即文本层次模型。该模型具有数据源适应性强、结构灵活、可操作性强、用途广泛优点,具有很强的实用性和一定的可扩展能力。图2。参考文献13。 相似文献
5.
目前许多CBR系统面临着案例过时、数量停滞、用户参与程度低等可持续性发展问题。为了鼓励用户参与CBR系统的使用,促进CBR系统的发展,提出了一种基于Web2.0技术和文本挖掘的CBR系统框架。利用该框架可以提高用户体验。案例分析结果显示,文本挖掘和Web2.0技术可以为CBR系统带来额外的价值,并对CBR系统的开发和设计提供了新的思路。 相似文献
6.
基于Web挖掘技术的信息检索系统设计与实现 总被引:2,自引:0,他引:2
本文详细介绍一个基于Web文本挖掘技术的信息检索系统的设计与实现。基于Web文本挖掘技术的信息检索技术融合了文本挖掘的思想,它将单一的资源发现或者单一的信息提取的传统的信息检索方法结合起来,从而达到在WWW发现资源并将其中的信息提取出来进行处理的目的。 相似文献
7.
Web内容挖掘在数字图书馆中的应用 总被引:3,自引:1,他引:3
Web信息是数字图书馆数字资源的重要来源,文章详细阐述了对Web内容中的文本信息的挖掘,包括:文本自动摘要、文本分类和文本聚类。在挖掘过程中基于用户需求和用户特征,针对文本分类,重点分析了分类过程和在数字图书馆中的应用;针对文本聚类,介绍两种基本聚类原理以及与文本分类的不同之处,重点论述其在数字图书馆中如何应用。最后提出内容挖掘与用户挖掘的结合更有助于服务用户。 相似文献
8.
9.
10.
11.
试论Web中的数据挖掘 总被引:6,自引:0,他引:6
姜传菊 《现代图书情报技术》2003,(Z1)
随着 Internet/Intranet的迅速发展 ,Web已成为一个巨大的信息源 ,如何有效地利用这些信息变得非常重要 ,本文详细介绍了 Web挖掘技术的概念、分类及实现技术 ,并介绍了一些实用的 Web挖掘工具 相似文献
12.
数字人文中的文本挖掘研究 总被引:1,自引:0,他引:1
概述数字人文的概念、研究内容和现状,指出文本挖掘方法是数字人文研究的一个研究热点与趋势。在综述文本挖掘在数字人文各个研究领域中的具体应用基础上,重点介绍欧美发达国家文本挖掘应用于数字人文研究的前沿实践,以期为我国人文学科研究方法与范式的转型提供借鉴。 相似文献
13.
文献数据库中书目信息共现挖掘系统的开发 总被引:9,自引:0,他引:9
针对权威的生物医学数据库和引文索引数据,介绍一个基于文献数据库中书目信息共现关系进行文本挖掘的系统。该系统具有基本的文献计量学分析功能,并对相应的结果进行可视化表达;对高频主题词、高产作者和高被引论文和高被引作者进行共现分析,据此进行聚类分析和关联分析,获得有关的研究主题聚类和主题词/副主题词关联规则、合著聚类分析、高被引论文同被引聚类分析和高被引作者同被引聚类分析的结果和可视化表达。其中对关联规则的分析可以发现主题词之间的潜在语义规则,其他的文献计量学指标和共现分析结果可以用于科学计量学的分析。 相似文献
14.
基于图挖掘的文本主题识别方法研究综述 总被引:1,自引:1,他引:0
本文通过文献调研分析,将基于图挖掘的文本主题识别方法总结为中心度方法、紧密关联子图查找和图聚类三种,后两者又细分为基于clique子团或类clique子团、基于图拓扑结构或结点属性聚类的方法。中心度方法通过对比文本网络中术语结点的重要度来实现文本主题的识别,紧密关联子图查找和图聚类方法则是根据文本图中术语结点和边的属性相似度来识别文本核心主题。基于语言文本网络自身特性,如何构建复杂文本关系图来同时揭示术语间的句法、共现和语义关系,如何基于术语关联和图拓扑结构识别其中的紧密关联子团,基于何种标准将紧密关联子团聚类以揭示文本核心主题,都是未来需要进一步深入研究的问题。表1。 相似文献
15.
16.
基于数字纸张的信息检索和数据挖掘技术 总被引:2,自引:0,他引:2
随着数字纸张概念的提出和相关产业的日益发展,基于数字纸张的应用需求日益迫切,满足这些应用的软件解决方案中的一个核心内容就是数字纸张的内容管理,其中最基本最核心的两项技术是信息检索技术和数据挖掘技术,本文重点地阐述了这两项技术的最新应用成果。 相似文献
17.
文本与数据挖掘的著作权困境及应对 总被引:1,自引:0,他引:1
王文敏 《图书馆理论与实践》2020,(3):28-34
近年来,文本和数据挖掘广泛应用于多个领域,在推动社会经济快速发展的同时也极大地冲击着现有的著作权制度。文章分析了文本和数据挖掘面临的法律困境,并基于国际上两大法系对文本和数据挖掘的立法和司法实践,为我国解决文本和数据挖掘引发的法律困境提出建议。 相似文献
18.
基于文本挖掘的理论,提出不同购物网站商品评论对比分析的方法,对不同购物网站同一商品评论是否一致进行研究。首先对商品单个特征的评论进行对比分析,然后衍生到商品的整体特征对比。研究发现,不同购物网站对同一商品的评论并不完全一致,这种不一致主要体现在商品特征上面,这说明商品评论会因为购物网站的不同而有所差异。 相似文献
19.
从文本特征对文本分类结果的整体影响的角度出发,提出一种基于粒子群优化的文本特征选择方法(PSOTFS),使用粒子群算法来挖掘文本特征选择规则。PSOTFS首先使用开方检验对文本特征进行预选择,然后使用粒子群算法对预选择得到的文本特征进行精选。PSOTFS以一个粒子表示一条特征选择规则,特征选择规则集对应某个粒子群,采用分类准确率作为适应度函数,采用分组的方式对粒子的维度进行降维。实验结果表明,PSOTFS比开方检验、信息增益、文档频率和互信息方法能得到更好的分类效果。 相似文献