共查询到16条相似文献,搜索用时 500 毫秒
1.
2.
3.
文本挖掘是一个对具有丰富语义的文本进行分析从而理解其所包含的内容和意义的过程,已经成为数据挖掘中一个日益流行而重要的研究领域。给出了文本挖掘的定义和框架,对文本挖掘中预处理、文本摘要、文本分类、聚类、关联分析及可视化技术进行了详尽的分析,并归纳了最新的研究进展,指出了文本挖掘在信息检索中的作用。 相似文献
4.
文本挖掘是数据挖掘技术的一个重要方面,本文根据句法规则的特征,利用文本挖掘技术,提出基于句法规则的文本知识挖掘设计模型,从数据准备、句法规则构造、文本预处理、文本知识挖掘、挖掘结果评价等方面对工作原理进行了分析,重点阐述了句法规则的构造过程,最后通过实验验证了该模型,该设计对实现文本知识的智能化挖掘具有一定的研究意义和应用价值。 相似文献
5.
运用文本挖掘技术发现网络新闻报道中潜在的、有价值的信息是情报研究的一个新尝试。笔者探讨了网络新闻的文本挖掘方法,以上海世博新闻媒体网络版报道为例,进行实证研究,并对报道差异进行对比分析。本文选取香港、台湾、境外媒体华语版、上海本地媒体对世博会相关报道,基于文本挖掘、特征提取对报道内容的差异进行阐述,并得出结论。 相似文献
6.
基于Web文本挖掘技术的企业竞争情报系统研究 总被引:9,自引:2,他引:9
分析了企业竞争情报系统的现状,介绍了Web挖掘基本概念并分析了Web文本挖掘的关键技术,然后结合Web文本挖掘技术设计企业竞争情报系统结构模型与方案。 相似文献
7.
8.
文本挖掘技术及其在专利信息分析中的应用 总被引:1,自引:0,他引:1
本文介绍了文本挖掘概念、主要技术及其一般过程,阐述了文本挖掘在专利信息分析中的应用,以及专利信息分析中具体应用的三个文本挖掘工具:Intelligent Miner for Text、ThemeScape、VantagePoint。 相似文献
9.
Web文本挖掘在辅助研究中的应用 总被引:1,自引:0,他引:1
应用Web文本挖掘对网络数据库中检索到的信息进行分析,能够得到对研究工作有辅助作用的知识。文中对数据收集、预处理和数据挖掘的方法进行了详细的介绍。实例证明利用Web文本挖掘能充分利用网络数据库中的信息,对辅助研究是有效的。 相似文献
10.
文本挖掘在Web中的技术分析 总被引:1,自引:0,他引:1
根据调查,各领域的信息存储约有80%包含在文本文档中,文本挖掘因此也被认为比数据挖掘具有更高的商业潜力。作为从浩瀚的Web信息资源中发现潜在的、有价值知识的一种有效技术,Web领域的挖掘技术正悄然兴起,备受关注。本文重点阐述文本挖掘在Web中对信息抽取、挖掘过程及超文本挖掘技术的分析及应用。 相似文献
11.
基于信息抽取的文本知识挖掘模型研究 总被引:1,自引:0,他引:1
从文本知识挖掘的定义入手,分析了文本知识挖掘的关键技术,并在此基础上建立了基于信息抽取的文本知识挖掘模型,最后通过实例(DiscoTEX)说明这个模型是可行的。 相似文献
12.
文本挖掘是基于非相关文献知识发现的核心。本文将文本挖掘的过程细化为从文献源到初始文献集子过程,从初始文献集到中间词集子过程,从中间词集到关联词集子过程。并对每一个子过程中所使用的方法进行分析比较。在此基础上对文本挖掘存在的问题进行分析,并提出改进方法。 相似文献
13.
基于可视化数据挖掘的管理科学科技文本分析研究 总被引:8,自引:0,他引:8
通过可视化数据挖掘方法的研究,使用数据挖掘和科技文本分析的方法,获取管理科学研究的新进展、新思想和新方法。综合评价、对比分析了国内外管理科学研究力量和能力水平的分布状况,对管理科学研究主体度资助主体决策活动有较强的支持作用,并对我国管理科学领域进行了实证分析。 相似文献
14.
基于Web文本挖掘的企业竞争情报获取方法研究 总被引:1,自引:0,他引:1
本文从Web数据挖掘方法入手,介绍了企业竞争情报的获取方法,包括基于Web内容挖掘的获取方法、基于Web结构挖掘的获取方法和基于Web使用记录挖掘的获取方法,进而研究了基于web文本挖掘的竞争情报获取步骤,最后剖析了基于Web文本挖掘的企业竞争情报中客户知识获取的案例。 相似文献
15.
文本挖掘在网络舆情信息分析中的应用 总被引:15,自引:0,他引:15
网络舆情已成为社会情报的一种重要表现形式.挖掘技术为网上大量以非结构化数据形式出现的舆情信息分析提供了方法和技术支持.介绍了网络舆情的特点与作用,分析了文本挖掘技术的主要功能,提出网络舆情信息挖掘分析模型,并以实例说明文本挖掘在网络舆情分析中的应用. 相似文献
16.
基于多因素方差分析的文本向量特征挖掘算法 总被引:2,自引:0,他引:2
文本向量特征挖掘应用于信息资源组织和管理领域,在大数据挖掘领域具有较大应用价值,传统算法精度不好。提出一种基于多因素方差分析的文本向量特征挖掘算法。使用多因素方差分析方法得到多种语料库的特征挖掘规律,结合蚁群算法,根据蚁群适应度概率正则训练迁移法则,得到种群进化最近时刻获得的数据集有效特征概率最大值,基于最优划分的K-means初始聚类中心选取算法,先对数据样本进行划分,然后根据样本分布特点来确定初始聚类中心,提高文本特征挖掘性能。仿真结果表明,该算法提高了文本向量特征的聚类效果,进而提高了特征挖掘性能,具有较高的数据特征召回率和检测率,时间耗时较少,在数据挖掘等领域应用价值较大。 相似文献