首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 171 毫秒
1.
文本挖掘与中文文本挖掘模型研究   总被引:5,自引:0,他引:5  
谌志群  张国煊 《情报科学》2007,25(7):1046-1051
文本挖掘,又称为文本数据挖掘或文本知识发现,是指在大规模的文本中发现隐含的、以前未知的、潜在有用的模式的过程。本文首先对文本挖掘进行了概述,给出了文本挖掘的定义、特点和研究现状。然后对国内中文文本挖掘的研究现状进行了分析,指出了当前中文文本挖掘研究中存在的主要问题和主要研究方向。最后提出了一个统一的中文文本挖掘模型——UCTMF。该模型具有层次性、开放性和可扩展性,为中文文本挖掘系统提供了基本体系框架。  相似文献   

2.
文本挖掘是一个对具有丰富语义的文本进行分析从而理解其所包含的内容和意义的过程,已经成为数据挖掘中一个日益流行而重要的研究领域。给出了文本挖掘的定义和框架,对文本挖掘中预处理、文本摘要、文本分类、聚类、关联分析及可视化技术进行了详尽的分析,并归纳了最新的研究进展,指出了文本挖掘在信息检索中的作用。  相似文献   

3.
宁琳 《现代情报》2016,36(2):140
文本挖掘是数据挖掘技术的一个重要方面,本文根据句法规则的特征,利用文本挖掘技术,提出基于句法规则的文本知识挖掘设计模型,从数据准备、句法规则构造、文本预处理、文本知识挖掘、挖掘结果评价等方面对工作原理进行了分析,重点阐述了句法规则的构造过程,最后通过实验验证了该模型,该设计对实现文本知识的智能化挖掘具有一定的研究意义和应用价值。  相似文献   

4.
介绍了数据挖掘和Web挖掘的基本概念,在此基础上,对基于Web的文本信息挖掘技术进行了分析研究,给出了一个基于Web的文本挖掘的结构模型。  相似文献   

5.
基于Web文本挖掘的企业竞争情报获取方法研究   总被引:1,自引:0,他引:1  
本文从Web数据挖掘方法入手,介绍了企业竞争情报的获取方法,包括基于Web内容挖掘的获取方法、基于Web结构挖掘的获取方法和基于Web使用记录挖掘的获取方法,进而研究了基于web文本挖掘的竞争情报获取步骤,最后剖析了基于Web文本挖掘的企业竞争情报中客户知识获取的案例。  相似文献   

6.
阮光册 《情报科学》2012,(1):105-109
运用文本挖掘技术发现网络新闻报道中潜在的、有价值的信息是情报研究的一个新尝试。笔者探讨了网络新闻的文本挖掘方法,以上海世博新闻媒体网络版报道为例,进行实证研究,并对报道差异进行对比分析。本文选取香港、台湾、境外媒体华语版、上海本地媒体对世博会相关报道,基于文本挖掘、特征提取对报道内容的差异进行阐述,并得出结论。  相似文献   

7.
钟辉新 《现代情报》2017,37(12):162-167
介绍了新兴趋势等基本概念,在国际国内文献调研和分析的基础上,揭示了基于文献计量学、文本挖掘结合计量学、复杂网络理论在新兴趋势探测研究中的进展,最后总结了新兴趋势研究走向与存在问题。  相似文献   

8.
基于信息抽取的文本知识挖掘模型研究   总被引:1,自引:0,他引:1  
从文本知识挖掘的定义入手,分析了文本知识挖掘的关键技术,并在此基础上建立了基于信息抽取的文本知识挖掘模型,最后通过实例(DiscoTEX)说明这个模型是可行的。  相似文献   

9.
用信息可视化方法分析科研领域发展状况   总被引:3,自引:0,他引:3  
运用信息可视化与文本挖掘技术,以2000-2005年度有关部门管理科学相关领域项目申请书的分析数据为依据,提出一个可视化分析流程.对我国基础科研领域发展状况作了分析,重点对研究热点的识别、学科的交又、学科的演化趋势作了分析研究,为预测基础科研领域的未来发展趋势提供参考.最后通过一个实例分析,对提出的流程及方法进行验证.  相似文献   

10.
刘兰  赵新力  李艳 《中国软科学》2007,(6):102-105,110
本文在介绍文本挖掘和技术路线图研究情况的基础上,探讨如何将文本挖掘和技术路线图结合起来,通过挖掘隐含在科技信息中的知识和联系,并结合技术领域专家,绘制技术路线图,以帮助技术主管发现技术创新的机会。  相似文献   

11.
The emerging research area of opinion mining deals with computational methods in order to find, extract and systematically analyze people’s opinions, attitudes and emotions towards certain topics. While providing interesting market research information, the user generated content existing on the Web 2.0 presents numerous challenges regarding systematic analysis, the differences and unique characteristics of the various social media channels being one of them. This article reports on the determination of such particularities, and deduces their impact on text preprocessing and opinion mining algorithms. The effectiveness of different algorithms is evaluated in order to determine their applicability to the various social media channels. Our research shows that text preprocessing algorithms are mandatory for mining opinions on the Web 2.0 and that part of these algorithms are sensitive to errors and mistakes contained in the user generated content.  相似文献   

12.
魏伟  李金铠  郭崇慧 《资源科学》2021,43(3):489-500
城市矿产是工业化和城市化的产物,具有重要生态价值和经济价值,对城市矿产进行科学、深入、全面的研究有助于其可持续开采和利用。本文基于文献挖掘视角,以1988—2018年间与城市矿产相关的4351篇中文研究文献为对象,运用科学计量学与文本挖掘相结合的方法,定量研究该领域历年来相关研究的动态发展状况,并对未来发展趋势展开分析。研究发现:①中国城市矿产研究正处于发展瓶颈期,存在5个主要研究团队,以理论研究为主,其中翟昕和周永生所在团队着手该领域的研究较早(2010—2014年),赵玉柱和李金惠所在团队在中间阶段较为突出(2015—2016年),王昶所在团队在近期较为突显(2017—2018年);②“矿产资源”(1995年)、“可持续发展”(2002年)、“矿业城市”(2004年)、“资源型城市”(2005年)、“循环经济”(2007年)等关键词在“城市矿产”(2010年)一词形成过程中扮演重要的更迭或者过渡角色,这与人们对城市矿产概念和认识的深化相关;③该领域在不同时间段的研究热点各异,政策导向性较为明显,与社会热点相结合是未来发展的趋势;④政策工具、技术进步与创新是该领域未来研究的重要关联主题。本文的研究能够帮助科研工作者和决策者快速了解和掌握城市矿产领域的研究状况和趋势方向,为推进城市矿产的深入研究和科学决策提供重要参考价值。  相似文献   

13.
从产品评论中挖掘观点:原理与算法分析   总被引:1,自引:0,他引:1  
本文首先对产品评论中的观点挖掘进行了形式化的描述,给出了基本的研究思路;接着分析了从产品评论中识别产品属性的原理,并对基于词汇共现的方法和基于机器学习的方法进行了比较;然后分析了对相关属性进行极性判断的原理,并对各种现行方法进行了比较;最后对观点挖掘在未来的发展热点进行了展望.  相似文献   

14.
浅谈数据挖掘技术及其研究现状   总被引:1,自引:0,他引:1  
刘先花 《现代情报》2010,30(3):167-169
本文首先介绍了数据挖掘的概念、过程与系统构成,其次从数据挖掘的研究方法和应用角度论述了数据挖掘的研究现状,其中着重论述了目前的热点研究方向——Web挖掘的流程与分类。  相似文献   

15.
丁堃  李鑫 《科学学研究》2008,26(2):373-377
 随着中文文本挖掘技术的不断发展,使以内容分析为基础的科技文献计量成为可能。本文以我国知识管理研究出现以来的5000余篇学术期刊载文为分析对象,以特征选择算法抽取出10,000个特征词为基础,采用向量空间模型(VSM)和文本挖掘技术中的有序聚类方法,揭示出知识管理学科领域的研究内容在我国经历的三个发展阶段,同时还从特征词入手对这三个发展阶段的研究特点进行了归纳总结。将文本挖掘的相关技术应用到学科领域发展的研究中是一个很有意义的尝试,也为今后相关领域的研究工作起到一个很好的借鉴作用。  相似文献   

16.
范健 《科教文汇》2013,(1):80-81
在应试教育的环境下,劳动与技术课程由于缺乏一定的科学评价机制,一直被边缘化,同时学校的教育也是重文化课程,轻科技教育,邓小平同志提出的科教兴国也渐渐地变成了一句空话,学生的创造力被束缚。因此作为一名从事劳技教学和科技教育的教师,需从自身做起,在劳技教学渗透科技教育培养学生创造力。  相似文献   

17.
基于可视化数据挖掘的管理科学科技文本分析研究   总被引:8,自引:0,他引:8  
通过可视化数据挖掘方法的研究,使用数据挖掘和科技文本分析的方法,获取管理科学研究的新进展、新思想和新方法。综合评价、对比分析了国内外管理科学研究力量和能力水平的分布状况,对管理科学研究主体度资助主体决策活动有较强的支持作用,并对我国管理科学领域进行了实证分析。  相似文献   

18.
关系抽取是文本挖掘的一项重要研究内容,它能够反映命名实体之间的关系,有助于发现隐含在大量数据和文本中的知识。以生物信息学为例,重点论述了国内外关系抽取技术的研究进展、常用技术与方法及应用,并对未来关系抽取技术的发展进行了展望。  相似文献   

19.
范健 《科教文汇》2013,(2):80-81
本文介绍了在生物学英文文本纷繁芜杂的当今.面对中英文本的文化差异,生物医学自然语言处理fNatu一0aILanguageProcesS{ngforB10]ogy,B1ONLP)的基本概念和方法。归纳总结了B1oNLP在挖掘生物医学文献信息中的重要方面。通过研究实例分析了常见的以“词”、“句”、“篇”为语言单位的分析方法并指出这些方法的局限性,最后展望了生物医学计篮语言堂研窜抬撼  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号