首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到17条相似文献,搜索用时 546 毫秒
1.
宁琳 《现代情报》2016,36(2):140
文本挖掘是数据挖掘技术的一个重要方面,本文根据句法规则的特征,利用文本挖掘技术,提出基于句法规则的文本知识挖掘设计模型,从数据准备、句法规则构造、文本预处理、文本知识挖掘、挖掘结果评价等方面对工作原理进行了分析,重点阐述了句法规则的构造过程,最后通过实验验证了该模型,该设计对实现文本知识的智能化挖掘具有一定的研究意义和应用价值。  相似文献   

2.
文本挖掘与中文文本挖掘模型研究   总被引:5,自引:0,他引:5  
谌志群  张国煊 《情报科学》2007,25(7):1046-1051
文本挖掘,又称为文本数据挖掘或文本知识发现,是指在大规模的文本中发现隐含的、以前未知的、潜在有用的模式的过程。本文首先对文本挖掘进行了概述,给出了文本挖掘的定义、特点和研究现状。然后对国内中文文本挖掘的研究现状进行了分析,指出了当前中文文本挖掘研究中存在的主要问题和主要研究方向。最后提出了一个统一的中文文本挖掘模型——UCTMF。该模型具有层次性、开放性和可扩展性,为中文文本挖掘系统提供了基本体系框架。  相似文献   

3.
介绍了文本数据挖掘和知识提取的基本理论,然后分析了网络信息的检索与挖掘的特征,特别是文本挖掘、Web数据挖掘和基于内容数据挖掘与之相关联的系列问题.在此基础上,分析了Web知识库的设计、建立、文本数据挖掘和知识发现所需的理论和技术,对Web知识库系统的架构和功能模块进行分析和设计,建立了基于文本数据挖掘的Web网络知识库的模型.  相似文献   

4.
西安电子科技大学经济管理学院温有奎教授和武汉大学信息管理学院焦玉英教授合著的《基于知识元的知识发现》一书[1]开创了情报学知识组织与知识发现模式研究的新方向.首次探索以知识元为知识组织对象的文本挖掘和科学知识关联发现的情报理论与方法,为情报科学与智能科学之间架起了一座合作发展的桥梁. 《基于知识元的知识发现》一书系统讨论和研究了文本知识表达、文本知识组织、文本知识挖掘与数据挖掘对象的不同,挖掘原理和方法的区别,文本知识的基本单元组成及推理对象的识别,自然语言编码和解码的元语义,知识元的语义结构,情报科学与知识科学方程组的探讨,文本知识元模型的建立和应用.这些内容的研究对文献知识的关键词表达和检索对象向知识单元的组织和挖掘具有挑战,对实现人类知识的有效组织、有效阅读、有效使用具有较高的理论价值和实践意义.基于知识元的语义链接将开拓人机协同的知识发现的新方法,为情报科学的研究进入知识科学方法的研究开创了一种新的途径.  相似文献   

5.
为揭示学科之间的交叉知识,提出一种基于文本挖掘的学科交叉知识发现模型。构建了学科交叉文献发现模型与学科交叉知识发掘模型,从学科交叉点和新的增长点两个方面来揭示学科之间的交叉关系,并通过近10年来情报学与计算机科学两个学科文献数据进行了实例验证。  相似文献   

6.
基于SOM聚类的文本挖掘知识展现可视化研究   总被引:1,自引:0,他引:1  
本文旨在以可视化的知识地图展现防务快讯文本挖掘下的挖掘结果,为情报工作者获取知识提供方便.当前,文本挖掘的可视化展现在方法和技术上都是一个难点,本文尝试在文本挖掘系统中引入SOM神经网络算法,该方法在知识可视化方面效果比较突出,配合国防词汇本体非常清晰的层次结构,能够很好地将文本挖掘系统采集到的防务信息聚合成有序的知识并以色块图的形式展现给用户.实验结果表明这种方法聚类结果准确,可视化展示界面简单明了,方便用户了解热点问题、获取知识,便于支持决策.  相似文献   

7.
[目的/意义]为挖掘旅游平台游记文本蕴含知识,协助旅游者高效获取符合需求的信息和知识,为制定旅游计划提供科学决策的信息支持。[方法/过程]首先面向用户需求提出基于布尔矩阵和集合逻辑改进Apriori算法的思路;然后融合命名实体识别实现了游记文本关联知识挖掘及聚合,构建了基于关联知识挖掘的个性化推荐服务模式,并以携程网中杭州相关的游记文本进行了实证研究。[结果/结论]研究发现,融合命名实体识别和改进的Apriori算法,能够有效挖掘游记文本蕴含知识,实验结果验证了在算法性能及结果上要优于传统Apriori算法,并能够根据挖掘结果向用户提供个性化推荐服务,协助旅行者科学、高效地制定旅游计划。研究结论丰富了游记文本挖掘的方法论,为旅游平台服务推荐优化提供了新的思路。  相似文献   

8.
基于Web文本挖掘技术的企业竞争情报系统研究   总被引:9,自引:2,他引:9  
分析了企业竞争情报系统的现状,介绍了Web挖掘基本概念并分析了Web文本挖掘的关键技术,然后结合Web文本挖掘技术设计企业竞争情报系统结构模型与方案。  相似文献   

9.
介绍了数据挖掘和Web挖掘的基本概念,在此基础上,对基于Web的文本信息挖掘技术进行了分析研究,给出了一个基于Web的文本挖掘的结构模型。  相似文献   

10.
丁堃  李鑫 《科学学研究》2008,26(2):373-377
 随着中文文本挖掘技术的不断发展,使以内容分析为基础的科技文献计量成为可能。本文以我国知识管理研究出现以来的5000余篇学术期刊载文为分析对象,以特征选择算法抽取出10,000个特征词为基础,采用向量空间模型(VSM)和文本挖掘技术中的有序聚类方法,揭示出知识管理学科领域的研究内容在我国经历的三个发展阶段,同时还从特征词入手对这三个发展阶段的研究特点进行了归纳总结。将文本挖掘的相关技术应用到学科领域发展的研究中是一个很有意义的尝试,也为今后相关领域的研究工作起到一个很好的借鉴作用。  相似文献   

11.
阮光册 《情报科学》2012,(1):105-109
运用文本挖掘技术发现网络新闻报道中潜在的、有价值的信息是情报研究的一个新尝试。笔者探讨了网络新闻的文本挖掘方法,以上海世博新闻媒体网络版报道为例,进行实证研究,并对报道差异进行对比分析。本文选取香港、台湾、境外媒体华语版、上海本地媒体对世博会相关报道,基于文本挖掘、特征提取对报道内容的差异进行阐述,并得出结论。  相似文献   

12.
文本挖掘是基于非相关文献知识发现的核心。本文将文本挖掘的过程细化为从文献源到初始文献集子过程,从初始文献集到中间词集子过程,从中间词集到关联词集子过程。并对每一个子过程中所使用的方法进行分析比较。在此基础上对文本挖掘存在的问题进行分析,并提出改进方法。  相似文献   

13.
春秋时代作为中国古代历史发展的重要转型时期,经济、政治、文化等各领域都发生了急剧的变革。研究这一时期社会变迁,对于阐释中华文化的历史渊源、发展脉络、基本走向,建构中国特色社会主义传统文化观皆有非常重要的意义和价值。文章以《左传》为语料来源,以文本挖掘为手段分析春秋社会演变规律,借助社会变迁相关理论对春秋时代进行结构、表现及动力等不同维度的描述,进而从文本分析的角度构建对应的量化指标。通过融合词频分析、聚类分析、时间序列分析、社区结构挖掘等多种文本挖掘技术,实现各项量化指标的计算。实验结果表明,研究设计的文本计算方法较好地描述了春秋社会结构演变、演变动力及演变表现,与人文学者研究结果基本一致。对于人文计算的开展具有一定理论价值与实践意义,但在模型构建、特征挖掘的方法以及结果评价方面仍有待进一步提升。  相似文献   

14.
刘兰  赵新力  李艳 《中国软科学》2007,(6):102-105,110
本文在介绍文本挖掘和技术路线图研究情况的基础上,探讨如何将文本挖掘和技术路线图结合起来,通过挖掘隐含在科技信息中的知识和联系,并结合技术领域专家,绘制技术路线图,以帮助技术主管发现技术创新的机会。  相似文献   

15.
在领域本体已知和文本语义标注主要步骤的基础上,本文用数据挖掘技术实现文本语义信息的获取,提出了文本语义分析与标注的基本思想和处理流程,深入探讨了用聚类分析完成实例分析与标注过程,用关联挖掘和分类方法完成实例间关系的分析与标注过程。  相似文献   

16.
袁顺波 《情报科学》2006,24(11):1732-1736
本文从图像挖掘的定义和特点出发,分析了典型的图像挖掘模型:功能驱动模型和信息驱动模型,并探讨了目前常用的图像挖掘技术,如相似性搜索、图像关联规则挖掘、图像分类、图像聚类和神经网络等。  相似文献   

17.
基于数据挖掘的Web文本不良信息监测模型研究   总被引:1,自引:0,他引:1  
本文简要介绍了不良信息的概念和分类,有针对性地分析了国内外不良信息监测的研究现状与问题,综合应用文本内容特征分析、文本分类分析等挖掘方法,构建了Web文本不良信息监测模型,提出了文本不良信息监测算法.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号