首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 437 毫秒
1.
随着计算机的普及与快速发展,如何通过在批量数据中提取有效规则实现机器智能分类与推理,提高知识推理的有效性与准确率,成为当前知识服务领域的难题之一.文章基于本体(Ontology)的知识组织方式和粗糙集(Rough Set)理论的知识获取技术,针对批量数据的规则提取实现知识推理,提出知识推理模型ORSKM.ORSKM模型利用九元组构建领域本体,实现实例数据的语义化描述;从领域本体的属性中提取粗糙集的决策表,由决策表对领域本体关系进行领域知识知识库归约,获取领域知识相关的属性规则;通过粗糙集知识推理算法实现知识获取,最后通过实验对该知识推理模型进行验证.  相似文献   

2.
张文宇 《情报学报》2008,27(1):30-34
利用信息系统描述数据集合时会出现数据的不相容现象,为了对信息表中的不相容数据进行较为精确的数据约减,本文针对信息系统的不相容特性,提出了利用广义归纳表及粗糙集理论的有效结合对分类规则进行有效提取的策略.为此首先简单介绍了数据挖掘过程中的数据不相容性问题及广义归纳表的基本构成,然后利用基于广义归纳表与粗糙集的规则发现原理,给出了规则强度的表达方式及其各影响参数的描述.并且,进一步描述了RS与GDT结合进行分类规则提取的实现过程,归纳了静态与动态增量式数据库的规则发现算法,并用算例进行了说明.最后给出了应用此方法进行增量式数据挖掘的实际例子.实验结果表明,用此方法挖掘出的规则简练且合理可靠.  相似文献   

3.
王煜  王正欧  王明春 《情报学报》2005,24(6):674-678
本文根据CHI值原理、粗集理论和决策树原理,提出了一种抽取Web文本分类规则的新方法。决策树分类方法具有出色的数据分析效率和容易抽取、易于理解的分类规则等优势,但对于维数达成千上万维的分类问题很难应用。因此本文先根据CHI值选择每个文本类中对分类贡献大的若干词条,然后采用粗集理论方法对选择的特征进行进一步提取,这样得到维数较小的文本特征向量空间,最后再使用决策树进行分类,从而既保证了分类精度又可很容易地抽取出利于理解的文本分类规则。  相似文献   

4.
Web自动文本分类技术研究综述   总被引:1,自引:0,他引:1  
Web自动文本分类是信息检索与数据挖掘领域的研究热点与核心技术,近年来得到了广泛的关注和快速的发展.本文首先分析了国内外Web自动文本分类方法的研究现状,接着对新近出现的多分类器融合的方法、基于群的分类方法、基于RBF网络的文本分类模型、基于模糊-粗糙集的文本分类模型、潜在语义分类模型等新方法,以及K-近邻算法和支持向量机的新发展等进行了深入探讨;并对Web自动文本分类过程中的几个关键技术:文本预处理、文本表示、特征降维、训练方法和分类算法等进行了分析;最后总结了当前Web自动文本分类技术存在的问题及其发展趋势.  相似文献   

5.
杂合VPRS与PNN的知识发现方法   总被引:3,自引:0,他引:3  
菅利荣  刘思峰 《情报学报》2005,24(4):426-432
本文提出一种变精度粗糙集(Variableprecisionroughsets,VPRS)与概率神经网络(ProbabilisticNeuralNetwork,PNN)杂合的方法。变精度粗糙集对噪声数据有一定的相容性,给定置信阈值β,通过变精度粗糙集模型将信息系统中的冗余属性排除,求出一个最小的知识表示,由此可以约简神经网络的输入。由于概率神经网络的分类及泛化能力较强,接下来应用概率神经网络建立的模型进行分类、预测。实验表明,变精度粗糙集与概率神经网络杂合方法的分类及预测精度均较高。该方法可用于从模糊的、冗余的、不完备的且有噪声的大型数据库中发现知识。  相似文献   

6.
Web文本分类技术研究现状述评   总被引:1,自引:0,他引:1  
本文在分析国内外Web文本分类方法研究现状的基础上,对新近出现的基于群的分类方法、基于模糊—粗糙集的文本分类模型、多分类器融合的方法、基于RBF网络的文本分类模型、潜在语义分类模型等新方法,以及K—近邻算法和支持向量机的新发展等进行了深入探讨;并对Web文本分类过程的几个关键技术:文本预处理、文本表示、特征降维、训练方法和分类算法进行了分析;最后总结了Web文本分类技术存在着新分类方法不断涌现、传统分类方法的进一步发展、文本、语音和图像分类技术的融合等几种发展趋势,以及存在着分词问题、目前还没有发现"最佳"的特征选择等研究的不足之处。  相似文献   

7.
基于最大公共子图的文本相似度算法研究   总被引:1,自引:1,他引:0  
用图结构表示文本,能更好地反映文本内部的结构特征,体现文本内的语义关系及词语在上下文中的语序关系,在此基础上,本文提出了一种基于最大公共子图的文本相似度计算方法,应用最大公共子图提取文本的公共部分,并利用最大公共子图的性质度量文本间的相似程度.最后针对分类试验结果中存在的问题,提出图模型修正方法以改进文本的表示效果,并对修正前后不同β取值下的F-Score值进行比较.修正后的试验结果表明,基于最大公共子图的文本相似度算法有着较好的分类性能.  相似文献   

8.
信息系统中一种面向粗糙集的数据挖掘方法   总被引:17,自引:2,他引:15  
程岩  黄梯云 《情报学报》2001,20(1):90-99
数据挖掘技术是信息系统的一个重要研究内容 ,它可以从大量数据中自动发现对决策有帮助的知识。许多数据挖掘技术仅仅适用于精确集 ,不适用于粗糙集 ,而现实中粗糙集是普遍存在的现象 ,因此开发出一种面向粗糙集的数据挖掘技术在信息系统的研究领域具有重要意义。本文结合粗糙集理论提出了一个信息系统的粗糙集模型 ,在此基础上设计出一个属性约简方法及从粗糙集中发现规则的算法 :Apriori_2。  相似文献   

9.
根据互信息、RBF神经网络和关联规则原理,提出了一种抽取WEB文本分类规则的新方法。先根据互信息选择和各类相关程度大的若干词条,然后采用RBF神经网络方法对选择的特征进行进一步提取,得到维数较小的文本特征向量空间。之后再根据挖掘出的关联规则获取WEB文本分类规则,建立文本分类器,在保证了分类精度的前提下抽取出利于理解的文本分类规则。  相似文献   

10.
针对现有的元数据提取方法提取精度不高且适应能力较差的问题,本文提出一种基于度量级融合的论文元数据提取方法.首先,提取论文首部的特征,利用已标注的数据集对HMM、SVM和CRF三种统计学习方法进行训练,生成相应的元数据提取模型;然后,根据贝叶斯判决理论推导出和规则,并利用和规则对三种提取模型产生的后验概率进行融合决策,实现论文元数据的提取;最后,通过设定时间段和文档数阈值,采用基于时间段统计的方法动态更新三种提取模型,以确保模型的有效性.在不同的数据集上对各种提取方法的性能进行了实验对比,结果表明,本文提出的方法不仅提高了元数据提取精度,而且具有较强的适应能力.  相似文献   

11.
基于XML的MARC研究   总被引:4,自引:1,他引:3  
本文分析了机读目录MARC在未来数字化图书馆应用的局限性,并提出了改进方案,以哈尔滨工业大学为例,对其采用的中文机读目录CNMARC格式进行了XML转换的尝试,从而使得MARC书目数据库和Internet上的非书目数据库的集成成为可能.本文的研究对于现有MARC数据在未来数字图书馆中的利用具有重要意义.  相似文献   

12.
今年"五一",七天长假,神州大地涌动着阵阵旅游热浪. 我凭借着一台电脑、一只调制解调器和一根电话线,"坐地日行八万里",来了一番不寻常的神州兰台网上游,北至东北的吉林,南至海南的琼兰阁,西至甘肃的酒泉,东至东海之滨的上海,造访了全国己开通的10多家档案信息网站,领略了各地兰台网站的不同风采.可谓收获不小,感触颇多.  相似文献   

13.
彭远方  陈冲 《新闻界》2008,(1):19-21
本文从传播学和社会学的视角,以定性与定量研究相结合的方法,分别从网名、聊天形式、聊天对象、聊天内容、聊天语言等方面对青少年使用QQ的情况进行了分析。  相似文献   

14.
选取新浪微博为研究对象,探究我国“微博问政”的现状。分别从微博基本信息、使用状况、问政互动状况三个方面对新浪微博的624个政务微博进行跟踪考察,旨在对“微博问政”进行基于数据的、全局性的描述分析,探讨“微博问政”的广度、深度和效度,指出我国当前“微博问政”存在的问题与发展方向。  相似文献   

15.
Web 信息检索(Information Retrieval)技术研究是应用文本检索研究的成果,它结合Web图论的思想,研究Web上的信息检索,是行之有效的Web知识发现的途径。传统HITS方法所获得的信息精确度相当低,而PageRank作为一通用的搜索方法,不能够应用于特定主题的信息获取。在充分分析了PageRank、HITS等现有算法和Web文档的相似度计算方法的基础上,提出了Web上查询特定主题相关信息发现的RG-HITS算法。它结合了Web超链接、网页知识表示的信息相关度以及HITS方法来搜索Web上特定主题的相关知识。  相似文献   

16.
国外图书馆知识管理研究概述   总被引:1,自引:0,他引:1  
知识管理在图书馆的研究已经进入一个发展期,为此需要对国内外相关研究进行全面与深入地调查和研究  相似文献   

17.
日前,社交媒体蓬勃发展,其在带来网络变革的同时,也深刻地影响着档案工作。本文通过列举社交媒体在档案工作中的应用案例,剖析了社交媒体对档案工作的影响,借以反思社交媒体时代档案工作的机遇和挑战并指出了相关应对策略。  相似文献   

18.
信息服务市场中用户存在需求,因此给数字图书馆开展电子商务带来了市场机遇.文章对广东省数字图书馆开展电子商务服务的运作模式进行阐述,认识到利用数字图书馆开展电子商务是发展的必然趋势,分析了数字图书馆推进电子商务面临的主要问题及障碍,最后提出了实现目标的对策和建议.  相似文献   

19.
基于SOA的数字图书馆研究   总被引:2,自引:0,他引:2  
SOA基于组件模型结构,采用中立接口进行程序单元之间的交互,可以构建通用的应用系统,基于SOA的数字图书馆本质上是将数字图书馆当做一个提供一系列图书馆信息服务的系统,通过各种服务组合能够实现图书馆业务流程的自动化,以灵活应对图书馆业务需求的变化,通过将孤立不兼容的图书馆信息系统和异构的信息资源以组件的方式封装成标准的服务,并经SOA总线进行服务集成,就可以以服务的方式加以利用,从而最大程度地实现信息资源的整合.  相似文献   

20.
宋曙光 《北京档案》1999,(11):18-19
一、方法和步骤 档案工作为农业农村建设服务,离不开规范的基础管理.为了全面了解和掌握我区农业农村档案工作状况,1996年我们对全区农业农村档案现状进行了调查了解,全区28个乡镇、463个村、500多个重点乡村企业、40多个农业科技事业单位,其档案工作几乎等于零.针对这种现状,我们把基础建设放在首位.主要采取以下方法:  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号