首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 187 毫秒
1.
研究利用数据挖掘中的关联规则挖掘分析及论文数据库,进行相关文献推荐,提出适用于进行相关文献推荐的改进的混合加权关联规则挖掘算法,并通过用户行为分析确定相关文献集和垂直权重,采用Google搜索引擎的PageRank算法确定水平权重,获得一些有意义的分析结果。  相似文献   

2.
介绍了数据挖掘中的关联规则和基于Apriori算法的关联规则数据挖掘技术,并使用关联规则挖掘对医学图书馆中的流通数据进行了实例分析.  相似文献   

3.
提出了一种基于数据挖掘技术的Web智能服务算法,它通过对Web数据模型的转换,发现并建立有关用户意向关联知识库,然后再利用知识库中的关联规则来预测用户行为,从而提高了用户浏览器访问速度。该研究内容属目前智能信息检索领域的重要研究课题,具有一定的理论和实践意义。  相似文献   

4.
基于本体的领域知识推理主要分为基于逻辑的领域知识检错推理和基于关系的领域蕴涵知识发现推理。对本体描述的领域知识进行推理,可以检测知识逻辑体系错误,减少领域本体构建繁琐的工作量,减轻对领域专家的依赖,发现领域蕴涵知识。在国共合作领域知识进行语义关系分析的基础上,提炼推理规则库,并分别运用TABLEAU算法和RETE模式匹配算法,在推理引擎Racer和Jena中实现了逻辑检错推理和蕴涵知识发现推理。  相似文献   

5.
数据挖掘技术的改进在图书馆个性化服务中的应用   总被引:8,自引:0,他引:8  
Apriori 算法是关联规则挖掘的一个经典算法,在分析关联规则挖掘算法的基础上,提出利用HASH表技术及减少生成候选集的数量对经典Apriori 算法进行改进,从而提高图书馆数据资源的利用率,加强图书馆个性化服务。  相似文献   

6.
基于本体构建的协同推荐研究   总被引:2,自引:0,他引:2  
通过构建领域本体,利用用户兴趣与领域本体中概念的映射关系,构建用户兴趣本体,发掘用户兴趣模式。研究用户兴趣本体相似度的计算方法,并通过用户兴趣相似度进行垂直加权,通过时间新颖度进行水平加权,从而利用改进的加权关联规则挖掘算法对用户感兴趣的领域本体中的概念进行挖掘,实现面向内容的协同推荐。  相似文献   

7.
基于Apriori改进算法的局部反馈查询扩展   总被引:1,自引:0,他引:1  
提出面向查询扩展的Apriori改进算法,采用三种剪枝策略,极大提高挖掘效率;针对现有查询扩展存在的缺陷,提出基于Apriori改进算法的局部反馈查询扩展算法,该算法用Apriori改进算法对前列初检文档进行词间关联规则挖掘,提取含有原查询词的词间关联规则,构造规则库,从库中提取扩展词,实现查询扩展。实验结果表明该算法能够提高信息检索性能,与现有算法比较,在相同查全率水平级下其平均查准率有了明显提高。  相似文献   

8.
本文应用粗糙集理论中等价关系的概念,结合知识系统细化和泛化的思想以及Apriori算法中逐层搜索迭代求取频繁项集的思想,对数据挖掘中的多值属性关联规则问题进行研究,提出一种新的多值属性关联规则挖掘算法Mqars.Mqars的主要特点是无需将多值属性转化为布尔型属性,可以尽早地约简非候选的频繁项集,方便快捷地计算出项集支持度,提高多值属性关联规则挖掘效率.论文给出了Mqars算法详细描述、具体实现过程和算法实例及分析.最后设计实验环节对Mqars算法与传统的Maqa算法在时间复杂度和算法效率方面进行比对和分析,分析与比对的实验结果表明了该算法的有效性.  相似文献   

9.
领域本体的半自动构建方法研究   总被引:2,自引:0,他引:2  
人机协作的半自动构建本体是目前较为理想的模式。借鉴软件工程中的领域建模、图书馆学中的分类学和本体学习的方法论,由领域专家给出领域的上层知识模式,通过机器学习技术从领域语料库中学习等级关系和相关关系为知识工程师提供参考,将专家的自顶向下和机器学习的自底向上的结果结合起来构建本体。半自动构建领域本体的关键技术在于领域概念的获取和组织,用共现统计算法、关联规则算法、隐含语义索引、Hopfield联想算法获取相关关系,用聚类算法、字面成族、模式匹配获取等级关系,从而完成领域类模型的构建。  相似文献   

10.
高校学生成绩预警是高校教务管理的重要工作之一,研究高校学生学业预警问题在理论层面和实践指导层面均具有重要的价值。采用关联规则算法中的Apriori算法来分析厦门工学院2016级至2018级学生的成绩数据,探究每个专业各课程之间的关联度。在Matlab环境下用Apriori算法对信息与计算科学专业的学生学业成绩进行挖掘分析,发现该专业下不同课程间的关联关系,尤其是对先修课程与后继课程间的关联规则的挖掘,及时对挂科的学生预警,并同时给任课教师提供指导,从而提高教育教学管理水平。  相似文献   

11.
自适应分词算法中的未登录词识别技术研究   总被引:2,自引:0,他引:2  
深入研究了未登录词识别技术,并提出了一种新的未登录词识别算法,包括其中的数量词识别规则、边界单字规则、虚字辅助规则、未登录词记忆识别规则以及左右方探测法选取未登录词规则等,使得算法在不依赖大型语料库的前提下可以有效地识别多种领域中各种类型的未登录词.同时,算法通过对绝大部分的交集歧义的识别有效地解决了识别未登录词时导致的新的切分歧义的问题.在网络时文的开放性测试中,分词算法的分词准确率约为90.1%,未登录词识别的准确率、召回率分别为91.2%和94.7%.  相似文献   

12.
在科技编辑界,并列的阿拉伯数字之间和并列的外文字符之间的停顿用逗号而不用顿号,已成为一种约定俗成的规则。但这种用法可能引起3个问题:不符合中文标点符号使用规则,句子层次混乱甚至造成歧义,句中对应成分标点符号不对应。  相似文献   

13.
为在科技出版物上正确执行GB/T 15835—2011《出版物上数字用法》,做到统一规范,作者在认真学习新标准的基础上,结合科技出版物的实际,介绍新标准中关于应当使用阿拉伯数字、汉字数字的场合及其表示形式的要求型条款,指出在科技出版物上凡是可以使用阿拉伯数字而且又很得体的地方均应使用阿拉伯数字,同时对新标准中的一些明显差错作了辨析。  相似文献   

14.
夏成锋 《编辑学报》2014,26(2):140-140
对科技期刊中英文文章里阿拉伯数字的使用原则作了比较。在大多数情况下中英文都倾向于使用阿拉伯数字,只有计数(非计量)单位前的数字而且数字较少时,中文倾向于使用数字而英文倾向使用文字。  相似文献   

15.
基于概念向量空间的文档语义分类模型研究   总被引:1,自引:0,他引:1  
针对传统文档自动分类方法和目前语义分类方法中存在的问题,提出一种新的基于概念向量空间的文档语义分类模型,该模型通过字符匹配算法将原文档高维词向量空间中相互独立的词项匹配到描述本体概念的属性集合,进而映射成属性集合对应的本体概念,形成低维的、语义丰富的文档概念向量空间。采用目前非常流行的数据集“20Newsgroups”作为实验数据集,对基于概念向量空间的文档语义分类模型进行实验验证。实验结果表明:提出的文档语义分类方法与传统基于词向量空间的文档分类方法相比,能够极大地降低向量空间维度,提高文档分类的性能。   相似文献   

16.
主题标引是指根据文献内容及相关特征,赋予具有检索意义的相应语词标识的过程。《中国分类主题词表(第二版)》的使用,标志着我国图书编目工作进入了一个新的阶段,极大地提高了我国中文图书的分类、主题标引的一体化和文献检索的准确率,以及图书编目的质量和工作效率。同时,对从事标引工作的编目员来说,有了更高的要求,促进了我国文献标引工作向更高水平发展。  相似文献   

17.
鞠衍清  龙海波 《编辑学报》2017,29(2):139-141
中文科技论文内英文字符及阿拉伯数字之间的逗号与顿号的使用以及英文书刊名的标示问题一直存有争议,而国家标准对此还缺乏具体的规定.英文省略号的使用中也有较多的错误.这些问题给科技期刊编辑工作造成很大的混乱,降低了期刊的编辑质量.通过对L省10家自然科学版高校学报的调查,并借鉴现有文献观点,确定只能以逗号分隔英文字符及阿拉伯数字的2种情形,同时对英文省略号的使用提出建议.此外,还提出:中文科技论文中的英文书刊名及文章篇名应以书名号来标示,不能用斜体.  相似文献   

18.
基于既定词表的自适应汉语分词技术研究   总被引:3,自引:0,他引:3  
提出一种汉语分词算法,在给定的分词词表的基础上进行汉语分词时,不但能成功切分出分词词表中已有的词,而且能同时自动识别出分词词表中没有的词,即未登录词。与逆向最长匹配法以及其他未登录词识别算法进行的测试比较表明,该分词算法可以有效地解决大多数未登录词的识别问题,并且能减少分词错误,同时对分词算法的效率基本没有影响。  相似文献   

19.
以某大学图书馆的所有馆藏书目为研究对象,在对图书关键词标引信息进分析的基础上,总结中文关键词的基本特点及其抽取规律,构建一个基于字序列标注的中文关键词抽取模型,提出中文关键词抽取的基础思路和实现方案,并通过实验论证模型的合理性、正确性和实用性,认为字序列标注方法优于词序列标注,基本上可以解决不分词情况下的中文关键词抽取问题。  相似文献   

20.
2000-2004年中国图书馆事业热点分析   总被引:5,自引:0,他引:5  
论文以《中国图书馆学报》(2000~2004)为研究对象,统计分析了720篇文章的题名中出现的关键词,并对其作词频统计分析,以确定近几年中国图书馆界的10个研究热点。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号