首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 203 毫秒
1.
基于序列模式的个性化Web页面推荐模型*   总被引:1,自引:1,他引:0  
基于数据挖掘中的序列模式方法,提出一种个性化Web页面推荐模型。该模型首先利用Web使用数据预处理提取Web交易事务集,然后应用序列模式算法挖掘频繁(连续)序列,最后通过构建频繁(连续)序列树生成用户偏好视图以生成个性化Web页面推荐集。  相似文献   

2.
挖掘最大频繁项集的优势在于得到的项目数量较少.相比频繁项集和频繁闭合项集挖掘算法,此类算法具有较高的时间和空间效率.根据数据流的特点,结合滑动窗口,提出一种基于有序复合策略的数据流最大频繁项集挖掘算法(E-FPMFI).当数据流流过时,以基本窗口为单位,更新获取数据流片段信息,单遍扫描片段信息得到频繁项目并存储于频繁项目列表内.算法的核心思想:构建有序FP-tree,采用混合子集剪枝技术削减搜索空间,合并同一分支中支持数相等的邻接结点,压缩生成有序复合FP-tree,挖掘最大频繁项集时避免超集检验.经实验验证, E-FPMFI算法具有较好的时空效率和良好的可扩展性.  相似文献   

3.
为了提高文本挖掘的深度和精度,研究并提出了一种基于领域本体的语义文本挖掘模型.该模型利用语义角色标注进行语义分析,获取概念和概念间的语义关系,提高文本表示的准确度;针对传统的知识挖掘算法不能有效挖掘语义元数据库,设计了一种基于语义的模式挖掘算法挖掘文本深层的语义模式.实验结果表明,该模型能够挖掘文本数据库中的深层语义知识,获取的模式具有很强的潜在应用价值,设计的算法具有很强的适应性和可扩展性.  相似文献   

4.
针对图书馆读者借阅事务中存在的序列特征,提出一种基于序列模式挖掘的读者借阅行为分析方法,其思想是通过将借阅事务转化为序列数据库,基于PrefixSpan算法来识别读者借阅行为序列模式。以某高校图书馆读者借阅事务数据为例,通过序列模式挖掘实验表明,此方法可有效获取读者借阅行为的时序规律,其结果在图书馆信息服务中具有一定的应用价值。  相似文献   

5.
本文应用粗糙集理论中等价关系的概念,结合知识系统细化和泛化的思想以及Apriori算法中逐层搜索迭代求取频繁项集的思想,对数据挖掘中的多值属性关联规则问题进行研究,提出一种新的多值属性关联规则挖掘算法Mqars.Mqars的主要特点是无需将多值属性转化为布尔型属性,可以尽早地约简非候选的频繁项集,方便快捷地计算出项集支持度,提高多值属性关联规则挖掘效率.论文给出了Mqars算法详细描述、具体实现过程和算法实例及分析.最后设计实验环节对Mqars算法与传统的Maqa算法在时间复杂度和算法效率方面进行比对和分析,分析与比对的实验结果表明了该算法的有效性.  相似文献   

6.
提出一种基于概念格的数字图书馆用户检索行为序列模式挖掘方法。该方法采用“基于概念格的自顶向下与分治相结合”的挖掘思想,通过自顶向下的概念格迭代,利用概念格的复用性和提取频繁项集的优势,获得数字图书馆用户检索行为的序列模式。该方法不需要遍历原始用户信息数据库,能够大大压缩挖掘时间,有助于数字图书馆提高用户检索速度、改进个性化服务。  相似文献   

7.
以南开大学图书馆Unicorn系统为基础,介绍基于最大频繁模式挖掘算法的书目推荐系统的设计与实现,详细描述利用Unicorn系统中积累的借阅数据分析读者的行为模式,提供个性化书目推荐的方法。该系统利用图书馆现有资源拓展读者服务,可以提高现行自动化借阅系统的使用效率。  相似文献   

8.
文本挖掘中的知识模式表示、评价及检索机制   总被引:1,自引:0,他引:1  
在当前的文本挖掘中,缺乏检索机制,即使对于挖掘到的简单事实也很难被其他用户检索到,对于知识模式更难达到共享。因此应该建立知识模式库,对文本挖掘得到的知识模式采用统一的表示方式、统一的评价标准、统一的检索机制,让任何一种模式都能被对它感兴趣的用户检索到,进而加以利用。本文提出了一种知识模式的框架表示方法,对文本挖掘出的模式进行统一表示、存储,构建知识库,并对知识库中的模式进行内部和外部评价,利用语义相似及领域知识对知识库中的模式进行检索。  相似文献   

9.
面向查询扩展的特征词频繁项集挖掘算法   总被引:1,自引:0,他引:1  
为了获取高质量的扩展词,提出一种面向查询扩展的基于文本数据库的特征词频繁项集挖掘算法。该算法采用支持度衡量特征词频繁项集,给出新的剪枝策略,并结合原始查询,挖掘同时含有查询词项和非查询词项的特征词频繁项集,以提高挖掘效率。实验表明,与传统的挖掘算法相比,本算法更有效、更合理。  相似文献   

10.
基于XML的Web日志挖掘研究*   总被引:2,自引:0,他引:2  
设计一个基于XML的Web日志挖掘体系结构,简要介绍XGMML和LOGML,并在此基础上讨论LOGML文档的生成方法及利用Apriori算法对日志文档进行频繁集、频繁序列和频繁子图挖掘。  相似文献   

11.
本文探讨了现代图书馆的运作模式。包含两部分内容 :一是现代图书馆的 (业务 )机构设置 ;二是现代图书馆管理方式的变革。  相似文献   

12.
刘锦宏  闫翔 《出版科学》2011,19(3):71-75
在分析开放获取学术资源集成动因的基础上,提出并详细探讨一次集成、二次集成和动态集成三种开放获取学术资源集成模式,并从开放获取学术资源集成数量、导航和链接、个性化服务和检索功能等方面讨论三种集成模式的优劣。  相似文献   

13.
论图书馆管理新模式之构建   总被引:4,自引:0,他引:4  
当今时代的环境剧变,对传统的图书馆管理模式产生了强烈的冲击,建立新的图书馆管理模式势在必行.通过两种模式的对比分析,论述了与此有关的问题.参考文献7.  相似文献   

14.
[目的/意义] 裂变型创业企业是区域创新系统中的重要企业形态和新生创新力量。以促进区域创新系统的协同创新发展为目标导向,基于系统协同理论和知识整合理论,探究裂变型创业企业知识整合特征和模式选择,对于其提升知识整合水平、在区域创新系统中形成核心竞争力具有理论和实践意义。[方法/过程]基于企业创业生存-快速发展-成熟蜕变三阶段生命周期视角,解析区域创新系统内裂变型创业企业的知识整合特征,构建生命周期视角下的裂变型创业企业的知识整合模式。[结果/结论]在区域创新系统中,裂变型创业企业知识域的形成需经历知识吸取、知识共享和知识转化3个过程,由于生命周期阶段所呈现的知识特点的迥异,创业成长期裂变企业宜采用继承式模式,快速发展期企业宜采用渐续式模式,成熟蜕变期裂变企业宜采用跳跃式模式。细化研究裂变型创业企业基于生命周期阶段适宜的知识整合模式,有利于强化其高效整合知识资源的能力,提升了企业在区域创新系统中的知识协同管理水平。  相似文献   

15.
基于模式匹配的汉语同义词自动识别   总被引:7,自引:0,他引:7  
陆勇  侯汉清 《情报学报》2006,25(6):720-724
同义词的自动发现和识别在信息检索领域有着重要的研究意义和应用价值。为了提高同义词自动识别的效率,本文提出了从词典释义中使用模式匹配方法提取同义词。该方法首先对词汇的释义方式进行分析,归纳总结出在词典释义中同义词出现的模式,进而利用模式匹配方法获取同义词。实验结果表明,利用模式匹配方法来自动发现同义词具有可行性和实用性。  相似文献   

16.
[目的/意义]从全文本内容分析的角度对算法的学术影响力进行分析。[方法/过程]以自然语言处理领域十大数据挖掘算法使用为例,分析不同算法在特定领域的影响力。通过对1965年-2006年间发表的自然语言处理领域10 922篇学术论文的调研,从其全文内容中抽取6 001条包含十大数据挖掘算法的句子(简称算法句);针对算法句从提及论文数、总提及次数、提及位置等3个方面,对不同算法的影响力进行比较分析。[结果/结论]以不同特征作为影响力衡量标准,十大数据挖掘算法在自然语言处理领域学术论文中的影响力有明显区别,在基于论文数、提及数和提及位置的评估标准中,SVM算法表现出较高的影响力,Apriori算法的影响力则明显低于其他算法。本研究为量化评估算法的影响力提供了新思路。  相似文献   

17.
论文提出“学校十分馆”模式是在经济不发达地区建设乡镇图书馆的可行性模式之一。论文还分析了该模式的建设意义、动作方式、可行性、可能产生的问题及解决办法:  相似文献   

18.
基于模式的本体设计是近几年本体研究的热点之一,内容本体设计模式是其中重要一类,是基于模式的本体构建的基础和复用的重要内容。它的创建方法有两种:从非本体知识资源重组而来;从现存本体中抽取而来。得到的模式主要用于本体精炼和本体构建。对这两方面内容进行综述,介绍相关研究现状,并提出问题和研究展望。  相似文献   

19.
曹继东 《出版科学》2016,24(3):24-27
传统出版和新兴出版融合发展上升为国家出版战略,研究融合发展模式是为全面深化中国出版改革探寻改革路径,重点探析中国出版融合发展的三种模式:全媒体融合范型、融合出版范型、关系出版范型,以期从技术视角探讨融合发展的改革路径。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号