首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 843 毫秒
1.
汉语自动分词模式自动机构造研究   总被引:1,自引:2,他引:1  
基于有限状态自动机,提出一种新型的有限自动机模型--模式自动机,并以该模型为基础,设计出一种新的汉语自动分词模型,给出构造汉语自动分词模型的核心数据结构和构造算法,并分析该分词算法的复杂度。  相似文献   

2.
改进的中文字串多模式匹配算法   总被引:4,自引:0,他引:4  
针对中文字串匹配问题 ,提出了一种改进的多模式匹配算法。该算法采用新型组合状态自动机 ,解决了对大字符集语言构建字符完全Hash表时可能遇到的存储空间膨胀问题。此外 ,算法还充分利用中文大字符集语言的优势 ,将QS算法的思想融入到多模式匹配应用中 ,取得了良好的效果。实验结果显示 ,本算法明显优于DFSA算法 ,在平均情况下所花费时间仅为DFSA算法的 70 33%。  相似文献   

3.
算法感知是分析算法及其社会影响的重要路径之一。本研究基于算法感知路径,以社会认知理论为基础,以环境—个人—行为关系为分析框架,分析用户算法感知对反馈行为的影响机制。研究发现:第一,用户在媒介实践中感知到信息是由算法推荐的,并基于所接收的信息(静态环境)这一算法输出结果进行反馈,特定反馈也受到动态社会环境的规约。第二,用户基于算法理解(心理认知)进行反馈,对于不同的算法推荐逻辑,反馈机制有所不同。第三,外界环境、用户认知心理的交互,呈现在对算法的感知模式中,感知模式会引导反馈行为,但具体情况因个人、环境等不可抗因素而有所差异。本研究基于算法感知的反馈行为,从经验层面说明了算法感知概念提出的重要性。  相似文献   

4.
已有的频繁模式挖掘算法难以适应像生物信息数据挖掘、图模式挖掘等频繁巨模式挖掘应用.提出一种频繁巨模式挖掘算法,即基于核模式合成的频繁巨模式挖掘算法(Core Pattern Fusion Based Colossal Frequent Pattern Mining Algorithm,CPFCFPA),通过将各较小的核模式进行一步合成,寻求一个对频繁巨模式完整集的蕴含集.引入项集编辑距离概念,提出一种新颖的评价频繁巨模式挖掘结果质量的评测模型.实时数据集实验显示,CPFCFPA具有较好的可扩展性和挖掘性能,且对当前频繁模式挖掘算法难以或不能实现的挖掘任务,其挖掘结果能做到对频繁巨模式完整挖掘集的较好近似.  相似文献   

5.
为了提高文本挖掘的深度和精度,研究并提出了一种基于领域本体的语义文本挖掘模型.该模型利用语义角色标注进行语义分析,获取概念和概念间的语义关系,提高文本表示的准确度;针对传统的知识挖掘算法不能有效挖掘语义元数据库,设计了一种基于语义的模式挖掘算法挖掘文本深层的语义模式.实验结果表明,该模型能够挖掘文本数据库中的深层语义知识,获取的模式具有很强的潜在应用价值,设计的算法具有很强的适应性和可扩展性.  相似文献   

6.
智能信息检索中个性化模式的表示形式研究   总被引:3,自引:2,他引:3  
智能信息检索中 ,个性化模式的描述和更新决定了文档过滤的效率。本文根据Huffman树的特点 ,提出基于Huffman树形式组织用户个性化模式并给出其相应的文档过滤算法。与其他他同的个性化模式过滤算法的性能比较而言 ,其具有占用空间少 ,过滤速度快的优点。  相似文献   

7.
基于元胞自动机原理,根据网民表达观点的倾向度和坚持自己观点的自信度,提出元胞倾向转换的标准化自信度多数规则,在此基础上构建迁移元胞自动机网络演化模型(M~2CA),运用M~2CA模型分析网络舆情的观点演化,包括粗粒度倾向度、细粒度倾向度和倾向度转换图。通过对仿真实验结果的分析,揭示了网络舆情演化的观点统一、两极分化和观点漂移的现象,分析了核心区域漂移现象和倾向度曲线多波峰现象的成因;仿真结果表明该模型能较好拟合舆情演化的规律。  相似文献   

8.
提出一种逐步求精的标引策略,在分析词条模式的基础上定义词条抽取的约束条件,设计基于统计模式的逐步求精标引算法。  相似文献   

9.
唐晓慧 《新闻传播》2023,(15):52-54
大数据时代,数据信息纷至沓来,算法技术逐渐被应用、深化于传播领域,使得基于个性化服务的算法推荐模式成为了新的信息发展方向。与此同时,算法推荐模式却导致了“信息茧房”效应的产生,并引发了一系列问题。本文以抖音的算法推荐为案例,总结了算法推荐的形式风格,对信息茧房的效应进行分析,明晰出抖音短视频中信息茧房的具体表征和产生诱因,并在此基础上对信息茧房产生的影响进行反思。  相似文献   

10.
吴瑞  史文武 《情报学报》2006,25(5):629-633
基于用户访问网页的不同序列反映了用户特定的兴趣,提出了Web日志中用户存取模式的聚类算法。利用传统的Leader算法只扫描数据集一遍的优点,以及粗糙理论在处理含有不确定信息问题上的优势,给出了结合粗糙理论的改进Leader算法对用户存取模式进行聚类方法,使得同一类中的用户存取模式尽可能的相近或相似,不同类中的模式尽可能的相异。实验结果表明,该算法在可承受的计算时间内可对Web日志中的用户存取模式进行有效聚类。  相似文献   

11.
讨论建立博士学位论文全文数据库的必要性和可行性,分析国内外博硕士学位论文数据库建设的现状,在探讨国际免费软件Winisis功能、特点的基础上,论述利用Winisis作为平台构建和管理博士学位论文全文数据库的具体方法与步骤。  相似文献   

12.
彭哲 《图书情报工作》2008,52(6):110-110
全文检索系统由三大功能模块组成:索引模块、检索模块和存储模块。本文着重分析系统组成和XML数据库的设计、建立倒排索引文件、中文分词等技术难点。同时在此基础之上建立基于Lucene/XML的期刊文献全文检索系统。  相似文献   

13.
因特网上生物医学全文期刊的分布与获取   总被引:12,自引:0,他引:12  
医学图书馆在依托网络和数字化馆藏时 ,应充分利用中国高等教育文献保障体系(CALIS)引进的国外全文数据库 ,并引进国外医学类全文数据库 ,采取多元化方式建立基于Web的生物医学文献资源保障系统。参考文献 3  相似文献   

14.
一种基于Native XML的全文检索引擎   总被引:5,自引:0,他引:5  
王弘蔚  肖诗斌 《情报学报》2003,22(5):550-556
随着XML的日益流行 ,基于XML的全文检索应用需求也迅速扩大。在这些应用中 ,native XML数据库是发展方向。虽然商业化的native XML数据库已经出现 ,但其全文检索的性能还不尽人意。本文提出一种方法 :在传统的倒排索引的框架下 ,对XML的标记建立索引 ,使得一个全文数据库能够以Native的方式存储、索引、检索和输出XML文档 ,成为一个真正意义上的native XML全文数据库 ,既有传统全文数据库的优越性能 ,又能满足基于na tive XML的应用需求  相似文献   

15.
开放获取资源统一访问平台全文检索工具的设计与实现   总被引:2,自引:0,他引:2  
就如何实现OA资源的全文检索进行探讨,分别阐述目前OA资源检索平台的现状及实现全文检索的难点,提出并实现以搜索引擎为代理自动完成对OA资源全文进行检索的技术方法,且对该方法从系统设计和技术细节两方面进行解析。测试表明,以搜索引擎为代理的OA资源统一访问平台的全文检索工具的检索效率及质量基本令人满意。  相似文献   

16.
利用Web of Science评价电子期刊数据库内容   总被引:2,自引:0,他引:2  
郭丽芳 《图书馆杂志》2006,25(4):21-22,39
本文针对如何利用Web of Science评价电子期刊数据库收录内容这一问题,以评价CSA提供的10个SAGE专题全文数据库为例进行了探讨,最终得出购买建议。  相似文献   

17.
基于Lucene的Ftp搜索引擎的设计   总被引:2,自引:0,他引:2  
针对当前网络中所使用的基于数据库的Ftp搜索引擎没有标准资源文档且不支持中文分词和动态数据更新的缺陷,提出基于Lucene这个功能强大的全文索引引擎工具包的Ftp搜索引擎的设计方案。此Ftp搜索引擎不仅能够自动生成标准格式的XML资源文档,而且采用基于字典的前向最大匹配中文分词法在Lucene中动态更新全文索引。该设计还能够对检索关键字进行中英文混合分析和检索。  相似文献   

18.
Web内容挖掘在数字图书馆中的应用   总被引:3,自引:1,他引:3  
黎琳  赵英 《图书馆学研究》2006,(2):19-21,24
Web信息是数字图书馆数字资源的重要来源,文章详细阐述了对Web内容中的文本信息的挖掘,包括:文本自动摘要、文本分类和文本聚类。在挖掘过程中基于用户需求和用户特征,针对文本分类,重点分析了分类过程和在数字图书馆中的应用;针对文本聚类,介绍两种基本聚类原理以及与文本分类的不同之处,重点论述其在数字图书馆中如何应用。最后提出内容挖掘与用户挖掘的结合更有助于服务用户。  相似文献   

19.
在分析Google桌面搜索工具(GDS)运行机制的基础上,提出一种基于GDS开发站内全文搜索引擎的方法:开发一个专用的Web代理GDSProxy,采用接受与转发机制支持用户对GDS搜索服务的远程访问,转发过程中增加用户IP地址限定、身份认证、日志处理和信息过滤等功能,站内信息的挖掘、索引和本地搜索服务由GDS承担。最后,通过开发实例介绍具体实现步骤。  相似文献   

20.
SAE的系列产品作为汽车工程的重要科技文献,具有很高的学术价值。本文对Folio Views软件、SAECD-ROM内容、基于Folio Views的SAECD-ROM的检索方法、检索技巧及如何获取全文进行介绍。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号