共查询到20条相似文献,搜索用时 843 毫秒
1.
汉语自动分词模式自动机构造研究 总被引:1,自引:2,他引:1
吴绍根 《现代图书情报技术》2006,1(5):47-49
基于有限状态自动机,提出一种新型的有限自动机模型--模式自动机,并以该模型为基础,设计出一种新的汉语自动分词模型,给出构造汉语自动分词模型的核心数据结构和构造算法,并分析该分词算法的复杂度。 相似文献
2.
3.
算法感知是分析算法及其社会影响的重要路径之一。本研究基于算法感知路径,以社会认知理论为基础,以环境—个人—行为关系为分析框架,分析用户算法感知对反馈行为的影响机制。研究发现:第一,用户在媒介实践中感知到信息是由算法推荐的,并基于所接收的信息(静态环境)这一算法输出结果进行反馈,特定反馈也受到动态社会环境的规约。第二,用户基于算法理解(心理认知)进行反馈,对于不同的算法推荐逻辑,反馈机制有所不同。第三,外界环境、用户认知心理的交互,呈现在对算法的感知模式中,感知模式会引导反馈行为,但具体情况因个人、环境等不可抗因素而有所差异。本研究基于算法感知的反馈行为,从经验层面说明了算法感知概念提出的重要性。 相似文献
4.
已有的频繁模式挖掘算法难以适应像生物信息数据挖掘、图模式挖掘等频繁巨模式挖掘应用.提出一种频繁巨模式挖掘算法,即基于核模式合成的频繁巨模式挖掘算法(Core Pattern Fusion Based Colossal Frequent Pattern Mining Algorithm,CPFCFPA),通过将各较小的核模式进行一步合成,寻求一个对频繁巨模式完整集的蕴含集.引入项集编辑距离概念,提出一种新颖的评价频繁巨模式挖掘结果质量的评测模型.实时数据集实验显示,CPFCFPA具有较好的可扩展性和挖掘性能,且对当前频繁模式挖掘算法难以或不能实现的挖掘任务,其挖掘结果能做到对频繁巨模式完整挖掘集的较好近似. 相似文献
5.
为了提高文本挖掘的深度和精度,研究并提出了一种基于领域本体的语义文本挖掘模型.该模型利用语义角色标注进行语义分析,获取概念和概念间的语义关系,提高文本表示的准确度;针对传统的知识挖掘算法不能有效挖掘语义元数据库,设计了一种基于语义的模式挖掘算法挖掘文本深层的语义模式.实验结果表明,该模型能够挖掘文本数据库中的深层语义知识,获取的模式具有很强的潜在应用价值,设计的算法具有很强的适应性和可扩展性. 相似文献
6.
7.
8.
9.
大数据时代,数据信息纷至沓来,算法技术逐渐被应用、深化于传播领域,使得基于个性化服务的算法推荐模式成为了新的信息发展方向。与此同时,算法推荐模式却导致了“信息茧房”效应的产生,并引发了一系列问题。本文以抖音的算法推荐为案例,总结了算法推荐的形式风格,对信息茧房的效应进行分析,明晰出抖音短视频中信息茧房的具体表征和产生诱因,并在此基础上对信息茧房产生的影响进行反思。 相似文献
10.
基于用户访问网页的不同序列反映了用户特定的兴趣,提出了Web日志中用户存取模式的聚类算法。利用传统的Leader算法只扫描数据集一遍的优点,以及粗糙理论在处理含有不确定信息问题上的优势,给出了结合粗糙理论的改进Leader算法对用户存取模式进行聚类方法,使得同一类中的用户存取模式尽可能的相近或相似,不同类中的模式尽可能的相异。实验结果表明,该算法在可承受的计算时间内可对Web日志中的用户存取模式进行有效聚类。 相似文献
11.
12.
全文检索系统由三大功能模块组成:索引模块、检索模块和存储模块。本文着重分析系统组成和XML数据库的设计、建立倒排索引文件、中文分词等技术难点。同时在此基础之上建立基于Lucene/XML的期刊文献全文检索系统。 相似文献
13.
14.
一种基于Native XML的全文检索引擎 总被引:5,自引:0,他引:5
随着XML的日益流行 ,基于XML的全文检索应用需求也迅速扩大。在这些应用中 ,native XML数据库是发展方向。虽然商业化的native XML数据库已经出现 ,但其全文检索的性能还不尽人意。本文提出一种方法 :在传统的倒排索引的框架下 ,对XML的标记建立索引 ,使得一个全文数据库能够以Native的方式存储、索引、检索和输出XML文档 ,成为一个真正意义上的native XML全文数据库 ,既有传统全文数据库的优越性能 ,又能满足基于na tive XML的应用需求 相似文献
15.
开放获取资源统一访问平台全文检索工具的设计与实现 总被引:2,自引:0,他引:2
就如何实现OA资源的全文检索进行探讨,分别阐述目前OA资源检索平台的现状及实现全文检索的难点,提出并实现以搜索引擎为代理自动完成对OA资源全文进行检索的技术方法,且对该方法从系统设计和技术细节两方面进行解析。测试表明,以搜索引擎为代理的OA资源统一访问平台的全文检索工具的检索效率及质量基本令人满意。 相似文献
16.
利用Web of Science评价电子期刊数据库内容 总被引:2,自引:0,他引:2
本文针对如何利用Web of Science评价电子期刊数据库收录内容这一问题,以评价CSA提供的10个SAGE专题全文数据库为例进行了探讨,最终得出购买建议。 相似文献
17.
18.
Web内容挖掘在数字图书馆中的应用 总被引:3,自引:1,他引:3
Web信息是数字图书馆数字资源的重要来源,文章详细阐述了对Web内容中的文本信息的挖掘,包括:文本自动摘要、文本分类和文本聚类。在挖掘过程中基于用户需求和用户特征,针对文本分类,重点分析了分类过程和在数字图书馆中的应用;针对文本聚类,介绍两种基本聚类原理以及与文本分类的不同之处,重点论述其在数字图书馆中如何应用。最后提出内容挖掘与用户挖掘的结合更有助于服务用户。 相似文献
19.
在分析Google桌面搜索工具(GDS)运行机制的基础上,提出一种基于GDS开发站内全文搜索引擎的方法:开发一个专用的Web代理GDSProxy,采用接受与转发机制支持用户对GDS搜索服务的远程访问,转发过程中增加用户IP地址限定、身份认证、日志处理和信息过滤等功能,站内信息的挖掘、索引和本地搜索服务由GDS承担。最后,通过开发实例介绍具体实现步骤。 相似文献
20.
SAE的系列产品作为汽车工程的重要科技文献,具有很高的学术价值。本文对Folio Views软件、SAECD-ROM内容、基于Folio Views的SAECD-ROM的检索方法、检索技巧及如何获取全文进行介绍。 相似文献