共查询到19条相似文献,搜索用时 234 毫秒
1.
2.
针对传统TF-IDF在文本过滤时存在的缺点,提出一种基于特征词抽取的文本过滤算法。简要分析文档信息过滤原理和流程,重点讨论文档信息过滤算法设计及技术实现。实验结果表明,所提出的算法可有效对文档信息进行过滤,能够提高信息检索质量。 相似文献
3.
本介绍了因特网概况及其主要查询工具的一些情况,阐述了信息抽取、信息检索的定义及其相互关系。主要介绍了模板处理的含义、应用过程及其主要应用领域,并探讨了模板处理方法的研究及开发工作。 相似文献
4.
信息抽取在竞争情报中的应用研究 总被引:1,自引:1,他引:1
简要介绍信息抽取的特点和抽取的信息类型,概述信息抽取技术在竞争情报中的应用;在此基础上,提出基于信息抽取技术的竞争情报系统的体系架构,主要包括信息抽取引擎、数据转换与集成、数据清洗、数据装载等,研究信息抽取引擎中封装器的实现方式,并从系统采用的机制和方式、系统功能侧重点、系统的自动化程度等方面分析国外基于信息抽取技术的竞争情报系统的特点。 相似文献
5.
6.
7.
8.
李昕 《中国科技资源导刊 (中国信息导报)》2008,40(2):52-56
信息抽取的目标是自动从文本信息中抽取出预先想要得到的信息(知识),它提供了一条从浩瀚信息堆积中抽取出与用户相关信息的一条思路。本文分析了信息抽取的主要概念、信息抽取的现状及类型,提出了在数字图书馆的建设中,信息抽取技术在数字内容的自动标引、数据获取、数据挖掘、情报研究分析、参考咨询等方面发挥重要的作用。 相似文献
9.
10.
李昕 《中国科技资源导刊》2008,40(2)
信息抽取的目标是自动从文本信息中抽取出预先想要得到的信息(知识),它提供了一条从浩瀚信息堆积中抽取出与用户相关信息的一条思路.本文分析了信息抽取的主要概念、信息抽取的现状及类型,提出了在数字图书馆的建设中,信息抽取技术在数字内容的自动标引、数据获取、数据挖掘、情报研究分析、参考咨询等方面发挥重要的作用. 相似文献
11.
信息抽取技术在情报监测中的应用 总被引:3,自引:0,他引:3
信息抽取 (InformationExtraction)是一门应用性的语言处理技术 ,近年来正受到越来越多的重视。我们选取了国防情报工作这个特殊的领域 ,应用信息抽取技术进行探索性的研究。我们的方法是针对国防情报 ,应用世界最通用的语言—英文 ,设计了一个信息抽取系统 ,对各国国防经费信息进行动态的监测。该方法可望提高信息获取的效率 ,也将会扩展到更多的领域 相似文献
12.
数字图书馆读者检索兴趣的智能分析算法 总被引:1,自引:0,他引:1
针对数字图书馆信息检索服务的智能化发展趋势,提出智能化信息检索服务中对读者检索兴趣进行智能分析的模糊匹配算法,主要思路是在系统中构建用户兴趣矩阵,在用户操作过程中动态构建用户行为矩阵,通过两者的模糊运算,获得用户的兴趣从属度,检索系统根据该从属度对检索结果进行动态优化并及时向用户推送,从而提升检索系统的智能化程度。
相似文献
相似文献
13.
14.
从情报检索语言到本体-信息组织的新变革 总被引:6,自引:2,他引:4
从信息组织的角度,考察本体的实质与特征、本体与情报检索语言的关系,认为本体及其方法和技术为信息组织,特别是网络信息组织带来的新变革主要表现在直接体现语义的网络信息组织,分布式共享,多维、网状的信息组织方式及对推理的支持。 相似文献
15.
多语言信息检索系统可视化初探 总被引:1,自引:0,他引:1
多语言检索的研究在信息种类越来越多的现在十分重要,除检索技术与翻译功能的研究外,信息可视化的运用以及界面设计是另一个研究要点.依据以前的研究和文章综述,信息可视化被证明是帮助用户实施多语言信息检索的有效方法.研究提出一个多语言信息检索系统可视化模型及其设计方案,并指出该领域未来的发展方向. 相似文献
16.
基于全信息认知的信息检索模型整合 总被引:3,自引:0,他引:3
从全信息认知角度对检索模型中的各要素进行阐释:首先阐释语法层次的系统要素;其次阐释提高检索效率的关键——中介要素;最后阐释信息检索发展动力——用户要素。在此基础上,从三个方面论述模型的整合过程:一是基于用户要素的认知模型的整合;二是基于检索人要素的系统模型的整合;三是基于设计人(系统)要素的宏观的过程整合。 相似文献
17.
基于Web挖掘技术的信息检索系统设计与实现 总被引:2,自引:0,他引:2
本文详细介绍一个基于Web文本挖掘技术的信息检索系统的设计与实现。基于Web文本挖掘技术的信息检索技术融合了文本挖掘的思想,它将单一的资源发现或者单一的信息提取的传统的信息检索方法结合起来,从而达到在WWW发现资源并将其中的信息提取出来进行处理的目的。 相似文献
18.
知识信息谱的分析与提取 总被引:3,自引:1,他引:2
Zipf定理揭示了一篇文献中词出现的频率规律,Luhn在Zipf定律的基础上提出了自动抽取有效词的基本思想。基于Luhn思想的传统信息检索长期停留在文献层次上,难以满足人们通过知识元获取知识的需求。为解决这一问题,本文从概念的内涵和外延的认识论出发,考察人们由模拟事物内涵和模拟事物外延提出的图灵机和Petri网构建两种不同的计算机系统。由此提出了知识信息谱分析概念,试图建立具有语义关系的知识元理论框架,实现一种计算机对知识的理解和处理方法。文中给出了最大熵法提取知识元的方法。试验证明这种方法实用、有效。 相似文献
19.