首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 234 毫秒
1.
基于规则的信息抽取,设计了信息抽取的规则文档,再利用XML技术对PDF格式的台湾科技文献进行信息抽取,并将所得的结构化数据导入SQLSERVER数据库,最后利用ASP技术构建一个方便、智能的信息检索平台。  相似文献   

2.
针对传统TF-IDF在文本过滤时存在的缺点,提出一种基于特征词抽取的文本过滤算法。简要分析文档信息过滤原理和流程,重点讨论文档信息过滤算法设计及技术实现。实验结果表明,所提出的算法可有效对文档信息进行过滤,能够提高信息检索质量。  相似文献   

3.
本介绍了因特网概况及其主要查询工具的一些情况,阐述了信息抽取、信息检索的定义及其相互关系。主要介绍了模板处理的含义、应用过程及其主要应用领域,并探讨了模板处理方法的研究及开发工作。  相似文献   

4.
信息抽取在竞争情报中的应用研究   总被引:1,自引:1,他引:1  
简要介绍信息抽取的特点和抽取的信息类型,概述信息抽取技术在竞争情报中的应用;在此基础上,提出基于信息抽取技术的竞争情报系统的体系架构,主要包括信息抽取引擎、数据转换与集成、数据清洗、数据装载等,研究信息抽取引擎中封装器的实现方式,并从系统采用的机制和方式、系统功能侧重点、系统的自动化程度等方面分析国外基于信息抽取技术的竞争情报系统的特点。  相似文献   

5.
专利摘要是重要的情报分析数据来源,但其自然语言文本的特征,使得专利摘要的自动内容抽取具有较大难度。文章利用亚洲语言信息检索测评会议(NACSIS Test Collections for IR, NTCIR,)提供的英文专利文摘测试语料,采用文本信息抽取统计方法中的条件随机场模型,通过提取并添加有效的特征,有针对性地抽取专利摘要中表示技术和功效内容的信息,为专利的技术功效矩阵分析提供可机器自动抽取的强大支持。  相似文献   

6.
专利是一种重要的情报分析数据来源,由于专利使用的术语比论文更为抽象等原因,基于统计的信息抽取效果并不理想。文章利用文档结构的特点以及专利写作过程中的常用特色词汇,在利用条件随机场这种概率模型的基础上,提出了集成基于规则的专利摘要信息抽取方法。系统参加亚洲语言信息检索测评会议专利挖掘之技术趋势图谱子任务,取得较好的成绩,证实其系统的实用性与高效性。  相似文献   

7.
网络招聘文本技能信息自动抽取研究   总被引:1,自引:1,他引:0  
[目的/意义]针对目前网络招聘文本手工抽取技能信息无法满足大数据量分析要求的问题,提出一种针对大量网络招聘文本的技能信息自动抽取方法。[方法/过程]根据网络招聘文本的特点,利用依存句法分析选取候选技能,然后提出领域相关性指标衡量候选技能,将其融入传统的术语抽取方法之中,形成一种网络招聘文本技能信息自动抽取方法。[结果/结论]实验表明,本文提出的方法能够从网络招聘文本中自动、快速、准确地抽取技能信息。  相似文献   

8.
信息抽取的目标是自动从文本信息中抽取出预先想要得到的信息(知识),它提供了一条从浩瀚信息堆积中抽取出与用户相关信息的一条思路。本文分析了信息抽取的主要概念、信息抽取的现状及类型,提出了在数字图书馆的建设中,信息抽取技术在数字内容的自动标引、数据获取、数据挖掘、情报研究分析、参考咨询等方面发挥重要的作用。  相似文献   

9.
复杂网络为我们研究复杂性问题提供了一个新的视角和方法,激起了对于不同的实际网络特性的研究热潮。同时,信息抽取作为一门逐渐成熟的技术,在信息处理自动化中具有基础性的地位。将信息抽取和复杂网络研究相融合,通过信息抽取技术,可以抽取到节点信息、边的信息,为复杂网络的构建提供基本的数据准备,大大扩展了复杂网络的应用。文章首先介绍了信息抽取的基本概念和类型等,随后对复杂网络构建中主要的信息抽取技术作了简单的描述和分析。  相似文献   

10.
信息抽取的目标是自动从文本信息中抽取出预先想要得到的信息(知识),它提供了一条从浩瀚信息堆积中抽取出与用户相关信息的一条思路.本文分析了信息抽取的主要概念、信息抽取的现状及类型,提出了在数字图书馆的建设中,信息抽取技术在数字内容的自动标引、数据获取、数据挖掘、情报研究分析、参考咨询等方面发挥重要的作用.  相似文献   

11.
信息抽取技术在情报监测中的应用   总被引:3,自引:0,他引:3  
刘剑兰  朱东华 《情报学报》2004,23(6):661-666
信息抽取 (InformationExtraction)是一门应用性的语言处理技术 ,近年来正受到越来越多的重视。我们选取了国防情报工作这个特殊的领域 ,应用信息抽取技术进行探索性的研究。我们的方法是针对国防情报 ,应用世界最通用的语言—英文 ,设计了一个信息抽取系统 ,对各国国防经费信息进行动态的监测。该方法可望提高信息获取的效率 ,也将会扩展到更多的领域  相似文献   

12.
数字图书馆读者检索兴趣的智能分析算法   总被引:1,自引:0,他引:1  
王元 《图书情报工作》2010,54(21):109-121
针对数字图书馆信息检索服务的智能化发展趋势,提出智能化信息检索服务中对读者检索兴趣进行智能分析的模糊匹配算法,主要思路是在系统中构建用户兴趣矩阵,在用户操作过程中动态构建用户行为矩阵,通过两者的模糊运算,获得用户的兴趣从属度,检索系统根据该从属度对检索结果进行动态优化并及时向用户推送,从而提升检索系统的智能化程度。
  相似文献   

13.
基于领域本体的信息抽取模式生成与系统实现   总被引:1,自引:0,他引:1  
马静  吴一占  刘思峰 《情报学报》2008,27(2):193-198
面对情报工作者日益增长的从Internet中及时获取特定信息或知识的需求,本文展开了web信息抽取技术在情报领域的应用研究.目前,信息抽取模式的自动获取成为一个技术难点,本文尝试引入基于领域本体的半自动抽取模式获取算法,该方法在领域本体的概念层次关系、属性特征和实例的结构本体指导下,选择其主要特征属性为匹配目标,自动学习并获取抽取模式.利用该算法到直升机产品信息抽取,运行结果验证:该算法简单有效,获得了较高的抽取效率和较准确的抽取结果.  相似文献   

14.
从情报检索语言到本体-信息组织的新变革   总被引:6,自引:2,他引:4  
从信息组织的角度,考察本体的实质与特征、本体与情报检索语言的关系,认为本体及其方法和技术为信息组织,特别是网络信息组织带来的新变革主要表现在直接体现语义的网络信息组织,分布式共享,多维、网状的信息组织方式及对推理的支持。  相似文献   

15.
多语言信息检索系统可视化初探   总被引:1,自引:0,他引:1  
多语言检索的研究在信息种类越来越多的现在十分重要,除检索技术与翻译功能的研究外,信息可视化的运用以及界面设计是另一个研究要点.依据以前的研究和文章综述,信息可视化被证明是帮助用户实施多语言信息检索的有效方法.研究提出一个多语言信息检索系统可视化模型及其设计方案,并指出该领域未来的发展方向.  相似文献   

16.
基于全信息认知的信息检索模型整合   总被引:3,自引:0,他引:3  
从全信息认知角度对检索模型中的各要素进行阐释:首先阐释语法层次的系统要素;其次阐释提高检索效率的关键——中介要素;最后阐释信息检索发展动力——用户要素。在此基础上,从三个方面论述模型的整合过程:一是基于用户要素的认知模型的整合;二是基于检索人要素的系统模型的整合;三是基于设计人(系统)要素的宏观的过程整合。  相似文献   

17.
基于Web挖掘技术的信息检索系统设计与实现   总被引:2,自引:0,他引:2  
王艳  张帆 《情报学报》2007,26(3):339-343
本文详细介绍一个基于Web文本挖掘技术的信息检索系统的设计与实现。基于Web文本挖掘技术的信息检索技术融合了文本挖掘的思想,它将单一的资源发现或者单一的信息提取的传统的信息检索方法结合起来,从而达到在WWW发现资源并将其中的信息提取出来进行处理的目的。  相似文献   

18.
知识信息谱的分析与提取   总被引:3,自引:1,他引:2  
Zipf定理揭示了一篇文献中词出现的频率规律,Luhn在Zipf定律的基础上提出了自动抽取有效词的基本思想。基于Luhn思想的传统信息检索长期停留在文献层次上,难以满足人们通过知识元获取知识的需求。为解决这一问题,本文从概念的内涵和外延的认识论出发,考察人们由模拟事物内涵和模拟事物外延提出的图灵机和Petri网构建两种不同的计算机系统。由此提出了知识信息谱分析概念,试图建立具有语义关系的知识元理论框架,实现一种计算机对知识的理解和处理方法。文中给出了最大熵法提取知识元的方法。试验证明这种方法实用、有效。  相似文献   

19.
自然语言处理与信息检索   总被引:23,自引:1,他引:22  
黄敏 《图书情报工作》2001,45(4):41-44,65
探讨自然语言处理与信息检索之间的关系、它们的结合方式和自然语言检索的有关问题。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号