首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 31 毫秒
1.
神经网络技术在汉语歧义切分中的应用   总被引:4,自引:1,他引:3  
针对目前汉语自动分词系统中切分歧义的难点,本文提出利用神经网络模式识别的方法帮助消歧。介绍了所建立的实验系统,并进行了实验分析。  相似文献   

2.
交集型歧义字段切分方法研究   总被引:19,自引:0,他引:19  
闫引堂  周晓强 《情报学报》2000,19(6):637-643
本文通过动态建立独立成词能力频次库的方法以及基于词语/词性搭配的规则库,对交集型歧义字段进行处理,大大提高了切分正确率。在4万语料的开放测试中,交集型歧义字段的切分正确率可达98%以上。  相似文献   

3.
针对信息检索中存在的词语排除关系问题,给出排除词的定义并说明排除词在信息检索中的作用。指出排除词实质上是最大准交集型歧义切分字段的伪歧义切分所导致的,描述排除词的识别方法,并给出识别的结果,并在实际的信息检索平台上对排除词词库进行应用测评。  相似文献   

4.
中文科技文献计算机自动标引系统的研究   总被引:2,自引:0,他引:2  
本文针对目前国内外各种计算机自动标引的理论和方法在知识表达方式、词典结构、词的切分和组配、歧义处理等方面所存在的不足,提出了词典基于静态知识表达的网状结构,较好地解决了词典的完备性与存储空间的矛盾;同时使知识的表达更为简洁实用,为切分歧义难点的根本解决提供了方法论。  相似文献   

5.
汉语自动分词是中文信息处理的首要工作。衡量一个分词系统性能优劣指标主要有两个,一个是切分的速度,一个是切分的精度。本文提出的基于知识评价的汉语自动分词算法,可大大提高系统的切分速度,而且利用基于复杂特征集的规则、模式等可处理掉大部分切分歧义。最后,本文对消歧提出了一些设想。  相似文献   

6.
李娟  周贤善 《信息系统工程》2010,(2):133-134,142
在中文切分算法设计上,好的算法一般要注重两个方面,一个是提高切分精度,另一个是提高切分速度。本文在逆向最大匹配的算法切分基础上,结合临近匹配算法在中文切分速度方面的优势,提出了一种逆向匹配快速切分算法。此算法由于使用了索引排序查找,所以在速度上比一般的全库扫描更快;在切分精度上,根据汉语语句中心语偏后的特点,采用了逆序匹配,可以更进一步提高切分精度。并通过在综合语料库中的语料上的分析,交集型歧义的自动消解上有着很好的优势。  相似文献   

7.
歧义字段的处理是汉语自动分词系统中重要而困难的问题之一.歧义处理正确率的高低直接影响着分词的质量.为了解决汉语自动分词系统中的歧义问题,本文基于<知网>的义原关系,在分析了影响词语语义相关度的主要因素后,引入相关度计算,利用<知网>中义原之间的纵向和横向关系及实例因素计算出不同词性的相关度,根据相似度的对称性计算实例的影响因素,由此来提高语义相关度的准确率,同时针对所提出的方法给出了实例验证.实验结果表明,该方法计算得到的语义相关度结果更加合理,为消除汉语自动分词中的歧义问题提供了良好的支撑依据,也使得汉语自动分词系统处理歧义字段更有效.  相似文献   

8.
基于双向最大匹配和HMM的分词消歧模型*   总被引:1,自引:0,他引:1  
提出一种消减分词切分歧义的模型。利用正向和逆向最大匹配方法对中文文本信息进行分词,基于隐马尔科夫模型对两次最大匹配的分词结果进行对比消歧,得到较为精确的结果。整个过程分为歧义发现、歧义抽取、歧义消除3个过程。测试结果显示,该模型能有效地降低分词歧义引起的错误切分率。  相似文献   

9.
三字歧义链自动分词方法   总被引:3,自引:0,他引:3  
歧义问题是自动分词系统中要解决的主要问题之一。本文介绍一种在最大匹配法基础上,根据大量的真实语料中出现的歧义现象,把可能产生歧义切分的词进行特性分类,对每类确定一组规则进行处理  相似文献   

10.
[目的/意义] 实用的大规模地名本体数据库系统在自然语言处理、信息检索和情报分析领域具有重要的应用价值。本研究的目的是在减少人工干预的情况下,实现对地名简称、俗名以及随时间变化的复杂地名文本的自动识别与处理。[方法/过程] 以多种方法获取大规模名址数据为根基,简化地名元素间复杂关系,在开发名址元素切分、属性与关系分析及推理工具包的基础上,利用Neo4j图数据库工具开发实用地名本体数据库系统。[结果/结论] 基于所介绍的技术与方法而构建的系统具有良好的容错性和持续的数据更新能力,其地名分析、地名元素间关系推理达到了期望的精度,并在面向诸如新闻主题追踪、金融征信中的地名匹配等多种自然语言处理任务中取得良好效果。  相似文献   

11.
汉语自动分词与内容分析法研究   总被引:9,自引:0,他引:9  
汉语自动分词是计算机中文信息处理中的难题,也是文献内容分析中必须解决的关键问题之一。本文通过对已有自动分词方法及其应用研究的分析,指出了今后汉语自动分词研究的三个发展方向:克服汉语文本切分中的困难,继续研究传统文本切分的有效方法;将人工智能技术与汉语自动分词技术有机结合起来;改造汉语文本书写规则使之利于计算机切分。并分析了汉语自动分词和内容分析法之间的密切关系,以及汉语自动分词对内容分析法的影响  相似文献   

12.
影视二次文献信息检索和管理系统的设计与实现   总被引:1,自引:0,他引:1  
本文论述一个已投入实际使用的影视节目信息检索和管理系统的设计与实现。研究基于FOXPRO上实现SQL信息检索的优化方法,系统实现中解决了单汉字模糊检索、保留先检词、长字段切分显示、检索结果可筛可选等技术问题。  相似文献   

13.
本文从利用的视角,简要叙述了指纹图像的计算机采集和存档及指纹档案计算机模式识别系统的处理方法,同时对该系统在档案工作中的应用作了介绍。  相似文献   

14.
曹永敏 《大观周刊》2011,(20):94-94
该文主要介绍了模式识别在森林资源的应用,采用模式识别对森林资源进行监测和分类。通过本文的研究,初步探索了模式识别在林地分类系统中的应用途径和方法.  相似文献   

15.
通过介绍计算机编目中有关丛书名检索的功能字段,分析225丛编题名字段与410字段—丛编和461字段—总集这连接字段的关系,谈谈如何对410字段和461字段著录进行规范统一。  相似文献   

16.
公司     
清华智能图文信息处理研究室首次对外9月7日,清华智能图文信息处理研究室首次对外开放,本次开放清华智能图文信息处理研究室共展示了图像处理,模式识别,自然语言处理,人工神经网络,计算机智能处理,信号与信息处理等几个方面的科研成果。如今由该实验室研究出的文字识别系统已经能够识别汉字、英文、藏文、维吾尔文、阿拉伯文等几种文字。丁教授表示:“只要人类能够看清楚的,我们就探索出让计算机来识别的理论、方法及系统。”联想存储,服务器巡展9月7日,联想万全服务器及存储产品全国24城巡展的重要一站在北京召开,这也意味着主题为“奥运品…  相似文献   

17.
车牌识别技术作为现在交通的一项重要应用方向应用非常广泛。目前,尽管已经出现一部分车牌识别系统相关产品,但是对识别的算法研究发展一直在深入,而且有进一步地研究改进。本文对已有的车牌识别技术进行了深入的研究,在研究的基础上结合遗传算法和BP神经网络方法,提出了基于遗传算法的BP神经网络的车牌识别方法,并在MATLAB平台实现了识别。其中包括车牌定位、字符切分及车牌识别三个模块。检验结果表明,本文设计的车牌识别方法是可行的而且更有效地进行车牌识别,提高了收敛精度和识别率度,从而验证了该方法的有效性,为今后的产品化奠定了很好的算法基础。  相似文献   

18.
通过介绍计算机编目中有关题名的具有检索意义的功能字段。提出如何尽可能多地设置机读目录中的题名检索点,提高编目质量。便于读者检索;并对200字段第二指示符的选择在题名检索中的意义进行了探讨.  相似文献   

19.
关于中文图书著录中版本项的思考   总被引:1,自引:0,他引:1  
文章就中文图书著录中版本项的有关问题作了粗浅的研究,并根据实例对版本的定义及版本项的内容,版本项的著录信息源,版本项在CNMARC格式中的字段及其与该字段有关的各字段,版本项与其他有关字段的区别等进行了探讨。  相似文献   

20.
杂合VPRS与PNN的知识发现方法   总被引:3,自引:0,他引:3  
菅利荣  刘思峰 《情报学报》2005,24(4):426-432
本文提出一种变精度粗糙集(Variableprecisionroughsets,VPRS)与概率神经网络(ProbabilisticNeuralNetwork,PNN)杂合的方法。变精度粗糙集对噪声数据有一定的相容性,给定置信阈值β,通过变精度粗糙集模型将信息系统中的冗余属性排除,求出一个最小的知识表示,由此可以约简神经网络的输入。由于概率神经网络的分类及泛化能力较强,接下来应用概率神经网络建立的模型进行分类、预测。实验表明,变精度粗糙集与概率神经网络杂合方法的分类及预测精度均较高。该方法可用于从模糊的、冗余的、不完备的且有噪声的大型数据库中发现知识。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号