首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 640 毫秒
1.
三字歧义链自动分词方法   总被引:3,自引:0,他引:3  
歧义问题是自动分词系统中要解决的主要问题之一。本文介绍一种在最大匹配法基础上,根据大量的真实语料中出现的歧义现象,把可能产生歧义切分的词进行特性分类,对每类确定一组规则进行处理  相似文献   

2.
国外跨语言信息检索中的翻译歧义性问题研究综述   总被引:2,自引:0,他引:2  
翻译歧义是影响跨语言信息检索效果的主要因素之一。本文论述了跨语言信息检索中翻译歧义性问题产生的原因,并且总结了目前消除这种歧义的方法和技术。  相似文献   

3.
自适应分词算法中的未登录词识别技术研究   总被引:2,自引:0,他引:2  
深入研究了未登录词识别技术,并提出了一种新的未登录词识别算法,包括其中的数量词识别规则、边界单字规则、虚字辅助规则、未登录词记忆识别规则以及左右方探测法选取未登录词规则等,使得算法在不依赖大型语料库的前提下可以有效地识别多种领域中各种类型的未登录词.同时,算法通过对绝大部分的交集歧义的识别有效地解决了识别未登录词时导致的新的切分歧义的问题.在网络时文的开放性测试中,分词算法的分词准确率约为90.1%,未登录词识别的准确率、召回率分别为91.2%和94.7%.  相似文献   

4.
基于双向最大匹配和HMM的分词消歧模型*   总被引:1,自引:0,他引:1  
提出一种消减分词切分歧义的模型。利用正向和逆向最大匹配方法对中文文本信息进行分词,基于隐马尔科夫模型对两次最大匹配的分词结果进行对比消歧,得到较为精确的结果。整个过程分为歧义发现、歧义抽取、歧义消除3个过程。测试结果显示,该模型能有效地降低分词歧义引起的错误切分率。  相似文献   

5.
随着计算机科学的发展,自然语言处理技术在计算机信息检索系统中的应用越来越广泛。对自然语言处理的研究已经成为信息处理系统中的一个重要课题。语词切分是汉语自然语言处理的第一个阶段。目前,计算机自动分词系统的精度尚不能满足实际需求。本文针对影响切分精度的根本因素——歧义现象,提出了采用神经网络模式识别来消除歧义的方法,以达到提高切分精度的目的。 文中对歧义字段进行了分类,分析了其表现形式和现有的消歧机制,以及歧义切分与模式识别之间的关系,研究了神经网络模式识别方法与歧义切分问题相适应的特点。遵循模式识别的一般步骤,对歧义字段进行特征提取,然后,选用神经网  相似文献   

6.
汉语自动分词是中文信息处理的首要工作。衡量一个分词系统性能优劣指标主要有两个,一个是切分的速度,一个是切分的精度。本文提出的基于知识评价的汉语自动分词算法,可大大提高系统的切分速度,而且利用基于复杂特征集的规则、模式等可处理掉大部分切分歧义。最后,本文对消歧提出了一些设想。  相似文献   

7.
神经网络技术在汉语歧义切分中的应用   总被引:4,自引:1,他引:3  
针对目前汉语自动分词系统中切分歧义的难点,本文提出利用神经网络模式识别的方法帮助消歧。介绍了所建立的实验系统,并进行了实验分析。  相似文献   

8.
交集型歧义字段切分方法研究   总被引:19,自引:0,他引:19  
闫引堂  周晓强 《情报学报》2000,19(6):637-643
本文通过动态建立独立成词能力频次库的方法以及基于词语/词性搭配的规则库,对交集型歧义字段进行处理,大大提高了切分正确率。在4万语料的开放测试中,交集型歧义字段的切分正确率可达98%以上。  相似文献   

9.
全文检索中的汉语自动分词及其歧义处理   总被引:3,自引:0,他引:3  
歧义处理是汉语自动分词的核心问题,汉语自动分词是中文信息检索的基础性课题。目前有基于词典的分词方法、基于统计的分词方法、基于语义的分词方法和基于人工智能的分词方法。自动分词的歧义处理,目前主要有:利用“长词优先”排歧,利用特征词消歧,利用“互信息”和“t-信息差”消歧,利用专家系统分词消歧。参考文献15。  相似文献   

10.
中文科技文献计算机自动标引系统的研究   总被引:2,自引:0,他引:2  
本文针对目前国内外各种计算机自动标引的理论和方法在知识表达方式、词典结构、词的切分和组配、歧义处理等方面所存在的不足,提出了词典基于静态知识表达的网状结构,较好地解决了词典的完备性与存储空间的矛盾;同时使知识的表达更为简洁实用,为切分歧义难点的根本解决提供了方法论。  相似文献   

11.
面向信息检索的词汇知识发现   总被引:1,自引:0,他引:1  
针对信息检索中词汇知识发现问题,提出面向信息检索的词汇知识发现框架结构,对面向信息检索的词汇的定义、同义词、相关词、排除词等词汇知识获取与挖掘进行详细的介绍,为后续的语义检索研究打下基础。  相似文献   

12.
王凤产 《编辑学报》2011,23(6):476-478
现代新技术的发展使开放存取成为一种比较理想的出版模式,成为国际和国内出版界关注的热点,但版权问题成为其发展过程中的难题之一。该文通过对科技期刊开放存取和版权保护既相互依存、相互促进,又相互对立的关系进行辩证分析,并提出了系列科技期刊开放存取版权管理措施,可为政府决策部门和立法机构提供参考,以使科技期刊开放存取事业在法制化的轨道上持续发展。  相似文献   

13.

This essay compares legal and mainstream news discourses surrounding the Webb/Dotson rape recanting case, focusing on reasons why the two discourses derived opposing conclusions about Dotson's guilt. It argues that the tendency of mainstream news media to highlight emotional and personal elements helped construct a picture of Dotson as innocent and affable, while the tendency of legal discourse to emphasize mutually exclusive categories contributed strongly to a picture of Dotson as guilty regardless of Webb's recanted story.  相似文献   

14.
《The Reference Librarian》2013,54(89-90):63-80
SUMMARY

While there is much discussion today about information literacy, proper implementation of it within university campuses is still a struggle, often due to the fact that librarians and teaching faculty have different “cultures” that create different priorities. Librarians focus more on process and faculty more on content, though the two are not mutually exclusive. Past attempts by librarians to collaborate with faculty to produce information literate students have had limited success. A bolder plan–to imbed information literacy credit courses within existing departments–shows promise to avoid cultural conflict while creating a proper climate for collaboration.  相似文献   

15.
从发展历史和研究深度,将数字图书馆可用性评价发展分为以系统为中心、以用户为中心和立足于图书情报学学科和实践三大流派。三个流派的关系逐级递进,同时又非相互排斥,并随着理论、方法和实践的发展而相互补充和完善。图书情报学学科和实践的数字图书馆可用性评价的研究特点包括:用户中心的理念、研究内容的扩展、与用户服务结合以及与信息行为模型的结合。立足于以上特点,提出该领域后续研究的方向,即数字图书馆各生命周期阶段可用性研究、基于多学科理论的数字图书馆可用性评价研究等。  相似文献   

16.
提出维吾尔语情感语料库的构建规范,设计和实现维吾尔语情感语料库辅助整理系统。该系统结合维吾尔语情感语料的具体特点,多方面分析维吾尔语情感词汇的特征,利用条件随机场(CRFs)模型进行维吾尔语情感词汇的自动识别。测试结果验证该系统能够大幅度降低人工劳动,高效快速地标注维吾尔语情感词语料。  相似文献   

17.
在简要介绍EAD、DC以及TEI这三种元数据的功能的基础上,通过实证分析三者对同一信息资源——《位元城市》一书的描述记录,比较研究三者的异同和相互关系,认为三种元数据都能够实现对资源的描述、管理、定位及评估,同时具有强烈的个性特征;三者之间不应是排他性质的,而应该是互补、彼此借鉴的。最后提出元数据的发展趋势。  相似文献   

18.
中国大陆地区专利地图技术研究   总被引:1,自引:0,他引:1  
针对中国大陆地区专利的特点,引入自然语言处理和基于内容的图像检索等技术,研究专利地图的分析和绘制方法。对于发明和实用新型专利,使用语义度量、新词识别等技术处理其用词,并将专利说明书和权利要求书结构化;定义了基于近义词组的文档特征表达,据此计算发明和实用新型专利的相似性并完成聚类。对于外观设计专利,借助基于内容的图像检索技术提取专利图像的颜色、纹理和形状特征,通过相关反馈确定权重,据此计算外观设计专利的相似性并完成专利聚类。以此为基础开发完成了专利地图软件,可实现对指定范围的中国大陆地区的专利地图的分析绘制,从而辅助设计师和企业进行决策分析和产品定位。  相似文献   

19.
当前,图书馆网站的标识系统普遍存在标识用词不统一、标识数量过多、概念模糊和逻辑层次不清晰等问题。作为图书馆与用户交流沟通的平台,基于信息构建理论的图书馆网站应该构建易于用户理解、用词简洁、逻辑层次清晰的标识系统,这也是图书馆网站改进和发展的主要方向。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号