首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 187 毫秒
1.
基于CSSCI的图书馆、情报与档案管理一级学科文献计量评价研究;科学研究的信息化:e—science的产生和发展;面向应用的汉语句法分析辅助系统的设计与实现;美国的企业技术许可模式及其启示。  相似文献   

2.
本文基于大规模清华树库,从中统计了汉语词汇在句法结构中充当的句法成分,获取了汉语词汇的句法功能分布,并给出了汉语词汇句法功能分布复杂度的定义.在对汉语词汇按照汉语词汇句法功能分布复杂度的高低排序后,本文发现两者之间呈现洛特卡现象.本文的这一发现一方面揭示了汉语词汇在句法结构中的分布规律,对于汉语的研究具有重要的促进作用;另一方面对于中文信息处理中的词性标注、自动消歧和句法分析等研究具有重要的影响.  相似文献   

3.
简讯     
简讯计算机辅助汉语校对系统理论与技术研讨会在京召开7月20日至22日,北京工业大学计算机学院和中国出版工作者协会校对研究委员会在京联合举办了“计算机辅助汉语校对系统理论与技术”研讨会。针对计算机学院今年4月研制成功的计算机辅助汉语校对系统“工智校对通...  相似文献   

4.
基于100万字的973汉语树库,按照语法功能分布的理论,从汉语自动句法分析和语言知识库构建的角度,构建一个相对系统化和多层次的语法知识库。该语法知识库由汉语词语、短语实例、短语结构、句法规则等知识组成。汉语词语知识共统计51 390个汉语词汇的58种语法知识,短语实例知识共获取3 836个汉语短语实例的58种语法知识,短语结构知识共抽取26种短语结构的58种知识,句法规则共有900条记录知识组成。该语法知识库的构建不仅为汉语自动句法分析和语言学研究提供语法知识,而且为更大规模的语法知识库构建打下基础。  相似文献   

5.
计算机辅助汉语校对系统北工大计算机学院信息所人工智能研究室一、计算机辅助汉语校对系统能做什么目前,各行各业都在普及计算机的使用,其中使用量最大的则是文字处理、汉语文字处理中,录入、编辑和排版已有相当成熟的系统,唯独校对这一中间环节尚需人工完成。校对工...  相似文献   

6.
基于神经网络的汉语自动分词系统的设计与分析   总被引:15,自引:1,他引:14  
应用神经网络进行汉语自动分词研究是中文信息处理领域的重要课题。本文从分析神经网络的一个主要模型和算法入手,阐述了基于神经网络的汉语自动分词系统的设计方法,较详细地介绍了该系统的实验结果,并给出了必要的分析。  相似文献   

7.
汉语语言处理系统因巨大的技术困难而不可能代替人工作,对这类系统功能定位过高危害了汉语处理产业的发展。本文对于汉语处理的一个分支——汉语校对系统的功能定位进行了分析和探讨,指出期望机器减少人的校对工作量是不现实的,但在人工校对之外辅以机器校对确能提高文字质量。机器应以词语检查为主,系统的主要功能是与人的校时互补,并应充分发挥辅助作用。    相似文献   

8.
汉语自动分词是中文信息处理的首要工作。衡量一个分词系统性能优劣指标主要有两个,一个是切分的速度,一个是切分的精度。本文提出的基于知识评价的汉语自动分词算法,可大大提高系统的切分速度,而且利用基于复杂特征集的规则、模式等可处理掉大部分切分歧义。最后,本文对消歧提出了一些设想。  相似文献   

9.
针对改善句法分析整体性能的需求,从可视化编辑学习的规则和词典、树形显示和操作句法分析结果两方面入手,提出并构建一个中英文句法分析系统及验证平台。对平台的设计思想、具体实现和关键技术进行详细的介绍,指出存在的问题和改善的方法。  相似文献   

10.
知识抽取中的嵌套向量分词技术   总被引:1,自引:1,他引:1  
向量分词算法已经比较成熟,通过在知识抽取过程中实现向量分词算法,对向量切分中的关键技术进行归纳总结,同时发现一趟向量切分的不足,并针对这些不足,设计嵌套的向量分词技术。实验证明,在知识抽取过程中,采用嵌套的向量切分方法,不但切分准确率高、切分全面,而且能从根本上解决“词中有词”的问题,有利于后续的句法分析。  相似文献   

11.
面向专利领域的机器翻译近年来已成为机器翻译的重要应用领域之一。本文提出了一个汉英专利文本机器翻译融合系统,该系统以规则系统为主导搭建,并把规则翻译方法和基于短语的统计翻译系统相结合。在融合系统中,规则系统主要负责源语言的分析和转换阶段的处理,生成相应的源语言句法分析树与转换树,并确定目标语言的基本句法框架。统计翻译系统则在目标语生成阶段根据生成的目标语句法结构寻找合适的对译词形,并产生最终的候选译文。通过利用自动评测指标对融合系统进行测试,融合系统的结果均优于单个规则系统和统计系统的结果,表明了融合方法的有效性和可行性,可以改善系统的翻译性能,提高翻译质量。  相似文献   

12.
This paper studies the contribution of semantic and semantic–syntactic analysis to the effectiveness of solving applied text-processing tasks: question answering and extraction of definitions from scientific publications. Methods for solving these problems, which, in addition to morphological and syntactic structures, also use semantic structures of texts, are presented. We carried out the experimental evaluation of these methods and comparison of two approaches to syntactic and semantic analysis: separate and joint semantic–syntactic parsing.  相似文献   

13.
自然语言处理中语法分析研究   总被引:1,自引:0,他引:1  
语法分析是自然语言处理中的关键环节 ,本文就自然语言处理中应用到的上下文无关语法、转换语法、剖析、转换网络和扩充转换网络等语法分析方法进行了论述。  相似文献   

14.
赵华茗  钱力  余丽 《图书情报工作》2020,64(11):108-115
[目的/意义] 探索科研命名实体及其关系的识别与抽取,提升其在长句等复杂情况下的识别效果,为进一步的应用提供参考与借鉴。[方法/过程] 以依存句法特征分析为基础,提出一种科研命名实体关系抽取方法,过程包括:①使用Standford Tagger工具对目标文本进行词性标注;②基于标注结果,围绕核心谓词和SAO结构,将目标文本分割为结构规范的语义片段;③通过依存句法分析,找出与核心谓词语义相关的主语和宾语,构成(实体,关系,实体)三元组。[结果/结论] 与Ollie、Reverb等主流算法进行的对比测试表明,该方法可以有效提升科研命名实体识别的准确性。  相似文献   

15.
周雷  李颖  石崇德 《情报工程》2016,2(1):114-122
本文以语言学句法构词和语义构词研究为基础,结合术语学及认知语言学对于词汇部分的研究,根据科技词汇自身特点,对影响科技词汇构词因素进行研究,提出了影响科技词汇构词的四个过程:句法-语义过程、认知过程、翻译过程和审美过程.  相似文献   

16.
基于Nutch的专题网页资源采集服务系统的设计与实现   总被引:1,自引:0,他引:1  
在数字图书馆系统集成应用的框架下,提出基于Nutch的专题网页资源采集服务系统设计方案。该方案引入信息过滤模块、基于计算机通信领域专业词典的中文分词模块、GUI信息定制模块、词典和关键词管理模块等,保证采集和获取过程中资源的专题性和系统的可管理性以及易用性。重点对文本解析过滤、Plugin插件开发以及搜索结果的层次化自动聚类等相关技术进行深入研究。通过基于Webservice的服务接口,实现其在数字图书馆资源层的集成应用。  相似文献   

17.
针对信息检索角度的XML的结构化检索问题,利用基于倒排文件的方法,使用NEXI作为检索语言,在基于XML的数字图书馆检索实验系统WHU-XML上对其进行实现,并具体分析查询语言的解析方法以及所采用的结构化检索算法。  相似文献   

18.
This article presents FIDJI, a question-answering (QA) system for French. FIDJI combines syntactic information with traditional QA techniques such as named entity recognition and term weighting; it does not require any pre-processing other than classical search engine indexing. Among other uses of syntax, we experiment in this system the validation of answers through different documents, as well as specific techniques for answering different types of questions (e.g., yes/no or list questions). We present several experiments which show the benefits of syntactic analysis, as well as multi-document validation. Different types of questions and corpora are tested, and specificities are commented. Links with result aggregation are also discussed.  相似文献   

19.
[目的/意义]针对中文专利候选术语选取方法存在需要对不同的数据集分别制定不同的模式匹配规则、专利术语抽取准确性不高等问题,本文提出基于依存句法分析的中文专利术语选取方法,以提高中文专利术语抽取准确性。[方法/过程]主要包括依存句法分析、剪枝、生成依存子树等三个主要步骤。首先对中文专利进行依存句法分析,得到依存树,对依存树进行剪枝,去除不符合要求的依存关系,生成依存子树,从中选取连续词串作为候选术语,以抽取中文专利术语。[结果/结论]实验结果表明,与已有的中文专利候选术语选取方法相比,本文提出的基于依存句法分析的中文候选术语选取方法能够有效地提高中文专利术语抽取的准确性。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号