首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 203 毫秒
1.
对近年出版的中文科技期刊中蒙古、维吾尔、藏族等少数民族作者人名英译的情况作了调查,发现存在不少问题:少数民族人名按民族语读音拼写;中文人名中加间隔点的其英文人名中也加间隔点;只有名没有姓的也按姓和名分开拼写来表达等,提出了正确译写少数民族人名的建议.  相似文献   

2.
汉语框架网络知识本体构建研究   总被引:2,自引:0,他引:2       下载免费PDF全文
汉语框架网络知识本体是以框架语义学为理论基础,有丰富的语料库支撑,揭示了概念的本体关系。其获取,是在构建语料库的基础上,利用叙词表、分类表和其他知识分类体系等现有的知识本体,识别领域内外相关的概念并抽取相应属性,建立概念之间的关系,并利用所识别的概念和关系创建新的本体,融合已有的本体和新建本体。图2。参考文献4。  相似文献   

3.
本文在理论分析CRFs优于HMM和MEM等序列标注模型的基础上,提出一种基于CRFs的字角色标注人名识别模型.重点阐述了该模型的构建过程,包括角色定义、特征模板建立、特征函数生成及其参数训练、角色标注和基于模式的人名抽取等步骤,并通过实验验证模型的识别效果,探讨包括特征组合、字长窗口等在内的各种影响因素,探索模型的最佳识别条件,同时对CRFs和HMM在人名识别实验中进行了比较分析,认为CRFs在付出更大的实验复杂度的代价下,其人名识别效果明显优于HMM.论文最后通过实例探讨了CRFs-RL-PnR模型在网络舆情分析,包括新闻人物自动抽取、焦点人物时序分析等中的实践应用.  相似文献   

4.
范涛  王昊  陈玥彤 《情报学报》2022,(4):412-423
地方志作为中华文化的组成部分,是建设文化强国的重要一环,对其进行挖掘研究具有重要意义;同时,有效识别实体对地方志知识组织和知识图谱构建有着重要影响。当前地方志命名实体识别研究主要基于文本,缺乏文本对应的图片,而图片中的内容能够为识别文本中的实体提供额外的信息,从而提升模型识别实体的性能,并且实体识别还面临着已标注语料匮乏的问题。基于此,本文提出了利用深度迁移学习方法,结合地方志中的文本和图片进行多模态命名实体识别。首先,基于人民日报语料库和中文推特多模态数据集,分别预训练结合了自注意力机制的BiLSTM-attention-CRF模型和自适应联合注意力模型,利用基于神经网络的深度迁移学习方法将权重迁移至地方志多模态命名识别模型中,使模型获得提取文本和图片语义特征的能力;然后,结合过滤门对多模态融合特征去噪;最后,将融合后的多模态特征输入CRF (conditional random fields)层进行解码。本文将提出的模型在地方志多模态数据中进行了实证研究,并同相关基线模型作对比,实验结果表明,本文所提出的模型具有一定优势。  相似文献   

5.
图书馆目录数据关联的语义化的关键要素是标识、关系和规则。文章从MADS/RDF(RDF元数据规范描述框架)角度,简要介绍了控制命名(如人名、公司名、地理名等)、主题词系统等知识组织系统(KOS),对MADS/RDF类之间的关系进行分析,用DCMI RDF三元组图表示概念或资源间的关系,并进一步举例展示规范标识资源的"推断"规则的应用,最后对图书馆目录数据关联的语义化的前景进行展望。  相似文献   

6.
外国人名中各部分(如名与姓和复合名的名与名之间)的分界在翻译成中文时应使用间隔号(即“中圆点”)标示。国家技术监督局1995年12月13日颁布、1996年6月1日开始实施的《标点符号用法》(GT/T15834—1995)中的有关规定如下:4.14间隔号4.14.1外国人名和某些少数民族人名内各部分的分界,用间隔号标示。例如:  相似文献   

7.
陈梅松 《青年记者》2016,(35):75-76
以QQ名(即QQ昵称)为代表的网名是网络活动中网民身份的象征,是网民凸显某一特定身份特征从而达到特定语用目的的方法和手段.QQ名打破了“姓+名”的传统人名模式,较少负载个人真实信息,很难看出QQ使用者的年龄、性别等,而且可以随时更改,具有一定的隐蔽性,给研究带来了一定的难度.由于QQ名并非由长辈等他人所给,又充分体现了QQ用户的主观选择,所以研究QQ名能够促进对话语生产和理解的认识.本文以QQ用户名为研究对象(包括“昵称”和“群名片”),通过腾讯QQ软件和以“QQ名”为关键词进行百度搜索收集语料,分析QQ用户命名的身份选择与建构,及其表现出来的语用特征和语用效应.  相似文献   

8.
互联网已经成为企业和组织获取竞争对手情报的主要来源之一.建立基于Web的竞争对手情报自动获取系统已成为企业的迫切需求.在竞争对手情报自动获取系统中,商业机构名的识别是基础,它为竞争对手的标识和进一步情报抽取提供了依据.本文提出了一种基于互联网的商业机构名识别新方法.该方法考虑了商业机构名与其上下文之间的语义关联性,通过语义标注和隐马尔可夫模型相结合的方法进行商业机构名识别.我们以互联网上的真实中文网页为数据集对提出的识别算法进行了性能评估,并从召回率、准确率和F指标三个方面与CHMM(基于层叠隐马尔可夫模型的机构名识别算法)、MEM(基于最大熵模型的机构名识别算法)以及SVM(基于支持向量机的机构名识别算法)进行了对比.实验结果表明,本文提出的算法改善了商业机构名识别效果,并且具有很好的普适性.  相似文献   

9.
基于支持向量机的产品属性识别研究   总被引:1,自引:0,他引:1  
本文提出了一种结合自然语言处理技术与支持向量机模型,从客户评论中识别产品属性的方法.为了检验该方法的有效性,从收集的22 157条有关餐厅的评论语句中随机选取3701条,对其进行手工标注.针对手工标注语料库,利用支持向量机方法进行了产品属性识别训练和测试,并在准确率、召回率、F1值方面进行了评估.在测试结果中,平均准确率为95.6%,平均召回率为81.9%,平均F1值为87.3%.实验结果表明,该方法在平均准确率、平均召回率和平均F1值方面均高于最大熵模型方法,在句子层次上具有较好的属性识别效果.  相似文献   

10.
古代人有名、字、号的区别.现代人除名字以外(现代人的名和名字指同一称谓),很少有人再起字、号,而古代多数人,尤其是做官的和知识分子,既有“名”又有“字”,有些人名、字之后还有“号”.在名、字、号的命名和使用上也有区别.现笔者逐一进行介绍.  相似文献   

11.
[目的/意义] 在数字人文研究这一大趋势下,基于先秦古汉语语料库和条件随机场模型,构建古汉语地名自动识别模型。[方法/过程] 对《春秋左氏传》中的地名的内部和外部特征进行统计分析,构建模型的特征模板。在规模为187, 901个词汇的训练和测试语料上,对比条件随机场模型和最大熵模型的地名识别效果,把调和平均数为90.94%的条件随机场训练模型确定为最佳,作为本文所要构建的模型,并在《国语》语料上进行验证。[结果/结论] 在古汉语地名自动识别中,条件随机场模型优于最大熵模型,基于人工标注过的语料构建条件随机场自动识别模型能取得较好的识别效果。  相似文献   

12.
中文期刊刊名研究   总被引:5,自引:3,他引:2  
邱文  赵世华 《编辑学报》1998,10(2):67-72
刊名表达、象征、隐喻期刊的内在特征和外表特征。它的主要功能是提供一种识别手段和检索依据。据统计,1015种期刊的更名率为37.6%;10331种期刊的重名率为3.6%:以专业(或学称)、地域词语起首的偏正结构刊名占73.5%;刊名平均长度为5.8个字。在研究了解期刊命名、重名、更名以及刊名特征、刊名概念结构、刊名词语单元和刊名长度后,提出了编制“全国报刊宏观调控工具”的建议。  相似文献   

13.
Geographical research often involves searching for place names in full-text resources, such as digitized books. Place names often have variants, resulting in many different names for a single geographical place, a problem that can lead to missed results in full-text searches for place names. The problem occurs because full-text search engines merely match words in the search box with words in online documents, leaving place–name variants unsearched. This paper describes how relevant resources can be missed due to this problem and describes the different sources of place–name variation. Finally, the paper describes some solutions to the place–name variation problem in full-text searching.  相似文献   

14.
方志物产挖掘及系统构建   总被引:1,自引:0,他引:1  
本文首先根据方志文献的行文特征,设计一个统一规范的方志文献文档处理格式,用于文本文档的预处理.本文建立方志全文数据库,并基于数据库构建一个物产挖掘系统,进行物产信息挖掘,方法如下:通过抽取数据库正名字段内容识别物产正名,通过模式识别方法识别物产异名别称.最后建立包含物产正名和异名别称的物产标引词典,对全部物产文献进行标引,从而挖掘出物产名称.经测试,异名别称的识准率为71.6%,识全率为88.6%,表明系统是可行的.  相似文献   

15.
以地方志资料汇编《方志物产》(广东分卷)为语料,利用命名实体识别技术实现物产地名的自动识别。通过对物产地名、识别规则的文献计量学研究,挖掘物产分布、物产引进和传播等知识内容,为方志类古籍的数字化整理提供新途径。  相似文献   

16.
方志类古籍地名识别及系统构建   总被引:4,自引:0,他引:4  
以地方志资料汇编<方志物产>(广东分卷)为语料,设计并构建了古籍地名识别系统.采用规则与统计相结合的命名实体识别方法,实现了物产地名的自动识别.分析了命名实体识别技术在中国方志类古籍整理中的应用前景,为方志类古籍进行数字化整理、挖掘物产分布、物产引进和传播等相关研究提供了新的途径.  相似文献   

17.
名称规范是规范工作的重要组成部分,文章从名称规范范围、标目选取原则、各种标目形式和著录方式进行了论述.并就建立名称规范存在的主要问题以及今后发展等方面进行了探讨.  相似文献   

18.
团体名称规范是规范工作的重要组成部分,文章从团体名称规范界定范围、标目结构、标目选取原则、各种标目形式和著录方式进行了论述。  相似文献   

19.
由于自然语言的复杂性,使得情感挖掘仍存在一些问题需要解决,如情感词的领域依赖性、隐式特征识别、同指特征处理和特征极性计算等。为解决这些问题,提出一种基于语义的情感挖掘方法,该方法以主题图为指导进行特征及情感词的识别和情感极性强度计算,充分利用特征之间及其特征与情感词之间的语义关系,可以在一定程度上提高意见挖掘的准确性。  相似文献   

20.
农业期刊农药名称使用情况分析   总被引:1,自引:0,他引:1  
农药名称是农业期刊中经常出现的专有名词,农药名称的多系统命名容易造成使用混淆.以<农药通用名称><农药通用名称及制剂名称命名原则和程序><农药产品标签通则>等为依据,归纳出农业期刊中农药名称常见的不规范形式,并分析农药名称使用不规范的原因,提出了应制订有关各种农药名称编辑规范,加大宣传、贯彻农药名称相关标准的力度,加强使用农药名称的相关部门配合与协调,加大农药标签的检查、监督力度的建议.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号