首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 31 毫秒
1.
基于既定词表的自适应汉语分词技术研究   总被引:3,自引:0,他引:3  
提出一种汉语分词算法,在给定的分词词表的基础上进行汉语分词时,不但能成功切分出分词词表中已有的词,而且能同时自动识别出分词词表中没有的词,即未登录词。与逆向最长匹配法以及其他未登录词识别算法进行的测试比较表明,该分词算法可以有效地解决大多数未登录词的识别问题,并且能减少分词错误,同时对分词算法的效率基本没有影响。  相似文献   

2.
相关反馈是近年来信息检索领域的研究热点,是自动查询扩展中的一种重要形式,相关反馈主要包括检索词加权和检索词选择。本文介绍了在相关反馈技术中经典的检索词排序算法,对它们带来的性能改进做了比较,并提出了相关反馈的实际应用中需要解决的一些问题。  相似文献   

3.
高发学  张文 《青年记者》2007,(10):52-52
据《咬嚼字》统计资料显示,常用字词的差错占了报刊差错的60%以上,编辑、记在常用字词上下点工夫还是有必要的。现就将一些在报刊上出错频率比较高的字词作一辨析。[第一段]  相似文献   

4.
基于Apriori改进算法的局部反馈查询扩展   总被引:1,自引:0,他引:1  
提出面向查询扩展的Apriori改进算法,采用三种剪枝策略,极大提高挖掘效率;针对现有查询扩展存在的缺陷,提出基于Apriori改进算法的局部反馈查询扩展算法,该算法用Apriori改进算法对前列初检文档进行词间关联规则挖掘,提取含有原查询词的词间关联规则,构造规则库,从库中提取扩展词,实现查询扩展。实验结果表明该算法能够提高信息检索性能,与现有算法比较,在相同查全率水平级下其平均查准率有了明显提高。  相似文献   

5.
颜色词是语言中用来描写事物各种色彩的词,是语言中词汇的重要组成部分。本文从汉语颜色词的特点、构成及语法性质、颜色词的古今演变、颜色词与社会文化等几个角度对汉语颜色词进行比较全面的剖析。  相似文献   

6.
造句应讲究语序李兴昌汉语的显著特点之一是词语的次序比较固定。汉语缺少形态变化,表示词与词的关系,主要依靠词语的次序。次序不同,语法关系及语义便不相同。这里主要讨论科技写作中常见的语序失调问题,并介绍确定语序的一些原则。一、主语和谓语的次序科技文章中极...  相似文献   

7.
谈危机传播   总被引:1,自引:0,他引:1  
李念锋 《青年记者》2006,(16):42-43
危机传播一词,大家还比较陌生,但它具有正负两面性,处理不好能使政府失信于民、企业破产、个人名誉扫地。新闻工作不掌握危机传播的一般常识无法胜任本职工作。  相似文献   

8.
晓言 《中国广播》2004,(7):21-21
“窜”、“篡”、“纂”三个词,有的读音相同.有的字形相似,但词义都不相同。其混用情况比较多,常常闹出笑话来,因此,不得不辨。  相似文献   

9.
知识抽取中的嵌套向量分词技术   总被引:1,自引:1,他引:1  
向量分词算法已经比较成熟,通过在知识抽取过程中实现向量分词算法,对向量切分中的关键技术进行归纳总结,同时发现一趟向量切分的不足,并针对这些不足,设计嵌套的向量分词技术。实验证明,在知识抽取过程中,采用嵌套的向量切分方法,不但切分准确率高、切分全面,而且能从根本上解决“词中有词”的问题,有利于后续的句法分析。  相似文献   

10.
从缺省字段、禁用词、运算符、截词符和通配符等几个方面比较直接检索途径检索CBMdisc和MEDLINE on CD的不同。  相似文献   

11.
HMM和CRFs在信息抽取应用中的比较研究   总被引:1,自引:0,他引:1  
在比较HMM和CRFs数学理论的基础上,分别提出基于HMM词角色标注和基于CRFs字角色标注的人名实体抽取模型,并通过开放性测试和实践应用两次验证、比较两者的有效性,从而在实践中证明从理论比较中得出的结论:CRFs较之HMM更适合于解决序列标注或对象分类问题。  相似文献   

12.
以文献标题中的英—中、中—英翻译为素材,对文献标题翻译概念信息传递中的单词术语与多词术语进行了比较和探讨。  相似文献   

13.
吴克岐除辑著有红学三丛书外,还编著有《词女词抄》、《词女五录》、《清代词女征略》、《雪梅居词样》、《犬窝五代词矩》、《犬窝北宋词矩》、《东坡乐府笺》、《词调异名录》等词学著作,均稿本,其中最有利用价值的当是对明至民国时女词人有关资料的较为系统的整理与研究,以资料性强为特色,为今人研究女词人,尤其是明以来女词人提供了方便,其文献价值是显著的。  相似文献   

14.
在清代州县词讼审理中,批词作为一种法律文书被广泛运用。批词风格表现出灵活、自由的特征。批词内容上字数长短不一,用语风格上比较随意自由,乡俚俗语夹杂,同时批词结构也不固定。批词风格具有的灵活、自由特征是同州县官或幕府师爷的个人因素密切相关,学识出身、人生阅历等个体性因素都直接影响到批词风格的形成,因此批词的不同风格正是清代州县词讼审断差异性特征的表现。  相似文献   

15.
马丽娜 《大观周刊》2011,(21):57-57
英语潜在词指的是语言中符合音序规则的、像词一样的形式,例如blik。这个语音形式符合英语的音序规则,但它并不是一个现成的词。也就是说,这个词还没有造出来。一旦时机成熟,它就有可能获得意义,成为一个现存词。现代语言学家有一个共识:语言中存在着大量的潜在词。然而至今潜在词的研究还没有成为语言学界关注的焦点。本文将从音系学的角度对英语潜在词的研究做一个概述,从而打破英语潜在词还处于提及阶段的这样一个僵局。  相似文献   

16.
伴随着"躲猫猫"、"打酱油"、"俯卧撑"等众多锐词的大量出现,锐词成为网络新流行,受到社会的普遍关注与热议。而最近互动百科有搬出"网络十大网络锐词榜",更使网络锐词有了一层官方的肯定色彩。本文将从网络锐词的特征、形成原因与影响三个方面进行讨论,力求对网络锐词的流行现象作一个比较全面的分析和深入的了解。  相似文献   

17.
概念分面组配型自动分类系统   总被引:1,自引:1,他引:0  
1选择自动分类模式的基本思路当前,迫切需要符合下列要求的一种自动分类模式:(1)能够较快付诸实用;(2)有较高的检索效率,特别是检准率;(3)为了保证较高的检索效率,可适当采用人工辅助抽词。从自动分类研究的进展情况看,要达到(1)(2)点要求而完全不用人工辅助抽词(准确地抽取文献主题的核心词),目前是不可能做到的。也就是说,(1)(2)(3)点都是必要的;(4)充分利用系统资源,提供更多检索功能。概念分面组配型自动分类模式比较符合以上要求。这种模式可简略表述如下:以文献题名作为主要抽词对象;适当…  相似文献   

18.
牛国锋 《今传媒》2006,(2X):46-47
我们每天都在看中央电视台的“新闻联播”节目,经常收听中央人民广播电台的“新闻和报纸要”节目,不少人也经常翻阅我国各地出版的众多经济类报纸、杂志。但是,有几个出现频率极高的词,像“宏观调控”,像“消费指数”等,又有多少人能准确说出它的含义呢?如果经济类节目和经济类的报纸、期刊中的内容让读看不懂,比较重要的词理解不了,就有些让人费解了:你到底是想孤芳自赏呢,还是要服从大众呢?  相似文献   

19.
词是最小的、能够独立运用的语言单位。词与字不同,一个词可以是一个字,也可以不止一个字。例如“奶奶不看电视” 这句话共有六个字,但却只有“奶奶”、“不”、“看”、“电视”四个词。这是因为,“奶奶”之“奶”,一般不单独使用;而“电视”的同义决不等于“电”和“视”这两个字义的简单相加。在这时候,“奶”、“电”、“视”三个字都只是构词的备用单位,简称“语素”。 关于词的知识,掌握的重点是对词义的理解和词的分类。 理解词义是运用词语表情达意的前提。我们通常所说的词义,是指词的词汇意义,亦即与同的语音形式结合…  相似文献   

20.
医学关键词与叙词对照表自动构建研究   总被引:2,自引:0,他引:2  
以中国生物医学文献数据库部分数据作为语料,通过实验比较几种测量词间相关性的方法在测量关键词与叙词相关性时的准确性,探讨自动构建关键词与叙词对照表的可行性和有效方法。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号