共查询到20条相似文献,搜索用时 31 毫秒
1.
基于既定词表的自适应汉语分词技术研究 总被引:3,自引:0,他引:3
提出一种汉语分词算法,在给定的分词词表的基础上进行汉语分词时,不但能成功切分出分词词表中已有的词,而且能同时自动识别出分词词表中没有的词,即未登录词。与逆向最长匹配法以及其他未登录词识别算法进行的测试比较表明,该分词算法可以有效地解决大多数未登录词的识别问题,并且能减少分词错误,同时对分词算法的效率基本没有影响。 相似文献
2.
相关反馈是近年来信息检索领域的研究热点,是自动查询扩展中的一种重要形式,相关反馈主要包括检索词加权和检索词选择。本文介绍了在相关反馈技术中经典的检索词排序算法,对它们带来的性能改进做了比较,并提出了相关反馈的实际应用中需要解决的一些问题。 相似文献
3.
4.
基于Apriori改进算法的局部反馈查询扩展 总被引:1,自引:0,他引:1
提出面向查询扩展的Apriori改进算法,采用三种剪枝策略,极大提高挖掘效率;针对现有查询扩展存在的缺陷,提出基于Apriori改进算法的局部反馈查询扩展算法,该算法用Apriori改进算法对前列初检文档进行词间关联规则挖掘,提取含有原查询词的词间关联规则,构造规则库,从库中提取扩展词,实现查询扩展。实验结果表明该算法能够提高信息检索性能,与现有算法比较,在相同查全率水平级下其平均查准率有了明显提高。 相似文献
5.
谢新暎 《福建广播电视大学学报》2006,(2)
颜色词是语言中用来描写事物各种色彩的词,是语言中词汇的重要组成部分。本文从汉语颜色词的特点、构成及语法性质、颜色词的古今演变、颜色词与社会文化等几个角度对汉语颜色词进行比较全面的剖析。 相似文献
6.
7.
8.
“窜”、“篡”、“纂”三个词,有的读音相同.有的字形相似,但词义都不相同。其混用情况比较多,常常闹出笑话来,因此,不得不辨。 相似文献
9.
知识抽取中的嵌套向量分词技术 总被引:1,自引:1,他引:1
向量分词算法已经比较成熟,通过在知识抽取过程中实现向量分词算法,对向量切分中的关键技术进行归纳总结,同时发现一趟向量切分的不足,并针对这些不足,设计嵌套的向量分词技术。实验证明,在知识抽取过程中,采用嵌套的向量切分方法,不但切分准确率高、切分全面,而且能从根本上解决“词中有词”的问题,有利于后续的句法分析。 相似文献
10.
秦东 《上海高校图书情报工作研究》2004,14(1):55-57
从缺省字段、禁用词、运算符、截词符和通配符等几个方面比较直接检索途径检索CBMdisc和MEDLINE on CD的不同。 相似文献
11.
HMM和CRFs在信息抽取应用中的比较研究 总被引:1,自引:0,他引:1
在比较HMM和CRFs数学理论的基础上,分别提出基于HMM词角色标注和基于CRFs字角色标注的人名实体抽取模型,并通过开放性测试和实践应用两次验证、比较两者的有效性,从而在实践中证明从理论比较中得出的结论:CRFs较之HMM更适合于解决序列标注或对象分类问题。 相似文献
12.
以文献标题中的英—中、中—英翻译为素材,对文献标题翻译概念信息传递中的单词术语与多词术语进行了比较和探讨。 相似文献
13.
14.
15.
英语潜在词指的是语言中符合音序规则的、像词一样的形式,例如blik。这个语音形式符合英语的音序规则,但它并不是一个现成的词。也就是说,这个词还没有造出来。一旦时机成熟,它就有可能获得意义,成为一个现存词。现代语言学家有一个共识:语言中存在着大量的潜在词。然而至今潜在词的研究还没有成为语言学界关注的焦点。本文将从音系学的角度对英语潜在词的研究做一个概述,从而打破英语潜在词还处于提及阶段的这样一个僵局。 相似文献
16.
17.
概念分面组配型自动分类系统 总被引:1,自引:1,他引:0
1选择自动分类模式的基本思路当前,迫切需要符合下列要求的一种自动分类模式:(1)能够较快付诸实用;(2)有较高的检索效率,特别是检准率;(3)为了保证较高的检索效率,可适当采用人工辅助抽词。从自动分类研究的进展情况看,要达到(1)(2)点要求而完全不用人工辅助抽词(准确地抽取文献主题的核心词),目前是不可能做到的。也就是说,(1)(2)(3)点都是必要的;(4)充分利用系统资源,提供更多检索功能。概念分面组配型自动分类模式比较符合以上要求。这种模式可简略表述如下:以文献题名作为主要抽词对象;适当… 相似文献
18.
我们每天都在看中央电视台的“新闻联播”节目,经常收听中央人民广播电台的“新闻和报纸要”节目,不少人也经常翻阅我国各地出版的众多经济类报纸、杂志。但是,有几个出现频率极高的词,像“宏观调控”,像“消费指数”等,又有多少人能准确说出它的含义呢?如果经济类节目和经济类的报纸、期刊中的内容让读看不懂,比较重要的词理解不了,就有些让人费解了:你到底是想孤芳自赏呢,还是要服从大众呢? 相似文献
19.
20.
医学关键词与叙词对照表自动构建研究 总被引:2,自引:0,他引:2
以中国生物医学文献数据库部分数据作为语料,通过实验比较几种测量词间相关性的方法在测量关键词与叙词相关性时的准确性,探讨自动构建关键词与叙词对照表的可行性和有效方法。 相似文献