首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 687 毫秒
1.
《古代汉语词典》是供中等以上文化程度的读者学习古代汉语和阅读古籍使用的中型语文工具书。状中格是其重要的构词方式,通过分析统计《古代汉语词典》"L""M"字母下的双音节词,发现状中格构词状况比较复杂,这从侧面反映了汉语词汇的丰富性。  相似文献   

2.
王海棻先生的《记时词典》是中国第一部关于记时词语的专门词典,其所搜集的记时词语及其书证都很丰富,受到古代汉语和古代文史学界的重视和好评。但是在词条立项与释义、书证选择与引用上,尚存在一些不足。《庄子》是先秦时期重要的哲学著作和经典文献,在对当时词汇的运用和后世词汇的发展方面贡献和影响很大。《庄子》的记时词语对《记时词典》增补词条、改正释义、增加或提前书证等都有很好的补正作用。  相似文献   

3.
中文分词是地质大数据智能化知识挖掘难以回避的第一道基本工序。基于统计的分词方法受语料影响,跨领域适应性较差。基于词典的分词方法可以直接利用领域词典进行分词,但不能解决未登录词识别问题。在领域语料不足的情况下,为提高地质文本分词的准确率和未登录词识别率,提出一种基于统计的中文地质词语识别方法。该方法基于质串思想构建了地质基本词典库,用以改善统计分词方法在地质文本分词上的适应性。采用重复串查找方法得到地质词语候选集,并使用上下文邻接以及基于位置成词的概率词典,对地质词语候选集进行过滤,最终实现地质词语识别。实验结果表明,使用该方法对地质专业词语识别准确率达到81.6%,比通用统计分词方法提高了近60%。该方法能够识别地质文本中的未登录词,并保证地质分词的准确率,可以应用到地质文本分词工作中。  相似文献   

4.
中医古籍文本分词是中医古籍结构化表示及深度挖掘的基础性工作.有监督的中医古籍文本分词简易可行,但存在耗费大量人力物力、专业门槛高、主观性强、扩展性不好等问题.为此改进TextRank算法,提出ConnectRank算法,根据字符连通度实现中医古籍无监督分词.基于《伤寒杂病论》《黄帝内经》《难经》等700篇中医古籍文献语...  相似文献   

5.
“双赢”是近年来广泛使用、流行的一个新词,《现代汉语词典》(2002年增补本)收入了这个词,对该词的释义是:双方都能得益。《新华词典》(2001年修订版)、《新华新词语词典》(商务印书馆2003年版)也都收入了这个新词。这说明“双赢”一词已得到社会和语言专家的双向认可,稳稳地进入了汉语词汇的大家庭。但“双  相似文献   

6.
谢晖 《学语文》2012,(5):63-63
“工欲善其事,必先利其器”,《说文解字注》、《康熙字典》、《词诠》、《辞源》、《古汉语常用词词典》、《古汉语虚词通释》、《古籍通假字汇释》、《同源字典》等,都是我们学习和讲解文言文的良师益友。由于文言文使用的是古代汉语.  相似文献   

7.
查找古代汉语词汇,主要的词典有《古代汉语》、《辞源》和《辞海》等。《古代汉语》中华书局1962年至1964年出版。全书分文选、常用词和通论三部分,选收有代表性的各体文章,并适当地介绍有关词汇、语法知识和古代文化常识,是学习古汉语的入门书。只是其文选部分分量稍大,可以选择一部分阅读。《辞源》陆尔奎、方毅、付运在等编纂,有1939年正、续编合订本,商务印书馆出版。此书是我国近代印行最早,规模较大的一部新型词典。1915年出版正编,1931年出版续编,1939年出版合订本.1949年又出版过简编本。合订本全书“计单词万余,复词十…  相似文献   

8.
提出使用文本相似度算法与DBSCAN聚类算法相结合的方法对文本进行聚类,实现对文本的管理。首先对文本进行特征提取和分词操作,在分词过程中会产生大量的特征词汇,而有些特征词汇对文本特征的表达并无实际意义。因此,在文本特征提取过程中根据特征词汇对文本特征表达的贡献度进行取舍,以提高文本聚类的效率和准确性。利用TF IDF方法对特征词汇进行加权,并且对文本进行相似度计算,将相似度低于阈值的文本作为孤立点进行处理。利用DBSCAN算法对文本进行聚类,将相似的文本聚为一类。  相似文献   

9.
字、词释义的精确,例证的相符、无误,是一部词典编写的基本准则。陈复华先生主编的《古代汉语词典》有着不尽如人意之处。关于其释义、例证中的错讹、欠当等,笔者已撰写《陈复华主编〈古代汉语词典〉指瑕》一文进行了质疑。文章就新近发现的其释义、例证中的可供商榷之处,再次提出拙见,以期对《古代汉语词典》的修订有些许益处。  相似文献   

10.
本文首先比较双语词典译义与双解词典译义的异同。其次,抽样《牛津高阶英汉双解词典》第八版(以下简称《牛八》)相对于《牛津高阶英汉双解词典》第六版(以下简称《牛六》)新增词汇。将样本中新词分类。之后参照双语词典译义方法,阐释双解词典泽义方法。最后,统计样本,总结《牛八》新词中,不同类型词的主要译义方法。  相似文献   

11.
基于碎片分词的未登录词识别方法   总被引:1,自引:0,他引:1  
提出了一种新的基于碎片分词的未登录词识别方法。该方法首先对文本进行分词,然后对分词结果中的碎片进行全切分生成临时词典,并利用规则和频度信息给临时词典中的每个字串赋权值,最后利用贪心算法获得每个碎片的最长路径,从而提取碎片中的未登录词。实验证明该方法开放测试的准确率达到82.88%,召回率达到87.51%。  相似文献   

12.
香港中国语文学会统筹主编的《近现代汉语新词词源词典》是一部中型外来词词源词典,其收词对象主要为外来词。通过对《近现代汉语新词词源词典》所收的124条近代汉语晚期的外来词进行研究可以发现:从共时的角度看,近代汉语晚期的外来词以意译词为主,且多为科技词语;从历时的角度看,汉语中的外来词上古时期以音译词为主,中古时期以来则以意译词为主。它巩固了佛教外来词涌入后汉语合成词以偏正式为主体的局面,丰富了汉语的词汇。  相似文献   

13.
赵克勤先生在《古代汉语词汇学》一书中,对韩愈的《柳子厚墓志铭》、柳宗元的《答韦中立论师道书》、《段太尉逸事状》三篇文章里的140个复音词进行了分析和整理,认为其中的53个词基本上可以断定为唐代产生的新词。实际上,赵先生所说的53个新词中大约有31个在唐代以前已经产生。  相似文献   

14.
一个基于改进的反序分词词典的中文分词算法   总被引:1,自引:0,他引:1  
中分词是中信息处理最重要的预处理。章对传统的反序分词词典进行了改进,设计了反序词典词根HASH表,并给出了相应的分词算法,实验表明,改进是有效的。  相似文献   

15.
古代白话词汇研究与汉语词典的编纂有十分密切的关系,大型汉语词典的编纂应尽可轮反映古代白话词汇研究的最新成果。本文拟就此谈谈笔者在编纂《汉语大词典》中的一得之见,以就教于大家。白话词即方俗口语词。王力先生在《古代汉语》绪论出古代汉语有两个系统,“一个是以先秦口语为基础而形成的上古汉语书面语言以及后来历代作家仿古的作品中的语言。也就是通常所谓的文言;一个是唐宋以来以北方话为基础而形成的古白话。”①任何语言都有口语和书面语两种表达形式。先秦时,口语与书面语的表达形式较相近。然而,语言是经常在变的。随着…  相似文献   

16.
我国古代文献典籍浩如烟海,它们对汉语词汇的发展,有着不可估量的影响。我们现在使用着的许多成语,就是从先秦两汉典籍和历代的笔记杂著,以及诗词、戏曲、小说等许多作品里边来的。其中有相当一批习用的成语出自《论语》《孟子》这两部古籍。据初步统计,甘肃师大中文系编的《汉语成语词典》中,收录《论语》成语九十七条,《孟子》成语八十五条,在该词典所收五千五百条成语  相似文献   

17.
由北京大学著名教授费振刚先生和广西大学梧州分校教授仇仲谦先生编写的《汉赋词典》 ,于2 0 0 2年 1 2月由北京大学出版社出版发行。这对人们阅读、研究汉赋作品乃至其他古籍都将起到重要作用。我院副教授唐建老师为该书的编写作了大量辅助性的工作。作为一部断代体辞书 ,该词典收单字词条61 70余个 ,词目共 2 0 0 0 0余条。所收词目 ,以《史记》、《汉书》、《后汉书》、《昭明文选》中的汉赋词汇为主 ,亦择《艺文类聚》、《古文苑》、《西京杂记》、《初学记》、《太平御览》、《北堂书钞》等所载以及散见他处汉赋之词汇。全书 1 1 7万多…  相似文献   

18.
今年暑假,华中师范大学唐超群同志寄来他主编的《新词新义辞典》,虽然这已不是我国第一部新词词典,但翻阅之后,仍觉兴趣盎然,不禁提笔作点评介。无论作为词典的使用者、编纂者还是研究者,我都十分重视新词词典,一般的语言词典,由于强调规范,对社会上出现的新词新义不能及时反映,以致读者遍查无着,语言研究者不易获得新颖语料.所以,早在六、七十年代我就不断呼吁研究新词语,编纂新词词典。1980年我在《论词典的类型》一文中(《辞书研究》1980.1)把新  相似文献   

19.
《汉书·艺文志》是我国古代第一部史志目录,也是现存最完整的目录,对于研究古籍著述、古代学术思想等方面具有重要的价值。《汉书·艺文志》中著述的《诗》类书目在后世大部分都已亡佚,《汉书·艺文志》后的六大主要史志目录对其记载也极少,保存至今且为人熟知的仅《韩诗外传》《毛诗》和《毛诗训故传》而已。本文旨在详细考察《汉书·艺文志》所录《诗》类书目在历代史志目录中的存亡情况,并分析这些书目的散佚原因,以此明确《诗》之学术源流。  相似文献   

20.
张仁贤 《文教资料》2011,(36):262-266
王力先生主编的《古代汉语》,有附录《诗韵常用字表》。此表收字共四千七百多个。笔者逐字查阅《广韵》、《集韵》、《佩文韵府》和老《辞海》的反切,参考普通话,以定其沪语读书音和越语读书音(用国际音标标写)。普通话依据的是社科院语言研究所词典编辑室编的商务印书馆2007年出版的第5版《现代汉语词典》。查阅这本词典,竞发现错注的字音甚多,令人十分惊诧。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号