首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 231 毫秒
1.
1.西方语言“标点”的词源西方语言“标点”一词源自中世纪晚期拉丁语punctuare,意为用“点”(punctum)标示或刺“孔”。法语ponctuation(标点)一词于16世纪上半期获得“给文字加标点”的意义。英语punctuation一词首见于1539年,起初指给希伯来文的辅音字母加“元音附点”,而给英文加标点在15—18世纪初则用pointing(也是源自拉丁语的punctum)来表示。罗伯特·蒙蒂思(Robert Monteith)于1704年出版的一部论述  相似文献   

2.
学术刊物英文标题常见问题探析   总被引:1,自引:0,他引:1  
本文拟就国内学术刊物中英文标题存在的几个常见问题进行探析。1 单词首字母的大小写英文标题主要有三种写法:全部大写;主要词首字母大写;全部小写(除少量必须大写的词———如人名、地名等———以外)。前者使用最方便,一般用于表示专栏名称;后两者一般用于具体论文标题,在英美等国以主要词首字母大写较为常见。下面例句中的画线单词值得商榷,黑体英文则为正确的表示法。1)SomeFactorsthatAffecttheFreeRadicalscavengingActivityofTeaExtracts2)Studiesofs…  相似文献   

3.
梳理19世纪中叶至1912年日本图书馆学在中国的译介,指出1888年傅云龙已使用“图书馆”,1910年“图书馆学”一词首现于《图书馆教育》一书。参考文献17。  相似文献   

4.
基于EMM中文抽词算法的XMARC主题信息挖掘   总被引:4,自引:0,他引:4  
王兰成 《情报学报》2005,24(1):82-86
本文在分词词典上采用区间最大词长,改进正向减字最大匹配法为“词首 长词匹配 短词推进”自动标引方法,从而有效地减少领域的分词歧义性和缩短标引时间。最后将该研究付诸于XMARC主题信息的挖掘与检索的实现,并证明其在时间和质量综合性能上的优越性。  相似文献   

5.
朱利 《档案管理》2003,(5):46-46
1不同姓氏的卡片排序先按人名专题卡片中人名姓氏音序排列卡片的顺序。具体是按照姓氏汉语拼音左边第一个字母在《汉语拼音方案·字母表》上的先后顺序排列,字母在前则姓氏也排在前。如果第一个字母相同,就比较第二个字母的前后顺序;第二个字母也相同就比较第三个字母,依次类推。如果人名汉语拼音字母拼写全同,则依据汉语拼音四声“阴平(-)、阳平(/)上升(v)、去声(、)”的顺序排列,直至姓氏排列完成。如“安(ān)”姓排在“毕(bì)”姓的前面,“诸(zhū)”姓排列在“竺(zhù)”姓前面。2同姓氏内人名的卡片排序即同一个姓氏内人名卡片的排序…  相似文献   

6.
SQ_3R读书法     
目前,国外流行一种“SQ_3R”读书法。所谓“SQ_3R”读书法,是英语Survey(浏览)、Question(发问)、Read(阅读)、Recite(复述)、vReiew(复习)这五个词词首的缩写。浏览,这是读书的第一步。当你拿到一本书后,首先应该概要地读一读该书的提要、前序、后跋、目录,看一看书中的插画、照片、图表,以及有关的注释,对全书有个大体的了解,在脑海中留下一个“接触印象”。  相似文献   

7.
大凡学过一些英文的朋友都知道,英文中有些单词仅仅由于第一个字母的大写和小写,就会造成词义、词性等方面的根本变化。众所周知,China这个词中的第一个字母为大写C,意思是“中国”。如果把第一字母改为小写的c,成为china,那意思就变成“瓷器”了。又如Japan这个词,第一字母为大写J,意思是“日本”。如果把第一  相似文献   

8.
郝欣 《编辑学报》2006,18(5):400-400
GB/T7714—2005《文后参考文献著录规则》指出:西文期刊刊名的缩写可参照ISO 4:《文献工作———期刊刊名缩写的国际规则》的规定。1)刊名缩写词后的“.”是否保留?ISO 4规定:“.”可以全部省略,缩写词之间留1个空格;也可以全部保留“.”,并在其后留1个空格。示例:Canadian Pharmacy Journal正确的:Can Pharm JCan.Pharm.J.GB/T7714—2005的所有示例都采用了全部省略“.”的著录方式。2)大写字母的用法ISO 4规定:缩写的第1个单元的第1个字母大写,其余单元的第1个字母大写或所有字母均小写;缩写也可全大写。示例:Archives of Inte…  相似文献   

9.
王珊琪 《东南传播》2022,(4):127-129
伴随着社交媒介使用率的大幅提升,源于“火星文”与饭圈用语的字母化网络语言频频“出圈”,进入了大众日常视野中,其暧昧性与排他性的符号内涵,呈现出浓厚的青少年亚文化特征。围绕青少年文化表征实践形成的字母化网络语言,具有其独特的生成逻辑和话语建构方式。通过字符的“拼贴”与价值的“同构”,风格化的意义缩写使青少年得以在互联网空间实现表达自由、情感宣泄与集体狂欢。进而论之,青少年们以字母化网络语言为载体,以“情感共同体”的形式积极参与社会议题与文化建设,为其争夺网络空间话语权积累了可观的亚文化资本。而主流话语的引导有利于青少年更有效地参与网络空间、进行自我表达,从而形成良好的价值导向,进一步纾解话语差异、形塑社会共识。  相似文献   

10.
浅议中文报刊中的字母词   总被引:1,自引:0,他引:1  
只要稍加留意,你就会发现今天的中文报刊比以前的报刊增添了更多的字母文字,这些字母文字自然妥帖地与汉语文化融为一体,同汉字词语一同发挥着交际和传播的功能,并且构成了汉语词汇的一个组成部分。中国汉语学界称这些字母文字为“字母词”。所谓“字母词”就是指“汉语中带外  相似文献   

11.
分析中文自动分词的现状,介绍和描述几种不同的分词思想和方法,提出一种基于字位的分词方法。此分词方法以字为最小单位,根据字的概率分布得到组合成词的概率分布,因此在未登录词识别方面比其它方法有更优秀的表现。使用最大熵的机器学习方法来进行实现并通过两个实验得出实验结果的比较分析。  相似文献   

12.
[目的/意义]针对中文语言表达特点,提出一种含分词标签的字粒度词语特征提取方法,有效提升了中文临床病历命名实体识别任务的F1值,同时该方法可以为其他中文序列标注模型所借鉴。[方法/过程]选取汉语词语的词性标注、关键词权值、依存句法分析三个特征,构筑字粒度序列标注模型的临床病历训练文本,语料来源CCKS2017:Task2。在不同特征组合方式下,采用条件随机场算法验证两种字粒度词语特征提取方案Method1与Method2。[结果/结论]在四种不同词语特征组合下,Method2相对于Method1在临床病历命名实体识别任务中性能均有所提升,四折交叉测试中F1值平均提升了0.23%。实验表明在中文分词技术日趋成熟的环境下,Method2相对Method1能够获得更好的词语特征表示,对中文字粒度序列标注模型的处理性能具有提升作用。  相似文献   

13.
利用并发展针对单个汉字的构词能力和构词模式公式,计算词的构词能力和词的构词模式,并以此作为新词发现的规则,对科技领域做了新词发现和新技术发现的实验。通过对实验结果进行对比分析,证实该方法是有效的。  相似文献   

14.
张红林  李寿星 《编辑学报》2012,24(4):346-347
分析科技文稿中出现的140例使用"进行"的句子,举其中20例予以说明。部分例句可以直接去掉"进行"而不影响语意,部分例句去掉"进行"后适当调整句子的结构即可完整表达语意。赘用"进行"通常属作者不经意的语言习惯,在文稿编校时应酌情去掉。  相似文献   

15.
Applying Machine Learning to Text Segmentation for Information Retrieval   总被引:2,自引:0,他引:2  
We propose a self-supervised word segmentation technique for text segmentation in Chinese information retrieval. This method combines the advantages of traditional dictionary based, character based and mutual information based approaches, while overcoming many of their shortcomings. Experiments on TREC data show this method is promising. Our method is completely language independent and unsupervised, which provides a promising avenue for constructing accurate multi-lingual or cross-lingual information retrieval systems that are flexible and adaptive. We find that although the segmentation accuracy of self-supervised segmentation is not as high as some other segmentation methods, it is enough to give good retrieval performance. It is commonly believed that word segmentation accuracy is monotonically related to retrieval performance in Chinese information retrieval. However, for Chinese, we find that the relationship between segmentation and retrieval performance is in fact nonmonotonic; that is, at around 70% word segmentation accuracy an over-segmentation phenomenon begins to occur which leads to a reduction in information retrieval performance. We demonstrate this effect by presenting an empirical investigation of information retrieval on Chinese TREC data, using a wide variety of word segmentation algorithms with word segmentation accuracies ranging from 44% to 95%, including 70% word segmentation accuracy from our self-supervised word-segmentation approach. It appears that the main reason for the drop in retrieval performance is that correct compounds and collocations are preserved by accurate segmenters, while they are broken up by less accurate (but reasonable) segmenters, to a surprising advantage. This suggests that words themselves might be too broad a notion to conveniently capture the general semantic meaning of Chinese text. Our research suggests machine learning techniques can play an important role in building adaptable information retrieval systems and different evaluation standards for word segmentation should be given to different applications.  相似文献   

16.
杜慧平 《图书情报工作》2016,60(21):122-127
[目的/意义] 提出一种新的词族识别方法,用于构建语义工具和辅助检索扩展,以降低编表专家的认知负担,提高语义工具构建和更新的效率。[方法/过程] 首先通过同现统计和相似度计算建立学科领域的概念语义网络,再利用社会网络分析中的Island算法进一步识别该网络中的词族。并以金融学科为例,比较该方法与层次聚类算法、“词素后方一致”方法识别词族的效果。[结果/结论] 结果发现,Island算法的效果优于层次聚类算法,并与“词素后方一致”方法各具优势,可以结合使用,取长补短。  相似文献   

17.
姜韶华  党延忠 《情报学报》2006,25(3):301-305
中英文混合术语可作为未登录词处理、加权处理和歧义消解等的辅助信息,并有助于提高中文信息处理的质量。依据长度递减与串频统计思想,本文提出了一种中英文混合术语的抽取方法。该方法不需要词典,不需要事先进行语料库的学习,不需要建立字索引,而是依靠统计信息,抽取出支持度大于等于阈值的中英文混合术语。该算法能够有效地抽取出文本中新涌现的通用词、专业术语及专有名词。实验显示该方法不受语料限制,能够快速、准确地进行中英文混合术语的抽取。  相似文献   

18.
基于语义知识网络理论,提出了一种文书档案修复方法,来填充档案中缺失的(或者模糊的)部分文字数据.本文首先介绍了复杂网络的相关知识,然后根据复杂网络的社团结构原理提出了用于文书档案修复的填充算法,最后,应用实例说明了本文方法的可行性.  相似文献   

19.
针对中文文献抄袭检测提出了一种基于汉语词频的文本数字指纹,通过对具有参考性的语料库进行词频和字频统计形成一个hash词表,然后基于最大熵原理为任意长度的文本生成一个基于词频特征的文本数字指纹,对于任意两篇文献可以通过计算对应的两个数字指纹的Hamming距离来得到一个相似度的估计。通过使用维基百科zhwiki-20121129-all-titles语料库构建hash词表,对情报学领域4种核心期刊进行实验,结果表明这种数字指纹对常见的抄袭情况都能很好地识别和检测,具有很强的鲁棒性。  相似文献   

20.
[目的/意义]提出一种基于词频、词量、累积词频占比三者变化关系的共词分析词集范围的确定方法,尝试对现有词集范围选取方法中仅凭经验判断和过度依赖词频为“1”的关键词的问题进行改进,为相关研究提供一种更加规范、科学、值得借鉴的做法。[方法/过程]该方法充分考虑词集实际分布规律和特点,将词或词组分类成高、中、低频,并选择高、中频词共同作为共词分析的对象。[结果/结论]通过在具体领域的实例验证以及与其他方法的对比,证明该方法可以有效地选择合适的词集范围,对今后相关研究具有一定借鉴意义。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号