首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 78 毫秒
1.
论述文献数据库的标引规范和不同类型文献的标引模式;探讨自然语言与受控语言相结合的标引模式,以利于向受控语言的自动转化  相似文献   

2.
近年来 ,我国引进版权的科技图书越来越多 ,这些科技图书通常附有完备的索引。由于先进国家普遍使用了计算机自动抽词技术 ,不少图书的索引条目极为丰富 ,篇幅很大。我社曾引进一书 ,其索引有88页 ,词条 930 0多条 ,平均每个词条对应 3个以上页码 ,最多的达 7个 ,被标引的页码总数约 3万余个。这么庞大的索引 ,如何编制 ?为此 ,我们作了一些探索 ,下面谈谈我们的思考和做法 ,并求教于专家、同行。  1 图书索引和词条的指引标志图书索引的条目是由词条和指引标志两部分组成。词条一般是术语、人 (地 )名或有检索意义的词组 ;指引标志是词…  相似文献   

3.
影像资料主题标引问题分析   总被引:2,自引:0,他引:2  
本分析了影像资料主题标引中存在的问题,认为标引中的随意性和标引结果的非一致性是影像主题标引的主要问题。问题的症结在于标引模式上存在误区,以及标引过程中主题内容客观性分析的欠缺。针对这些问题,本提出了一些处理问题的意见和方法,以期得到本专业人员对标引问题的重视,提高影像资料机读目录数据的正确性。  相似文献   

4.
本文说明主题检索途径的独特作用,指出提供主题检索途径可以有多种模式,而不仅仅限于编制主题目录。作者把各种模式归为直接提供主题检索途径模式和间拉提供主题检索途径模式两类,并对两类模式作了比较,说明应如何选择。此外,还讨论了藏书主题标引的有关问题,特别是协作标引与标引数据共享问题。  相似文献   

5.
文章对中文图书标引错误进行了剖析,显示出当前的拷贝标引模式给标引质量带来的“杀伤力”,指出标引专业培训的缺失是标引质量问题频现的根源.  相似文献   

6.
将标引的主题从整体上划分为两个部分:事物部分和方面部分。每个部分有个中心词。然后从每个部分的中心词出发,寻找出该部分范围内所包含的全部外延,从而把主题所反映的全部内容揭示出来。基于这个思想,作者提出了两个标引分解模式,并制订了一个简明、规范的标引规则。  相似文献   

7.
针对国内外著名数据库受控标引的标引方式、标引字段的现状和发展趋势进行深入分析,指出目前虽然受控标引以机器辅助标引为主,但自动标引也有成功案例。标引字段除标引文献主题内容外已扩至对文献中的图表、重要数值、化学分子式等进行标引,并采用与分类标引、非受控语言标引相结合的多维度标引模式。最后,基于目前国内外受控标引发展水平的差异,提出国内应从三个方面予以改进。  相似文献   

8.
1标引模式的确定标引模式或引用次序,是指主题标引时为了表达一个复杂概念,两个或两个以上主题词的组配次序,或称词序。使用不同的标引模式,就会形成不同的标题或叙词词串,形成不同的文献序列,将会直接影响标引的一致性和检索的效率。百余年来,著名的图书馆学家克特(CA.Cutter)、凯塞(J.O.Kaiser)、阮冈纳赞(Ran.ganathan)、柯茨(EJ、Cootes)等人对标引模式问题进行了一系列的研究,试图建立一个通用的标引模式(或称标准引用次序)。我国学者自80年代初,开始对标引模式问题进行研究,取得一些进展,诸如张淇玉的"…  相似文献   

9.
标引人员的智慧与文献标引的质量密切相关。提高标引人员的素养很重要。标引人员需要在标引实践中磨练。自动标引研究已有半个世纪,其标引质量至今未能超过人工标引而取代人工标引,究其原因在于计算机不具备优秀标引人员的智慧,不适应近乎艺术创造的标引作业。可以揣测,没有标引人员介入的、高度自动化的文献标引处理的实现,至少还要等待一个相当长的时间。人工标引研究的成果将有助于自动标引研究中一些难题的解决。不可轻视人工标引的研究。  相似文献   

10.
一个具体的全文后控检索系统的设计   总被引:4,自引:0,他引:4  
本文除简述了系统设计的总体思想、系统主要特点以及装库、标引、检索等模块的主要功能外, 重点探讨了适应全文检索系统不同时期标引建库需要的三种标引模式, 首次提出了基于全文检索系统标引和后控制成果自学习实现全文本标引用抽词词典的自动积累和完善并建立自动加权标引模式。另外, 还简要论述了全文摘要的机辅生成和后控检索策略的自动构造等重要问题。  相似文献   

11.
当前我国高校的信息公开制度与信息保密制度尚未形成良好的博弈格局,信息公开的法律依据尚不严密,信息公开相关主体的认知态度尚有较大差异,因而,体现现代大学治理结构的高校信息公开制度的构建与实施,尚需逐步推进.  相似文献   

12.
基于模糊处理的中文文本关键词提取算法*   总被引:2,自引:0,他引:2  
研究关键词提取算法,在分析可能影响关键词提取词语的各种属性并将其量化的基础上,提出并实现一种将分词与词性标注、文本预处理、线性加权算法、组合词生成与过滤、合并候选关键词等集成到一个完整框架中的模型算法。  相似文献   

13.
[目的/意义]传统的关键词自动抽取将摘要看成一个整体,常以候选词的出现频次等非语义信息构建特征,并未考虑学术文献摘要中目的、方法、结论等各个结构功能语义蕴含的差异性。本文以中文文献为研究对象,探讨候选词所在的结构功能域对关键词抽取的影响和作用。[方法/过程]本文将文献标题和摘要文本共分为4个结构功能域,在传统的词频、词长、词跨度等基准特征上,融合了基于BERT的语义特征和结构功能特征,并以不同的特征组合方式,使用图书情报领域的中文学术文献,基于分类模型进行关键词自动抽取实验。[结果/结论]实验结果表明,融合结构功能特征后,关键词抽取效果整体提升了6.82%,证明了学术文献摘要结构功能的识别形成的结构功能特征对关键词抽取效果的提升有良好作用。  相似文献   

14.
知识抽取中的嵌套向量分词技术   总被引:1,自引:1,他引:1  
向量分词算法已经比较成熟,通过在知识抽取过程中实现向量分词算法,对向量切分中的关键技术进行归纳总结,同时发现一趟向量切分的不足,并针对这些不足,设计嵌套的向量分词技术。实验证明,在知识抽取过程中,采用嵌套的向量切分方法,不但切分准确率高、切分全面,而且能从根本上解决“词中有词”的问题,有利于后续的句法分析。  相似文献   

15.
本文介绍了用.数据库管理系统FOXBASE编写的自动标引系统,其中主要介绍的基本思想、实现过程及其特点。文中着重介绍了词标引、主题标引、赋词标引和抽调标引的方法,和在Compaq386机上建立的试验系统。  相似文献   

16.
Digital publishing enables new features beyond simple electronic availability and searching. One of these can be helping readers understand articles that are not in their native language by providing word extraction services using natural language processing on publishers' platforms. This would help in both electronic and paper formats. This paper analyzes the feasibility of vocabulary extraction and gives corresponding extraction strategies for ‘normal’ words as well as technical terms.  相似文献   

17.
采用Visual studio.NET 开发平台,使用C#程序设计语言以及XML知识描述和数据存储,对网络专题知识组织和知识元自动抽取系统进行开发设计。对该系统的文本信息预处理、快速汉字结合自增长分词、词频全文精确统计等重要功能的设计与实现进行了深入研究。  相似文献   

18.
基于本体和DOM相结合的Web信息抽取器   总被引:1,自引:0,他引:1  
针对基于Web页面信息本体的信息抽取不能准确划定抽取区域的缺点,设计基于本体和DOM相结合的Web信息抽取器。利用DOM树设计对样本页面信息项路径进行归纳学习的算法,该算法能准确划定信息抽取区域,降低页面噪声,实现对Web页面的预处理。实验表明,改进后的抽取方法提高了Web信息的抽准率。  相似文献   

19.
本文采用二模冗余技术,对系统产生的双文本进行冗余比较实现查错,提出了定步长回溯比较算法,给出算法描述,最后通过实验结果证明其正确性  相似文献   

20.
[目的/意义]针对中文语言表达特点,提出一种含分词标签的字粒度词语特征提取方法,有效提升了中文临床病历命名实体识别任务的F1值,同时该方法可以为其他中文序列标注模型所借鉴。[方法/过程]选取汉语词语的词性标注、关键词权值、依存句法分析三个特征,构筑字粒度序列标注模型的临床病历训练文本,语料来源CCKS2017:Task2。在不同特征组合方式下,采用条件随机场算法验证两种字粒度词语特征提取方案Method1与Method2。[结果/结论]在四种不同词语特征组合下,Method2相对于Method1在临床病历命名实体识别任务中性能均有所提升,四折交叉测试中F1值平均提升了0.23%。实验表明在中文分词技术日趋成熟的环境下,Method2相对Method1能够获得更好的词语特征表示,对中文字粒度序列标注模型的处理性能具有提升作用。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号