共查询到20条相似文献,搜索用时 15 毫秒
1.
2.
3.
WD-ZBJ中文文献自动标引检索系统 总被引:1,自引:0,他引:1
本系统是在IBM-PC机上应用dbaseⅢ实现的。具有自动标引、机编索引、联机检索和定题服务等功能。采用“关键词的部件词一尾续词词典”和“非关键词部件词词典”对篇名(或文摘等)进行自动抽取关键词。其主要特点是采用“关键词规范化词典”对关键词进行规范处理,使同义词规范化,使同一族的一组词相对集中,显著提高了自动标引质量,从而提高了关键词法的检索效率。 相似文献
4.
5.
6.
7.
分类法主题法一体化自动标引系统的基本原理和方法 总被引:7,自引:0,他引:7
本文阐述基于文献题名的自动标引系统的原理和方法,该系统是分类法主题法一体化的。文中说明了依据文献题名对文献进行分类和主题标引的可行性、从题名中自动轴词、以体系分类法为基础的自动分类用分类词表、自动分类规则及以分面分类法为基础的文献自动分类、自由体系自动分类、半自动抽词、检索系统的分类法主题法一体化检索功能保证检索系统质量的关键因素等问题。 相似文献
8.
9.
隐性语义标引是一种基于词的相依性和语义结构的文献自动标引和检索技术,它采用词频统计和奇值分解技术来捕捉文献中的语义结构,进而得到标引词、提问和文献的向量表示,检索系统就可以通过计算文献与提问之间的相似度,来达到检索目的。相关反馈是通过反复与用户交互,分析调整检索策略,控制检索词的重要程度,从而增强对相关文献的响应且有效地抑制非相关文献的出现的对检索性能加以改进的有效措施。本文描述了相关反馈的数学基础及其在隐生语义标引方法中的工作原理,并以系统论和控制论的基本理论为指导,建立了一个具有相关反馈机制的隐性语义标引方法实验系统,进行了 相似文献
10.
微机辅助文献标引系统的设计与研究 3. 自动标引研究 总被引:2,自引:0,他引:2
在微机辅助文献标引系统中引入了自动标引方法, 进一步提高了标引的速度和质量。自动标引的基本思想是: 以机内主题词典为依据, 采用遍历扫描和相似性匹配两种方法, 从标题和文摘中抽词, 本文介绍了这一自动标引技术, 并对自动标引的结果进行了分析和讨论。 相似文献
11.
汉语词切分标引算法的改进 总被引:8,自引:1,他引:7
作者从实际应用的角度对汉语文献自动标引的两种算法进行了改进。提出将非用字后缀表法改进为,考察相邻三字之间的联系关系,实现一次扫描完成分词;还提出了首字直接匹配法对单字标引的检索进行改进 相似文献
12.
赵宗仁 《现代图书情报技术》1993,9(1):12-15
本文主要介绍利用微机通用管理系统ISIS的PASCAL语言开发的并集成于该系统的“汉语科技文献自动标引系统CADAIS”的系统构成,功能,自动标引原理,词典结构与建立方法,标引算法和实验情况等。 相似文献
13.
中文农业科技文献自动标引系统SDIC/CASDAIS 总被引:1,自引:0,他引:1
本文介绍了一个中文农业文献自动标引系统SDIC/CASDAIS,它集自动主题标引与自动分类标引于一体,采用主题词表、预匹配词表和停用词表相结合的词典法方案,匹配中采取正向增字跳字最长匹配的算法,末二字回溯,制订大量规则以降低错标。该系统可完成主题标引和分类标引,能处理农业文献中常见的缩略语和科技术语不规范现象,具备动态构词功能。SDIC/CASDAIS系统采用特征词析取方法处理不包含在词表中的品种、物质名称和地名等关键词,其自由词判定规则还可以判别标题的部分自由词,通过词频统计可作为更新词表的依据。SDIC/CASDAIS系统的标引速度为3000条标题/小时,平均标引深度略大于4,主题标引精度98%,分类标引基本吻合率80%。 相似文献
14.
研究构建了具有位置信息控制的特义禁用词语义环境,进而运用于中文文献元数据CXMARC文本的自动标引和主题信息的数据挖掘,其中研究设计的预处理特义中文禁用字词切分算法SWF,能有效地减少领域的分词歧义性和缩短标引时间,从而改进了传统最大匹配MM算法的自动标引质量和效率。 相似文献
15.
16.
自动标引研究的回顾与展望* 总被引:3,自引:0,他引:3
章成志 《现代图书情报技术》2007,2(11):33-39
对自动标引的研究进行总结与回顾。对标引对象进行界定;分析自动标引研究的3个阶段,并列出50年研究历程中的代表性方法;详细描述自动标引研究路线图、并对抽词标引与赋词标引方法进行详细分类;最后指出自动标引中存在的问题,并对今后的自动标引研究和应用方向进行展望。 相似文献
17.
18.
基于多词表的自动标引技术研究——新华社新闻稿自动标引的实验 总被引:9,自引:0,他引:9
避开汉语分词中的技术特点 ,转向基于多词表自动标引抽词研究是当前中文信息自动主题与分类标引可以采取的一种策略 ,也是最为可行的方法。本文以新华社新闻稿中的题名和导语为对象 ,详细介绍了基于多词表自动标引技术中的词表构建、自动抽词、主题标引和自动分类等技术。并成功设计了新闻信息自动标引的实验系统 ,取得了较好的效果。 相似文献
19.
引文主题与源文献主题具有相关性.基于这一事实,本文提出了一种基于汉语科技文献引文的自动标引法.具体过程是以词典为依据对源文献与引文题名进行抽词处理,并为不同类型引文赋予不同的权重,在此基础上确定用于标引源文献的关键词.本文还对此法的可行性进行了测试,并提出了改进方法. 相似文献
20.
随着计算机硬件设备的改进和软件技术的提高,采用关键词法设计和建立的计算机档案主题检索系统也越来越多。为了提高档案关键词检索系统的整体效能,标引时,无论是人工标引还是机器自动标引,是抽词标引还是赋词标引,检索时,无论是题名关键词检索,还是全文检索,是截... 相似文献