共查询到17条相似文献,搜索用时 140 毫秒
1.
两种自动标引法的比较及改造 总被引:5,自引:0,他引:5
方懿 《现代图书情报技术》1996,12(2):20-26
本文主要对汉语文献自动标引的两种方法——切分标记法和单汉字标引法在标引和检索实现上的不同作了比较, 并对两种方法的算法实现提出了一些建议和设想, 旨在推进对自动标引的进一步研究和完善。 相似文献
2.
用于汉语文献自动标引的词典结构研究 总被引:1,自引:0,他引:1
用于汉语文献自动标引的词典组织结构对自动标引的效率有很大影响,自动标引中运用的词典查找算法有其自身的特点,符合这种特点的词典结构能提高自动标引过程中分词的速度。本文在分析了几种常用的词典结构的空间效率和时间效率之后,提出了一种通用而高效的词典组织方法。采用这种方法的词典,其体积可以减小到原来的0.4倍,分词速度提高到原来的2.5倍。 相似文献
3.
4.
引文主题与源文献主题具有相关性.基于这一事实,本文提出了一种基于汉语科技文献引文的自动标引法.具体过程是以词典为依据对源文献与引文题名进行抽词处理,并为不同类型引文赋予不同的权重,在此基础上确定用于标引源文献的关键词.本文还对此法的可行性进行了测试,并提出了改进方法. 相似文献
5.
赵宗仁 《现代图书情报技术》1993,9(1):12-15
本文主要介绍利用微机通用管理系统ISIS的PASCAL语言开发的并集成于该系统的“汉语科技文献自动标引系统CADAIS”的系统构成,功能,自动标引原理,词典结构与建立方法,标引算法和实验情况等。 相似文献
6.
引文主题与源文献主题具有相关性。基于这一事实,本文提出了一种基于汉语科技文献引文的自动标引法。具体过程是以词典为依据对源文献与引文题名进行抽词处理,并为不同类型引文赋予不同的权重,在此基础上确定用于标引源文献的关键词。本文还对此法的可行性进行了测试,并提出了改进方法。 相似文献
7.
8.
针对中文学术文献,提出一种新的自动标引方法,该方法基于文献之间的引用关系,利用被引文献的标引词,对遗传算法进行改进,实现自动标引,避免利用文献正文、标题等内部文本特征进行自动标引的局限性。通过在大规模真实测试集(中文学术文献)上进行实验,验证该方法的有效性。 相似文献
9.
汉语词切分标引算法的改进 总被引:8,自引:1,他引:7
作者从实际应用的角度对汉语文献自动标引的两种算法进行了改进。提出将非用字后缀表法改进为,考察相邻三字之间的联系关系,实现一次扫描完成分词;还提出了首字直接匹配法对单字标引的检索进行改进 相似文献
10.
中文文本关键词自动抽取方法研究 总被引:6,自引:1,他引:5
随着信息技术的发展,中文电子文本信息资源正以惊人的速度急剧增长.文本自动处理技术,通过自动组织海量文献信息资源,能够为用户提供简易有效的信息检索服务.关键词自动抽取是文本自动处理的基础和核心.汉语的特殊性加剧了中文文本关键词自动抽取的难度.本文提出了一种基于N-gram权重计算和关键词筛选算法的中文文本关键词自动抽取方法.该方法不依赖特定的数据集和中文分词技术,可以有效地抽取出任意单篇文本的关键词,而且通过参数调整,应用系统可以灵活地控制标引深度和标引专指度.实验表明,该方法简单、快速、断词错误率低,标引性能明显优于基于中文分词和TF/IDF的方法,可以满足大规模文本的在线处理要求. 相似文献
11.
12.
吴家云 《现代图书情报技术》1999,15(4):15-17
通过采用单汉字索引技术在FOXPRO环境下自行设计的实验系统,以《新华日报》为例,实验比较了在自动标引方式和自由标引方式下新闻信息数据库的检索效率,并分析了两种标引方式对检索效率的影响关系,从而探讨用机器自动标引替代手工自由标引的可能性。文章还提出了改进的建议及实验需要的原则。 相似文献
13.
研究构建了具有位置信息控制的特义禁用词语义环境,进而运用于中文文献元数据CXMARC文本的自动标引和主题信息的数据挖掘,其中研究设计的预处理特义中文禁用字词切分算法SWF,能有效地减少领域的分词歧义性和缩短标引时间,从而改进了传统最大匹配MM算法的自动标引质量和效率。 相似文献
14.
15.
文献信息自动标引研究 总被引:12,自引:0,他引:12
作者认为我国文献自动标引研究的重点应由分词研究向实际标引研究转移。由此, 作者从标引源的确立、标引词权值的定义和使用、标引词库的构造、自动标引算法的实现等方面阐述了他们在自动标引方面的研究成果, 同时介绍了利用标引词库进行的检索改造。 相似文献
16.
关键词自动标引是一种识别有意义且具有代表性片段或词汇的自动化技术。关键词自动标引可以为自动摘要、自动分类、自动聚类、机器翻译等应用提供辅助作用。本文利用基于知网的词语语义相关度算法对词汇链的构建算法进行了改进,并结合词频和词的位置等统计信息,进行关键词的自动标引。实验证明,该方法可以有效的进行关键词的自动标引。 相似文献
17.