共查询到20条相似文献,搜索用时 23 毫秒
1.
中文期刊文献通用词标引分析 总被引:1,自引:0,他引:1
通用因素是文献主题的构成因素之一,对主体因素起细分作用。通用词是指那些在专业领域没有独立检索意义的泛指词。在中文期刊文献标引的过程中,通用词的使用对其标引结果产生着重要的影响。文章讨论了通用词标引的一般规则,并以《中国期刊网》中的文献为例,进行抽样统计和实例分析,归纳了通用词标引的错误现象及其原因,并对期刊文献的通用词标引提出了几点改进意见。 相似文献
2.
随着计算机硬件设备的改进和软件技术的提高,采用关键词法设计和建立的计算机档案主题检索系统也越来越多。为了提高档案关键词检索系统的整体效能,标引时,无论是人工标引还是机器自动标引,是抽词标引还是赋词标引,检索时,无论是题名关键词检索,还是全文检索,是截... 相似文献
3.
单汉字标引技术的改进研究 总被引:10,自引:0,他引:10
王淼 《现代图书情报技术》1997,13(2):48-53
本文针对汉语构词的特殊性, 提出了一种单汉字标引的改进算法。该算法在标引上采用了对非检索词词首字的剔除标引, 在检索上, 采取检索词首字查找, 检索词直接匹配的算法。还提出了对检索结果的存储以及构筑后控词典, 以逐步完善单汉字检索系统。以上算法, 在SCIRS (Single Chinese Character Indexing and Retrieval System) 得到初步实现。 相似文献
4.
5.
6.
基于EMM中文抽词算法的XMARC主题信息挖掘 总被引:4,自引:0,他引:4
本文在分词词典上采用区间最大词长,改进正向减字最大匹配法为“词首 长词匹配 短词推进”自动标引方法,从而有效地减少领域的分词歧义性和缩短标引时间。最后将该研究付诸于XMARC主题信息的挖掘与检索的实现,并证明其在时间和质量综合性能上的优越性。 相似文献
7.
档案管理现代化热点扫描马绪超一、自动标引技术与档案管理现代化自动标引技术是根据拟存储、检索文献(题名、文摘、正文),由计算机自动选定标识词(即检索标识)的标引技术。是1957—1958年由美国的卢恩提出来的,当时主要是基于词频统计法的自动抽词标引,后... 相似文献
8.
隐性语义标引是一种基于词的相依性和语义结构的文献自动标引和检索技术,它采用词频统计和奇值分解技术来捕捉文献中的语义结构,进而得到标引词、提问和文献的向量表示,检索系统就可以通过计算文献与提问之间的相似度,来达到检索目的。相关反馈是通过反复与用户交互,分析调整检索策略,控制检索词的重要程度,从而增强对相关文献的响应且有效地抑制非相关文献的出现的对检索性能加以改进的有效措施。本文描述了相关反馈的数学基础及其在隐生语义标引方法中的工作原理,并以系统论和控制论的基本理论为指导,建立了一个具有相关反馈机制的隐性语义标引方法实验系统,进行了 相似文献
9.
10.
中文图书机读书目数据中"610"字段初探 总被引:1,自引:0,他引:1
在中文文献的主题标引中,非控制词(自由词)标引是一种重要的标引技术。其目的主要在于提高文献的检索效率,扩大文献的检索途径。它是对主题标引的补充和辅助,可弥补主题标引的不足。在其标引过程中,要遵循一定的原则和方法。 相似文献
11.
12.
期刊的“在版标引”是指期刊编辑部在刊出的每篇文献的题目下或摘要后,都标有该文献的检索词——关键词或主题词。期刊“在版标引”的显著特色就在于它使文献的标引工作与该文献的印刷排版同步完成。这种“合二为一”,标志着我国情报检索工作又跨入了一个新起点,为提高情报检索效率、普 相似文献
13.
数字环境下主题词的应用,包括用作检索词、作为检索输入帮助、提供浏览、用以检索优化、二次检索等。结合数字环境下的应用,先组式标题可以提高检准率,避免错误组配,用以辅助检索;保留轮排有助于改进辅助检索帮助的提供;交叉组配与限定组配的区分,有益于改进标题排序和轮排操作;同时应结合数字环境的特点,改进直接标引和间接标引的应用;充分使用自由词标引等。改进标引软件功能,实现主题词自动轮排以及结合检索应用需要加以调整等,是改进主题标引应关注的内容。 相似文献
14.
15.
16.
文献标引是计算机检索的重要内容之一,是实现图书情报检索自动化的先决条件。所谓文献标引系指从文献正文或摘要中找出能够表征文献主题内容,具有实际意义的词来标引文献资料,以供计算机检索使用。一、标引的重要性在计算机检 相似文献
17.
一个具体的全文后控检索系统的设计 总被引:4,自引:0,他引:4
周全明 《现代图书情报技术》1996,12(3):32-36
本文除简述了系统设计的总体思想、系统主要特点以及装库、标引、检索等模块的主要功能外, 重点探讨了适应全文检索系统不同时期标引建库需要的三种标引模式, 首次提出了基于全文检索系统标引和后控制成果自学习实现全文本标引用抽词词典的自动积累和完善并建立自动加权标引模式。另外, 还简要论述了全文摘要的机辅生成和后控检索策略的自动构造等重要问题。 相似文献
18.
著录标引是计算机管理档案的基础工作,著录标引工作的优劣,直接影响着检索的速度、计算机管理的效果乃至整个现代化管理的进程. 相似文献
19.
网络环境下信息检索效率的影响因素及提高策略 总被引:2,自引:0,他引:2
本文从网络信息检索工具、数据的标引质量、检索入口词的选择、检索人员的素质等方面来分析这些因素对用户网络信息检索效率的影响,以便制定相应的检索策略,从而提高检索效率。 相似文献
20.
当前,应用电子计算机管理档案已是相当普遍的事了.但是,在实用的机器自动标引软件系统和文档一体化计算机管理系统尚未问世之前,计算机建库的数据还都是来源于人工标引.就人标引的质量而言,同一份档案文件由于出自不同的标引者之手,在标引的深度上和广度上往往会有差异,这直接影响到计算机数据库的质量和检索利用的效果.本文就档案著录标引与计算机检索的查全率和查准率,结合标引工作实践作一些分析,以与同行们交流、商榷. 相似文献