首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 578 毫秒
1.
基于分类标注语料库的关键词标引知识自动获取   总被引:1,自引:0,他引:1  
基于大规模层级分类语料库,抽取网页上专家已经标引的关键词形成关键词表;针对关键词的领域不均匀性和邻界域两个特征,提出并模拟计算了关键词表征文本主题特征程度的主题度。以关键词及其主题度为领域知识,结合统计方法,完成了一个知识与统计相结合的关键词自动标引系统。  相似文献   

2.
Web教学资源主题检索系统的设计与实现   总被引:2,自引:0,他引:2  
Internet蕴涵着大量的教学资源,但因为缺乏行之有效检索工具,因而造成多数学生和教育工作者望洋兴叹。本文提出了一种基于Web的教学资源主题检索系统设计方案。该系统采用了关键词与关键模式相结合的检索方法和基于系统历史记录的搜索策略,极大地提高了教学信息的获取效率和准确性。  相似文献   

3.
学术论文中关键词的规范   总被引:3,自引:2,他引:3  
学术论文中的关键词,对于揭示论文的主题和检索文献有着重要的作用,文章通过一些实例,分析了学术论文中关键词存在的问题及原因。就如何加强学术论文关键词的规范提出了建议。  相似文献   

4.
进行学术期刊关键词分析对于掌握学科主题和学科构成脉络具有重要意义,由此本研究利用网络嵌入技术提取了大型关键词关联网络的高阶信息,并利用聚类算法对“图书馆学;情报学”学科进行关键词主题可视化分析。首先,刻画了关键词之间的局部聚集和全局分布,并分析了最近四年中该学科的热度持续、热度增加和热度减退主题,最后通过国内外关键词关联网络对比揭示了中外研究热点异同。  相似文献   

5.
搜索引擎中完善关键词检索功能的探索   总被引:7,自引:0,他引:7  
关键词检索是搜索引擎的两大基本检索功能之一。文章在简述和分析搜索引擎增强关键词检索功能措施的基础上,着重探讨了运用分类主题一体化的原理、方法组织索引。完善中文搜索引擎关键词检索功能的问题。  相似文献   

6.
医学论文题名与关键词在表达文献主题上的差异性   总被引:7,自引:1,他引:6  
医学论文题名和关键词是反映文献主题内容的2个重要部分。它们都具有揭示主题准确、选用词语精练、信息点集中的特点。题名的确定和关键词的标引既存在协同性,又存在差异性。这种差异与两者的侧重点和表达方式不同有关。应兼顾两者的共性,使其表达主题尽可能趋于一致。  相似文献   

7.
用主题词和关键词双重标引文献主题初探   总被引:4,自引:0,他引:4  
提出通过用主题词和关键词双重标引文献主题,并建立关键词与主题词间参照关系的设想,使数据库中文献按主题词规范管理,用户以自然语言检索  相似文献   

8.
本文对近三年国内外档案资源语义化开发研究热点与前沿进行了探测,通过高频关键词共现分析总结了国内外近三年档案资源语义化开发研究的相关主题,其中国内总结为档案保管与智慧建设、档案社会记忆建构与知识服务、档案语义转换与语义重组等6个研究主题,国外总结为基于本体的语义化开发等3个研究主题,同时基于高频关键词主题加权演进分析探测了研究热点与前沿。此外,本文对该领域相关平台项目实践研究进行了梳理,并基于以上研究,对国内外档案资源语义化开发的对象、目标、技术方法等内容进行了归纳总结。  相似文献   

9.
通过对开源网络爬虫Heritrix的系统构架进行改进,设计基于关键词过滤的主题网络爬虫,并提供一种配置手段利用HTMLParser技术对抽取内容进行结构化分解。实验结果表明,这种对Heritrix改进从而实现的网络爬虫,能够有效地按关键词过滤信息内容,并对信息主体进行了结构化存储。  相似文献   

10.
通过对开源网络爬虫Heritrix的系统构架进行改进,设计基于关键词过滤的主题网络爬虫,并提供一种配置手段利用HTMLParser技术对抽取内容进行结构化分解。实验结果表明,这种对Heritrix改进从而实现的网络爬虫,能够有效地按关键词过滤信息内容,并对信息主体进行了结构化存储。  相似文献   

11.
关键词是科技论文的文献检索标识,能反映文章主题概念的词或词组,关系到文献的被检索利用情况。文章从关键词的选取范围、选取原则以及首标词的选择三个方面,探讨了如何合理选择关键词,并就关键词标引中存在的漏标、错标、复标问题进行阐述。  相似文献   

12.
本文对公文与档案著录标引主题词和主题词标引在公文与档案检索中的重要作用作了阐述,对目前在主题词标引中存在的问题以及对检索产生的影响作了分析,提出了一些对策和值得思考的问题。  相似文献   

13.
论文采用共词聚类的方法,对2004-2011年CNKI期刊全文数据库收录的非物质文化遗产研究领域论文高频关键词进行分析,选取2004-2007,2008-2011年两个时间段分别统计高频词,并对比了频次变化特点,进而构建关键词共现矩阵.在此基础上,利用SPSS软件转换为相关矩阵进行聚类分析,并使用NETDRAW软件绘制了可视化图谱,直观地反映出我国近年来非物质文化遗产研究领域的研究热点.  相似文献   

14.
分析了网络环境下关键词的地位,并提出了其标引原则,指出了关键词应能清晰地提示论文主题内容、反映科技论文的创新性、表征论文的主题内容、为用户提供完整的信息。  相似文献   

15.
应用关键词共现的方法对全国发文量居前5位的精神痛专科医院发表的论文进行关键词词频及共现关系分析,并采用社会网络分析软件Ucinet形成可视化的共现网络图,对文献的内容进行挖掘分析。发现这5家医院在精神疾病的研究方面的侧重点各有差异。  相似文献   

16.
借助CSSCI,统计了2000—2009年数字图书馆研究论文的关键词,并进行聚类分析。根据分析结果,将我国数字图书馆研究划分为六大热点板块:资源建设与共享、数字图书馆服务、信息存储与组织、知识产权与法律、图书馆建设和数字图书馆关键技术。通过分析,总结出数字图书馆十年发展的特点和趋势:信息资源建设越来越注重特色资源的建设;信息服务更关注个性化服务和高端服务的研究;知识产权研究回归到普通研究领域;数字图书馆与最新信息技术同步发展;未来的数字图书馆极有可能在云计算环境下重构。图5。表1。参考文献12。  相似文献   

17.
农科学术论文关键词的标引   总被引:3,自引:0,他引:3  
讨论了目前农科学术论文对文章不进行深入细致的主题分析,易造成关键词的错标和漏标;不严格执行主题标引规则和勤查<汉语主题词表>,必然导致自由词滥用;有时还误以复杂的短语及英文缩略语、符号作为关键词.关键词的正确标引必须建立在主题分析之上,经过认真审读,提炼文章的主题,然后尽可能用主题词进行概念转换.必须严格控制自由词的使用.  相似文献   

18.
黎邦群 《图书情报工作》2012,56(17):126-130
针对当前OPAC存在的关键词拼写错误影响检索结果、检索结果中缺少检索建议等现状,进行特殊词快捷检索、拼音提示、拼写检查及相关搜索等检索建议的研究。利用Mashup和数据库相关技术,对用户输入的关键词进行数据特征的分析与判断,并在此基础上设计和实现特殊词快捷检索,对用户的关键词检索行为给出检索建议提示,以增强OPAC的互动性,提升用户的使用体验。  相似文献   

19.
BBS中文新词语自动挖掘*   总被引:1,自引:0,他引:1  
针对从BBS文本中自动挖掘新词语的问题,提出一种结合统计和规则的简单易行的方法,采用中文分词、频数统计、词性过滤、词语碎片组合等关键技术。据此方法开发的系统可以自动挖掘不限长度、不限领域、不限类别的与上下文无关的任意新词语。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号