首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 234 毫秒
1.
以某大学图书馆的所有馆藏书目为研究对象,在对图书关键词标引信息进分析的基础上,总结中文关键词的基本特点及其抽取规律,构建一个基于字序列标注的中文关键词抽取模型,提出中文关键词抽取的基础思路和实现方案,并通过实验论证模型的合理性、正确性和实用性,认为字序列标注方法优于词序列标注,基本上可以解决不分词情况下的中文关键词抽取问题。  相似文献   

2.
中文期刊论文自动标引加权设计研究   总被引:7,自引:0,他引:7  
本次调查,通过对随机采集的1000篇涉及到图书情报、农业经济、环境、工业企业管理这四个学科的中文期刊论文进行人工自由标引、人工打分测评和词频统计,并进行统计数据的分析,旨在得出中文期刊论文内容主题与文章题名、文摘、关键词、首段、第二段、倒数第二段、尾段、以及参考文献等8个标引信息源之间的关系,分析测评期刊论文不同部位的主题表达能力,并为之设计自动标引时加权抽词标引的适当权值。以便为中文期刊论文自动标引提供参考数据。  相似文献   

3.
基于条件随机场的自动标引模型研究   总被引:3,自引:1,他引:2  
条件随机场(Conditional Random Fields,CRF)模型是一种概率图模型.为了有效利用标引对象的特征,并考虑到抽词标引可以转换为序列标注问题,本文提出基于条件随机场的自动抽词标引模型.实验结果表明,该模型在改善抽词标引的性能方面,要优于支持向量机、多元线性回归模型等其他机器学习方法,是到目前为止解决序列标注问题的最好方法.但是,该模型本身还不能解决由于样本中存在同义词和相近词带来的问题,需要进一步对训练集和标引过程中存在的词汇语义情况进行考虑,提高标引的质量.  相似文献   

4.
近五年来自动标引研究在关键词抽取、标引系统设计、自动分类标引、网络信息自动标引、数字图像标引、音频信息标引、视频信息标引、自动标引结果评价等方面取得很大进展,但尚存弱点与不足之处,还不能达到人工标引的效果。今后的研究将朝着探索更优越的语言分析技术、更高端的多媒体信息自动标引方法、高效的知识库智能自学习机制、多种标引方法或模型的互补的集成学习等方向发展。  相似文献   

5.
使用基于《中图法》知识库的中文信息自动标引和自动分类系统,对中文图书进行自动标引与自动分类的实验,以测试该系统对图书的适用性。实验通过对中文图书进行计算机自动标引与自动分类、人工打分测评、测试结果统计分析,得出中文图书的各标引源主题表达能力依次为:书名、内容提要、两级目次、参考文献、一级目次,在此基础上对标引源进行加权设计,权值设为5:3:2:2。实验证明该系统用于中文图书的自动标引与自动分类是可行的。表6。参考文献9。  相似文献   

6.
关键词自动标引系统实现   总被引:1,自引:0,他引:1  
基于已标注关键词的大规模分类语料库,依据领域专家知识,统计得到词语表征文本内容主题概念的主题度。以此为基础,完成了一个关键词自动标引系统,详细描述了系统实现的总体流程和功能模块。  相似文献   

7.
刘英杰 《图书馆学刊》2008,30(2):123-124
论述了在联机编目下,中文图书书目数据著录与标引规范控制对文献检索的影响。  相似文献   

8.
关于增强书目数据库关键词标引的探讨   总被引:3,自引:1,他引:2  
本文首先指出:从现代书目数据的检索趋势看,越来越多的书目数据用户选择了关键词作为检索标识;接着分析了目前书目数据库关键词标引中存在的问题,即书目数据用户的检索需要和检索习惯在文献标引中得不到反映;最后提出了增强书目数据库关键词标引的原则及具体措施。  相似文献   

9.
论述了在联机编目下,中文图书书目数据著录与标引规范控制对文献检索的影响.  相似文献   

10.
为了提高海量新闻信息分类的效率,本文探索研究基于Transformer(转换器)模型和《中文新闻信息分类与代码》标准的自动分类标引,包括自动归类、聚类、检索标志的智能抽取,以及人工标引和自动标引的互相结合。Transformer模型训练数据特征效率更高,适应能力更强。基于标准的自动分类表更灵活,更高效,自动标引具有广泛的应用前景。  相似文献   

11.
试论梁启超近代目录学思想   总被引:1,自引:0,他引:1  
介绍梁启超近代目录学理论和书目工作实践,阐述其治学之法和为学之道、传播资产阶级文化的目录学思想和方法。认为梁启超通过编撰国学举要书目和新学西学书目、改革图书著录内容、创新图书著录体例、创立全新的图书分类体系,并把书目的社会作用提高到国家自强的政治高度,为我国近代目录学思想的形成和发展做出杰出的贡献。  相似文献   

12.
基于机器学习的中文书目自动分类研究   总被引:2,自引:1,他引:1  
面对与日俱增的图书出版量,图书馆编目人员的手工书目分类显得力不从心,如何实现由计算机自动完成图书分类成为数字图书馆建设中亟待解决的关键问题之一。本文尝试将BP神经网络和支持向量机等机器学习算法引入到书目分类中,建立了面向中图法的基于机器学习的书目层次分类系统模型,提出了采用特征加权方式描述书目和浅层次分类体系构建的设计思路,并通过大规模实验验证了该模型的可行性和合理性,基本上解决了没有主题标注情况下书目的自动分类问题。图9。表5。参考文献14。  相似文献   

13.
童正伦 《图书馆》2012,(1):112-115
中国古代的书目分简单的外表目录和详细的提要目录。受纸材质和西方目录的影响,近现代的目录基本是简目形式,性质只是找书而非学术。进入电子时代,目录载体不再受纸质束缚。本文认为应弘扬中国古代传统"辨章学术"的目录学思想而编制详目。文章归纳了电子目录的优点,对电子目录从外表到内容提出了与他目较大不同的探讨设计,力求发挥目录应有的功能。  相似文献   

14.
钱谦益《绛云楼书目》为历代学人与藏书家所重,但从目录学角度考察《绛云楼书目》的学术价值,至今仍付阙如。本文从款目著录、分类部次、款目组织、类目设置等方面,对《绛云楼书目》作深入分析,以期对中国传统目录学研究及钱谦益研究有所裨补。参考文献10。  相似文献   

15.
全面叙述版本目录学家崔建英的学术思想。介绍崔建英先生对前人版本学及版本著录进行了认真的检验,在参加《中国古籍善本书目》的审校工作和《中国科学院图书馆中文古籍善本书目》的编辑过程中,对版本的鉴定与著录和从群体视野审订版本方面颇多建树,并提出了建立中国古籍版本志的设想。  相似文献   

16.
王海刚 《出版科学》2011,(4):96-100
明代书业广告内容丰富,形式多样,不仅反映了明代书商的商业经营活动,同时反映了明代政治、经济和文化生活,是中国出版文化研究的重要资料。文章从书名广告、扉页广告、牌记广告、凡例广告、书目广告及征稿广告六个方面对图书促销术作了初步探讨和分析。  相似文献   

17.
《老解老》是古籍名著《道德经》的逐字索引,在中国索引学史上占有重要地位。笔者因研究需要曾检索《老解老》,其间颇为周折,今特作记录,供同行评析。  相似文献   

18.
在传统文化领域里,目录学素有“显学”之称。由于种种原因,史学家司马迁在目录学领域至今尚无一席之地。本文以事实表明,《史记》是一部空前规模的隐性书目文献。《史记》中隐含着目录学的理论和款目组织:辨析先秦诸子学术分野,揭示代表人物的生平事迹,考镜诸子学术源流,历数著述及学术成就,并以“互见法”揭示文献内容。《史记》对《汉书·艺文志》产生了重要影响,两书都以国史平台展示图书文献,重视学术流派的辨析,重视图书层面的内在联系。司马迁为目录学的确立和发展做出了奠基性贡献。参考文献8。  相似文献   

19.
《古文四声韵》是夏竦于北宋庆历四年(1044)完成的一本传抄古文字书,在出土文献及古文字研究蓬勃发展的今天,此书的价值日益彰显。然而,学界对此书的真正题名却存有争议,文章通过版本学、目录学以及文献学等知识,考证此书原名为《新集古文四声韵》,《古文四声韵》只是古今学者的一种习惯性简称。同时,文章也对前人未有涉及的定名原因进行探讨。  相似文献   

20.
基于中文词义概念的Web信息分类检索研究   总被引:2,自引:0,他引:2  
通过领域范畴索引构建网上中文信息分类检索的语义环境,使主题检索受控于范畴分类,并在此基础上研究了一种新型的Web信息分类检索方法,并证明概念词检索定位在主题类目下其查准率有进一步的提高。该研究应用于多种搜索引擎查找以不同类目归类的同一内容信息时,在类目名称与实际内容不一致情况下用户也能在同一类目下找到相关内容的信息。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号