共查询到20条相似文献,搜索用时 234 毫秒
1.
以某大学图书馆的所有馆藏书目为研究对象,在对图书关键词标引信息进分析的基础上,总结中文关键词的基本特点及其抽取规律,构建一个基于字序列标注的中文关键词抽取模型,提出中文关键词抽取的基础思路和实现方案,并通过实验论证模型的合理性、正确性和实用性,认为字序列标注方法优于词序列标注,基本上可以解决不分词情况下的中文关键词抽取问题。 相似文献
2.
3.
基于条件随机场的自动标引模型研究 总被引:3,自引:1,他引:2
条件随机场(Conditional Random Fields,CRF)模型是一种概率图模型.为了有效利用标引对象的特征,并考虑到抽词标引可以转换为序列标注问题,本文提出基于条件随机场的自动抽词标引模型.实验结果表明,该模型在改善抽词标引的性能方面,要优于支持向量机、多元线性回归模型等其他机器学习方法,是到目前为止解决序列标注问题的最好方法.但是,该模型本身还不能解决由于样本中存在同义词和相近词带来的问题,需要进一步对训练集和标引过程中存在的词汇语义情况进行考虑,提高标引的质量. 相似文献
4.
5.
6.
关键词自动标引系统实现 总被引:1,自引:0,他引:1
刘华 《现代图书情报技术》2006,(2):88-90
基于已标注关键词的大规模分类语料库,依据领域专家知识,统计得到词语表征文本内容主题概念的主题度。以此为基础,完成了一个关键词自动标引系统,详细描述了系统实现的总体流程和功能模块。 相似文献
7.
8.
关于增强书目数据库关键词标引的探讨 总被引:3,自引:1,他引:2
本文首先指出:从现代书目数据的检索趋势看,越来越多的书目数据用户选择了关键词作为检索标识;接着分析了目前书目数据库关键词标引中存在的问题,即书目数据用户的检索需要和检索习惯在文献标引中得不到反映;最后提出了增强书目数据库关键词标引的原则及具体措施。 相似文献
9.
10.
为了提高海量新闻信息分类的效率,本文探索研究基于Transformer(转换器)模型和《中文新闻信息分类与代码》标准的自动分类标引,包括自动归类、聚类、检索标志的智能抽取,以及人工标引和自动标引的互相结合。Transformer模型训练数据特征效率更高,适应能力更强。基于标准的自动分类表更灵活,更高效,自动标引具有广泛的应用前景。 相似文献
11.
试论梁启超近代目录学思想 总被引:1,自引:0,他引:1
介绍梁启超近代目录学理论和书目工作实践,阐述其治学之法和为学之道、传播资产阶级文化的目录学思想和方法。认为梁启超通过编撰国学举要书目和新学西学书目、改革图书著录内容、创新图书著录体例、创立全新的图书分类体系,并把书目的社会作用提高到国家自强的政治高度,为我国近代目录学思想的形成和发展做出杰出的贡献。 相似文献
12.
13.
中国古代的书目分简单的外表目录和详细的提要目录。受纸材质和西方目录的影响,近现代的目录基本是简目形式,性质只是找书而非学术。进入电子时代,目录载体不再受纸质束缚。本文认为应弘扬中国古代传统"辨章学术"的目录学思想而编制详目。文章归纳了电子目录的优点,对电子目录从外表到内容提出了与他目较大不同的探讨设计,力求发挥目录应有的功能。 相似文献
14.
钱谦益《绛云楼书目》为历代学人与藏书家所重,但从目录学角度考察《绛云楼书目》的学术价值,至今仍付阙如。本文从款目著录、分类部次、款目组织、类目设置等方面,对《绛云楼书目》作深入分析,以期对中国传统目录学研究及钱谦益研究有所裨补。参考文献10。 相似文献
15.
全面叙述版本目录学家崔建英的学术思想。介绍崔建英先生对前人版本学及版本著录进行了认真的检验,在参加《中国古籍善本书目》的审校工作和《中国科学院图书馆中文古籍善本书目》的编辑过程中,对版本的鉴定与著录和从群体视野审订版本方面颇多建树,并提出了建立中国古籍版本志的设想。 相似文献
16.
明代书业广告内容丰富,形式多样,不仅反映了明代书商的商业经营活动,同时反映了明代政治、经济和文化生活,是中国出版文化研究的重要资料。文章从书名广告、扉页广告、牌记广告、凡例广告、书目广告及征稿广告六个方面对图书促销术作了初步探讨和分析。 相似文献
17.
18.
在传统文化领域里,目录学素有“显学”之称。由于种种原因,史学家司马迁在目录学领域至今尚无一席之地。本文以事实表明,《史记》是一部空前规模的隐性书目文献。《史记》中隐含着目录学的理论和款目组织:辨析先秦诸子学术分野,揭示代表人物的生平事迹,考镜诸子学术源流,历数著述及学术成就,并以“互见法”揭示文献内容。《史记》对《汉书·艺文志》产生了重要影响,两书都以国史平台展示图书文献,重视学术流派的辨析,重视图书层面的内在联系。司马迁为目录学的确立和发展做出了奠基性贡献。参考文献8。 相似文献
19.
段凯 《图书馆理论与实践》2021,(2):131-136
《古文四声韵》是夏竦于北宋庆历四年(1044)完成的一本传抄古文字书,在出土文献及古文字研究蓬勃发展的今天,此书的价值日益彰显。然而,学界对此书的真正题名却存有争议,文章通过版本学、目录学以及文献学等知识,考证此书原名为《新集古文四声韵》,《古文四声韵》只是古今学者的一种习惯性简称。同时,文章也对前人未有涉及的定名原因进行探讨。 相似文献
20.
基于中文词义概念的Web信息分类检索研究 总被引:2,自引:0,他引:2
通过领域范畴索引构建网上中文信息分类检索的语义环境,使主题检索受控于范畴分类,并在此基础上研究了一种新型的Web信息分类检索方法,并证明概念词检索定位在主题类目下其查准率有进一步的提高。该研究应用于多种搜索引擎查找以不同类目归类的同一内容信息时,在类目名称与实际内容不一致情况下用户也能在同一类目下找到相关内容的信息。 相似文献