共查询到20条相似文献,搜索用时 15 毫秒
1.
黄嬿婉 《图书馆工作与研究》2009,(8)
顾廷龙是我国著名目录版本学家、图书馆事业家.在其治学生涯中,与<四库全书>结下了不解之缘.早期以<四库全书简明目录>入学术之门,并从事<四库全书简明目录>和<四库全书存目>标注之业.在编制古籍目录中,充分汲取了四库分类法的精华,并加以改进.晚年又主编<续修四库全书>大型丛书,为<四库存目丛书>编纂建言献策.总之,顾廷龙之学术成就与结缘<四库全书>并从中吸收营养有密切关系. 相似文献
2.
为了解决基于向量空间模型构建短文本分类器时造成的文本结构信息的缺失以及大量样本存在的标注瓶颈问题,提出一种基于图结构的半监督学习分类方法,这种方法既能保留短文本的结构语义关系,又能实现未标注样本的充分利用,提高分类器的性能。通过引入半监督学习的思想,将数量规模较大的未标注样本与少量已标注样本相结合进行基于图结构的自训练学习,不断迭代实现训练样本集的扩充,从而构建最终短文本分类器。经对比实验证明,这种方法能够获得较好的分类效果。 相似文献
3.
广播业曾以扬独家之优势、汇天下之精华的气势,稳居“广老大”的地位。近年来,随着电视、报纸等媒体以强劲的势头迅速崛起,广播业已滑至“广老三”、甚至更低的位置。面对广播业的整体滑坡和新闻媒体间竞争激烈的态势,如何重振广播昔日雄风,已成为跨世纪的战略性问题。当然办法和出路有许多种,很多广播电台也闯出了一些新路,取得了不少成功经验。但依笔者愚见,要提高本区域内广播业竞争的整体实力,组建省级广播集团已成为当务之急。组建省级广播集体,是广播业共同发展的需要广播是党和政府的“喉舌”,是党和政府联系人民群众的桥… 相似文献
4.
本文从群体智慧理论出发,构建了协同标注信息行为模型,将协同标注信息行为从宏观层面划分为初始阶段、中级阶段和终极阶段三个子过程;从微观层面划分为发散、收敛和凝聚三个子环节。其中,宏观层面描述了协同标注信息行为由量变到质变的过程,凸显了过程性;微观层面描述了协同标注信息行为中群体智慧涌现的基本过程,凸显了协同性。本研究通过对豆瓣电影标签数据的实证分析发现:基于群体智慧理论的三阶段-三环节模型合理地解释了协同标注信息行为的过程性和协同性;标签标注次数的偏度系数总体呈增长趋势,群体智慧在协同标注信息行为过程中不断涌现;标签引用是整个协同标注信息行为过程中的常态,逐渐形成了稳定的代表群体用户意见的高频标签群;八种协同标注信息行为模式在整个协同标注信息行为的过程中均有发生,但收敛模式较为稳定,发散模式有很大的概率转为收敛模式;协同标注信息行为过程以收敛环节为主,群体用户意见经历由发散向收敛转移,并最终凝聚全局共识、涌现大众分类。研究结果表明,本文的理论模型与研究方法具有科学性,能够丰富协同信息行为的理论与方法体系。 相似文献
5.
《汤加丽人体艺术写真》案不算一个太复杂的版权纠纷,它引起人们广泛关注的更多缘由是这本不同凡响的图集。这是一本以自己为摄影模特、以真名实姓署名出版的写真集,有媒体称它开创了中国出版史上署本人实名出版的人体画册之先河。说到写真集,人们会不由自主地产生各种好奇与遐想,一个标注了真名实姓的年轻舞蹈演员的人体写真集,和紧随其后的著作权纠纷,愈加引发人们的猜测与众多媒体的关注。 一、一本人体艺术写真集的出版2 0 0 2年9月一本名为《汤加丽人体艺术写真》的摄影图集摆在了新华书店书架上,它的出现在经历了十几年开放之风吹… 相似文献
6.
7.
《四库全书总目》于《崇文总目》一书下标注其底本为"《永乐大典》本",后来学者多信其说,误以为《四库全书》本《崇文总目》为从《永乐大典》中所辑出。本文根据提要及翁方纲提要分纂稿等材料证明《四库》本《崇文总目》为主要从《欧阳修集》和《文献通考》辑出,与《永乐大典》并无太大关系,翁方纲当时也并不认为其辑本为"《永乐大典》本",今本《总目》标注当为失误。 相似文献
8.
9.
本论文针对日本免费纸的整个体系进行了系统梳理。包括免费纸的形态、运作模式、当前规模、发展趋势、协调管理机构等 ,并辅之以相关个案进行具体介绍。同时 ,该文对中国传媒业有可能从中获取的借鉴也提出自己的观点 相似文献
10.
随着Web网页数量的爆炸式增长和网页噪声不断增多,网上获取重要信息变得越来越困难.本文从一个新的角度,提出了一种基于自然标注的网页信息抽取方法.依据这种方法,首先对网页进行聚类,提取具有相似结构的网页并进行相同的标注,然后采用SVM对抽取项进行训练,最后提取到需要抽取的数据.文章的主要贡献在于对网页中的自然标注进行分析和发现,给出了九大类自然标注的例子,并结合聚类和支持向量机,给出了训练方法.从实验结果上看,本方法优于其他方法. 相似文献
11.
古籍数字化整理是推动我国汉语古籍数据库建设及相关资源整合和利用的基础性工作。作为关键的技术环节之一,面向古籍命名实体的自动化抽取备受国内外学界和业界的关注。但是一些制约汉语古籍实体抽取方法的“卡脖子”问题仍未得到有效解决,包括少样本学习问题、标注成本管理问题和数据质量控制问题。本研究提出了一个面向古籍资源命名实体自动化抽取的通用框架——HanNER,包括“基于规则的实体预标注”“基于深度主动学习的迭代实体抽取”以及“人机交互模式下的标注决策”三个主要部分。多组实验比较证明了HanNER的可行性和优势,包括基于深度主动学习模型CNN-BiLSTM-CRF+margin的优势、多功能标注模块“标注查询”与“自动推荐”的积极作用以及ZenCrowd-II算法的优势。最后,本研究基于优化后的BERT-CNN-BiLSTM-CRF模型开发了在线的汉语古籍的实体自动抽取系统。HanNER的提出有利于推进汉语古籍实体抽取工作及相关任务在方法与技术上的发展,而且从工程化角度为古籍实体抽取产品的落地提供了借鉴和启发。 相似文献
12.
一、吴炎(1152—1221年) 吴炎字济之,号若峰,邵武人。宋绍熙四年(1193)刻印《东莱先生标注三苏文集》,为吕祖谦标注。三苏文集分别为苏洵《老泉集》、苏轼《东坡集》、苏辙《颖滨集》。其中《东莱标注老泉先生文集》十二卷,今北京图书馆存。 相似文献
13.
14.
16.
17.
18.
19.
本研究从<中国植物志>中随机采集1000个文档作为数据集,采用基于先导词的朴素贝叶斯算法实现中文物种描述文本的自动语义标注.通过实验性研究,实验数据表明,先导词能够有效提升朴素贝叶斯的标注效率.采用先导词后,F平均值提高0 048~0 107,尤以Fr为2时效果最好,整体标注性能F平均值高达0 902.各元素的标注性能也较为理想.Fr分别取1、2、3时,大部分元素的F值为0 730~0 964. 相似文献