首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 609 毫秒
1.
顾廷龙是我国著名目录版本学家、图书馆事业家.在其治学生涯中,与<四库全书>结下了不解之缘.早期以<四库全书简明目录>入学术之门,并从事<四库全书简明目录>和<四库全书存目>标注之业.在编制古籍目录中,充分汲取了四库分类法的精华,并加以改进.晚年又主编<续修四库全书>大型丛书,为<四库存目丛书>编纂建言献策.总之,顾廷龙之学术成就与结缘<四库全书>并从中吸收营养有密切关系.  相似文献   

2.
张倩  刘怀亮 《图书情报工作》2013,57(21):126-132
为了解决基于向量空间模型构建短文本分类器时造成的文本结构信息的缺失以及大量样本存在的标注瓶颈问题,提出一种基于图结构的半监督学习分类方法,这种方法既能保留短文本的结构语义关系,又能实现未标注样本的充分利用,提高分类器的性能。通过引入半监督学习的思想,将数量规模较大的未标注样本与少量已标注样本相结合进行基于图结构的自训练学习,不断迭代实现训练样本集的扩充,从而构建最终短文本分类器。经对比实验证明,这种方法能够获得较好的分类效果。  相似文献   

3.
广播业曾以扬独家之优势、汇天下之精华的气势,稳居“广老大”的地位。近年来,随着电视、报纸等媒体以强劲的势头迅速崛起,广播业已滑至“广老三”、甚至更低的位置。面对广播业的整体滑坡和新闻媒体间竞争激烈的态势,如何重振广播昔日雄风,已成为跨世纪的战略性问题。当然办法和出路有许多种,很多广播电台也闯出了一些新路,取得了不少成功经验。但依笔者愚见,要提高本区域内广播业竞争的整体实力,组建省级广播集团已成为当务之急。组建省级广播集体,是广播业共同发展的需要广播是党和政府的“喉舌”,是党和政府联系人民群众的桥…  相似文献   

4.
本文从群体智慧理论出发,构建了协同标注信息行为模型,将协同标注信息行为从宏观层面划分为初始阶段、中级阶段和终极阶段三个子过程;从微观层面划分为发散、收敛和凝聚三个子环节。其中,宏观层面描述了协同标注信息行为由量变到质变的过程,凸显了过程性;微观层面描述了协同标注信息行为中群体智慧涌现的基本过程,凸显了协同性。本研究通过对豆瓣电影标签数据的实证分析发现:基于群体智慧理论的三阶段-三环节模型合理地解释了协同标注信息行为的过程性和协同性;标签标注次数的偏度系数总体呈增长趋势,群体智慧在协同标注信息行为过程中不断涌现;标签引用是整个协同标注信息行为过程中的常态,逐渐形成了稳定的代表群体用户意见的高频标签群;八种协同标注信息行为模式在整个协同标注信息行为的过程中均有发生,但收敛模式较为稳定,发散模式有很大的概率转为收敛模式;协同标注信息行为过程以收敛环节为主,群体用户意见经历由发散向收敛转移,并最终凝聚全局共识、涌现大众分类。研究结果表明,本文的理论模型与研究方法具有科学性,能够丰富协同信息行为的理论与方法体系。  相似文献   

5.
《汤加丽人体艺术写真》案不算一个太复杂的版权纠纷,它引起人们广泛关注的更多缘由是这本不同凡响的图集。这是一本以自己为摄影模特、以真名实姓署名出版的写真集,有媒体称它开创了中国出版史上署本人实名出版的人体画册之先河。说到写真集,人们会不由自主地产生各种好奇与遐想,一个标注了真名实姓的年轻舞蹈演员的人体写真集,和紧随其后的著作权纠纷,愈加引发人们的猜测与众多媒体的关注。  一、一本人体艺术写真集的出版2 0 0 2年9月一本名为《汤加丽人体艺术写真》的摄影图集摆在了新华书店书架上,它的出现在经历了十几年开放之风吹…  相似文献   

6.
语言词典应当标注词性我们主张,语言词典应当标注词性。倘使是科技词典或者是百科大全之类,自然不必标注每一个条目词的词性;假使是小学生识字教学参考用的小型词典当然也大可不必去作词性标注;但是,作为一本大中型语言词典,那么它就需要加注词性,以供读者查检,因...  相似文献   

7.
《四库全书总目》于《崇文总目》一书下标注其底本为"《永乐大典》本",后来学者多信其说,误以为《四库全书》本《崇文总目》为从《永乐大典》中所辑出。本文根据提要及翁方纲提要分纂稿等材料证明《四库》本《崇文总目》为主要从《欧阳修集》和《文献通考》辑出,与《永乐大典》并无太大关系,翁方纲当时也并不认为其辑本为"《永乐大典》本",今本《总目》标注当为失误。  相似文献   

8.
主题自动提取对于专利文献的信息挖掘具有重要的意义。引入语义角色标注信息来辅助自动提取专利文献主题,区别于已有的专利文本分析平台所采用的人工标注或模板方式。为了改善专利文献的语义角色标注,首先描述将专利文献长句自动拆分成简化句的方法;其次,对简化句进行语义角色标注;最后,综合利用简化句语义信息以及自建带语义框架的常用词表,对专利文献进行主题信息抽取,获得必要信息,从而证实本研究的实用价值。  相似文献   

9.
本论文针对日本免费纸的整个体系进行了系统梳理。包括免费纸的形态、运作模式、当前规模、发展趋势、协调管理机构等 ,并辅之以相关个案进行具体介绍。同时 ,该文对中国传媒业有可能从中获取的借鉴也提出自己的观点  相似文献   

10.
随着Web网页数量的爆炸式增长和网页噪声不断增多,网上获取重要信息变得越来越困难.本文从一个新的角度,提出了一种基于自然标注的网页信息抽取方法.依据这种方法,首先对网页进行聚类,提取具有相似结构的网页并进行相同的标注,然后采用SVM对抽取项进行训练,最后提取到需要抽取的数据.文章的主要贡献在于对网页中的自然标注进行分析和发现,给出了九大类自然标注的例子,并结合聚类和支持向量机,给出了训练方法.从实验结果上看,本方法优于其他方法.  相似文献   

11.
古籍数字化整理是推动我国汉语古籍数据库建设及相关资源整合和利用的基础性工作。作为关键的技术环节之一,面向古籍命名实体的自动化抽取备受国内外学界和业界的关注。但是一些制约汉语古籍实体抽取方法的“卡脖子”问题仍未得到有效解决,包括少样本学习问题、标注成本管理问题和数据质量控制问题。本研究提出了一个面向古籍资源命名实体自动化抽取的通用框架——HanNER,包括“基于规则的实体预标注”“基于深度主动学习的迭代实体抽取”以及“人机交互模式下的标注决策”三个主要部分。多组实验比较证明了HanNER的可行性和优势,包括基于深度主动学习模型CNN-BiLSTM-CRF+margin的优势、多功能标注模块“标注查询”与“自动推荐”的积极作用以及ZenCrowd-II算法的优势。最后,本研究基于优化后的BERT-CNN-BiLSTM-CRF模型开发了在线的汉语古籍的实体自动抽取系统。HanNER的提出有利于推进汉语古籍实体抽取工作及相关任务在方法与技术上的发展,而且从工程化角度为古籍实体抽取产品的落地提供了借鉴和启发。  相似文献   

12.
一、吴炎(1152—1221年) 吴炎字济之,号若峰,邵武人。宋绍熙四年(1193)刻印《东莱先生标注三苏文集》,为吕祖谦标注。三苏文集分别为苏洵《老泉集》、苏轼《东坡集》、苏辙《颖滨集》。其中《东莱标注老泉先生文集》十二卷,今北京图书馆存。  相似文献   

13.
针对现有语义标注系统通用性差的问题,本研究设计了基于先导词算法的MARTT语义标注系统。MARTT利用有监督的机器学习方法从文本中提取领域规则,以适应不同的数据集。为了检验算法的效率,研究以中国植物志和北美植物志数据为样本,运用十折交叉论证方法与NB、SVM的标注性能进行了比较。结果表明,先导词算法在准确率、召回率及计算成本上均优于其它两种算法。而且,在两个不同的数据集上都获得了理想的结果,证实MARTT所具有的良好适应性。  相似文献   

14.
南宋楼昉所编《崇古文诀》全称为《迂斋先生标注崇古文诀》,又称《迂斋古文标注》,是一部重要的古文选本。楼昉先后编有五卷本、二十卷本、三十五卷本三种,《四库全书总目》卷一八七《崇古文诀》提要云:"此书篇目较备,繁简得中,尤有裨于学者。"流传下来的即这三种不同的版本系统。  相似文献   

15.
《新闻知识》2007,(8):7-7
本刊讯由华商报业管委会策划的华商报业两本图书《能走多远由你决定》、《近些再近些》今年6月正式出版。这两本图书集纳整合了华商报业旗下《华商报》  相似文献   

16.
在现有文献中语义标注描述的基础上,对语义标注的内涵和特征进行阐述,给出了语义标注的定义,论述了语义标注与网络标注的差异,分析了语义标注的主要特点;通过文献计量分析法分别从文献的年代分布、期刊来源分布、关键词分布三个方面的统计结果出发进行语义标注的研究现状分析,进而发现当前语义标注研究的侧重点;最后探讨了语义标注未来研究的发展趋势。  相似文献   

17.
用户标注具有简洁、交流与共享、自由表达、推荐与检索等特点,但是它的平面结构使其很难适应语义网的需要,因而有必要进行语义建构,建立用户标注模型和语义联系,以便使用元数据与本体语言对用户标注进行语义描述,使之成为标签本体,以适应新一代因特网的发展。  相似文献   

18.
一本图书,如在审美和市场两方面都取得不错的表现,方可称之为好书。但"好"的同时,总觉得单调了些,如能因这"好"书引起大家热议,口耳相传乃至泛文化效应,这便是一种"热"。由"好"到"热",实属不易。本刊所选取的2012热书,题材涵盖方方面面,有弘扬主旋律、有家常巷尾的诉说、也有关乎儿童成长的心灵鸡汤……总之,这些图书在某一方面或显或隐影响了2012年之中国书业。本刊选取之图书,无在意建树、立言,但也是一家之鸣,力争给众声喧哗的2012中国书业一种参考、一种警惕,甚至一种思考。  相似文献   

19.
本研究从<中国植物志>中随机采集1000个文档作为数据集,采用基于先导词的朴素贝叶斯算法实现中文物种描述文本的自动语义标注.通过实验性研究,实验数据表明,先导词能够有效提升朴素贝叶斯的标注效率.采用先导词后,F平均值提高0 048~0 107,尤以Fr为2时效果最好,整体标注性能F平均值高达0 902.各元素的标注性能也较为理想.Fr分别取1、2、3时,大部分元素的F值为0 730~0 964.  相似文献   

20.
《档案与史学》2004,(1):22-30
1、三业公会小组委员会[1]议事记要(1949年5月27日) 一、陈朵如[2]先生报告:五月廿四日晚国军开始撤退,廿五日市区交通阻隔,发生军事行动,各业停市,至昨日仍无法营业.因此曾与王志莘、项叔翔、沈日新、蔡松甫、孙俶仁诸君设法晤面,商定银钱业本日复业,上午十时至十二时止.惟以交换所地位犹在警戒区域,只可暂以现钞收付,不交换票据.特将经过提出报告,商定明日廿八银钱业营业时间及办法,仍照本日同样办理,即在各报刊载新闻.惟各行庄内部须互为关照,注意下列数项:政府机关与国营事业机构存款之提取,保管箱之开启,以及仓库寄托物之取去.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号