共查询到20条相似文献,搜索用时 15 毫秒
1.
为了提高海量新闻信息分类的效率,本文探索研究基于Transformer(转换器)模型和《中文新闻信息分类与代码》标准的自动分类标引,包括自动归类、聚类、检索标志的智能抽取,以及人工标引和自动标引的互相结合。Transformer模型训练数据特征效率更高,适应能力更强。基于标准的自动分类表更灵活,更高效,自动标引具有广泛的应用前景。 相似文献
2.
3.
我国新闻事业的飞速发展,新闻信息资料呈现急剧膨胀的态势。互联网的不断普及,使信息出现网络化、海量化、多元化、迅捷化的新特点,导致新闻信息资料的交流和共享日益迫切。面对海量增长的新闻信息,大家普遍感到查找有用的新闻信息资料越来越困难,迫切要求改变目前国内中文新闻资料分类标准不统一的状况,尽早制定全国统一的新闻资料分类标准,并在此基础上实现新闻信息的自动标引。 相似文献
4.
作为中国新闻界首次研制的中文新闻信息技术两项国家标准—《中文新闻信息置标语言》(以下简称CNML)、《中文新闻信息分类与代码》不仅为通讯社、报社、广播电台、电视台、互联网站以及新闻信息用户之间进行多媒体新闻信息的交换和共享提供了内容丰富的标准规范,而且在总结我国主要传媒机构新闻信息分类多年的实践经验, 相似文献
5.
用于中文信息自动分类的《中图法》知识库的构建 总被引:1,自引:0,他引:1
分类号、主题词、关键词是三种主题概念标识,三者之间存在着概念对应关系,即兼容关系。中文文献数据库中存在着大量的分类号与关键词(或主题词)对应的人工标引记录。通过对这些数据的加工整理,以《中图法》类目体系为主干组织各学科领域的语词,从而构建出反映分类号与语词概念对应关系的《中图法》知识库,用以实现信息的自动标引和自动分类。本文详细讨论了该知识库的构建原理、结构、编制使用的关键技术以及主要应用等。 相似文献
6.
《中文新闻信息分类标准》自2004年10月正式开始制订以来.历经初稿编制、征求意见、分类测试等阶段.经过反复论证修改,数易其稿,基本上形成了一部较为完善的分类体系及代码。作为我国第一部新闻信息分类标准,《中文新闻信息分类标准》(以下简称《标准》)虽然没有前车可鉴,也不能套用图书分类法的既成理论.但在具体编制过程中.遵照科学胜,实用性等原则,本课题形成了一套独有的理论依据。 相似文献
7.
8.
探讨我国网络新闻资源分类标引体系 总被引:2,自引:0,他引:2
目前我国还没有统一的网络新闻信息分类标准,各家媒体各自为政,造成了网络新闻信息系统的重复建设,资源浪费严重。多元的新闻信息标引体系,不利于软件商进行自动分类标引软件的开发,不利于新闻信息全面而准确的检索,不利于网络新闻资源系统的发展,更不利于用户对新闻信息资源的使用。研究并制订统一规范的网络新闻信息分类标引体系,是当务之急。 相似文献
9.
在课题组成员的齐心努力下,《中文新闻信息分类标准》(以下简称《标准》)研制工作即将进入定稿验收、交付送审阶段。从2004年10月中下旬开始进行课题项目的研制,到目前《标准》草案已逐渐形成比较完善的分类体系,这是经过了反复征求意见、推敲论证、测试比较、补充修改的结果。在《标准》具体编制工作中,课题组形成了独有的研制思路与方法, 相似文献
10.
基于知识库的网页自动标引和自动分类系统的设计 总被引:15,自引:0,他引:15
针对中文网页文本信息特征,提出了信息标引和组织方案,并构建了一个基于知识库的网页自动标引和自动分类系统。中文网页的自动标引和自动分类思想主要基于知识库进行。知识库实际上是一个基于《中图法》的专家知识系统,包括了中图法库、汉表库、分类号主题词对应库、同义词库、关键词库等若干数据库。在确定网页基本信息标引源的基础上,中文网页主题标引运用了基于词频的统计加权法;通过与分类号一主题词对应库主题词串的词面相似度计算,进一步完成中文网页的分类标引。最后还讨论了新词识别等技术问题。 相似文献
11.
12.
10月23——24日,“中文新闻信息分类标准”课题组在北京召开”中文新闻信息分类标准”专家咨询研讨会,邀请了来自国家标准化管理委员会审查部、国家信息中心(中国经济信息网)、武汉大学信息管理系、北京市信息资源管理中心、北大方正等信息管理、标准研究方面的专家,征求他们对“新闻信息分类标准”研制的意见和建议,分类标准课题组成员与专家们进行了充分交流。 相似文献
13.
《中文新闻信息分类》在课题组成员的通力协作下,已编制完成,进入定稿验收、交付送审阶段。作为课题组成员,本文就《中文新闻信息分类》(以下简称《标准》)中“文化、娱乐休闲”、“文学、艺术”和“传媒业”三类的类目设置及其思路加以阐释。 相似文献
14.
Factiva新闻分类标引体系及其对我国的启示 总被引:1,自引:0,他引:1
目前,我国还没有统一的新闻分类标准,这将有碍于我国新闻编辑工作和数据库建设的开展,因为标准化、国际化和科学化的分类标准,是编辑处理庞大新闻信息资源,开发各种自动分类和标引软件,进而组织多媒体数据库的基础。笔者认为,全面规划,统一协调,借鉴国外成果,结合中国国情,才能形成有中国特色的新闻信息分类体系。本文介绍国外新闻分类成果之一——Factiva分类标引体系,并提出其对我国新闻信息分类法编制工作的几点启示。 相似文献
15.
继《中国评论通讯社》率先采用“中文新闻信启、置标语言”之后,《广西日报集团》又成为第一家采用“中文新闻信息分类与代码”的新闻媒体,从而揭开了我国新闻界推广应用中文新闻信息技术国家标准的序幕。[第一段] 相似文献
16.
本文论述网络环境下中文网页信息的自动标引技术,具体研究分析了面向信息检索的自动分词与词表技术,提出了一个中文网页自动标引的改进方案,以更好地实现中文网络信息资源的自动处理,最后从文档到知识转变的视角,研究第三代网页内容搜索中应用中文信息自动标引的技术问题。 相似文献
17.
2006年5月《中文新闻信息分类与代码》标准(以下简称《标准》)正式颁布实施,这是对新闻信息的主题、体裁、地区、人物等内容特征的标识的规范,也是检索新闻信启、的工具。迫于工作需要,广西日报首家在新闻信息数据库和历年广西日报电子版中全面应用了该标准,由于没有经验可借鉴,在实施的过程中也遇到一些困难。这里主要谈谈所遇到的问题及其解决的对策。 相似文献
18.
19.
20.
“中文新闻信息置标语言标准(CNML)”和“中文新闻信息分类与代码标准”两项国家标准颁布至今已3年。期间,在各参与媒体及相关单位的团结协作下,标准贯彻实施,并为加快新闻行业标准化,推动新闻行业产业升级起到了积极作用。 相似文献