首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 62 毫秒
1.
Web页面中文文本主题的自动提取研究   总被引:14,自引:1,他引:13  
韩客松  王永成  滕伟 《情报学报》2001,20(2):217-223
Internet上的内容日益增多 ,搜索引擎返回的结果往往冗长。本文首先讨论Web页面文本与一般文本的四个不同点 ,然后介绍一种以统计方法为主、以匹配校验为辅的Web页面中文文本主题自动提取方法 ,它能帮助用户在最短时间内了解当前页面的主题。实验显示 ,所提取的前15个字串 ,反映主题的平均正确率在 85%以上 ,而处理时间仅为几十到几百毫秒。  相似文献   

2.
一、模板处理应用在数字化图书馆中 模板处理是信息抽取过程中的一种特殊技巧,它涉及自然语言的处理方法NLP(Natu-ral Language Process),利用自然语言的优势,先将图像、声音等多媒体信息的内容用文字进行确切的描述,揭示其内在的各种语义相关性、时空关联性,形成描述性的自由文本,然后直接从数据的正文中抽取数据或者从包含数据的文本中形成可识别模式,再从中抽取信息.  相似文献   

3.
基于深度标引的专利文本挖掘框架研究   总被引:1,自引:1,他引:0  
专利文献中的文摘、权利要求项、全文等文本信息蕴涵了重要技术细节和技术保护等内容,从这些专利文本内容中挖掘具有技术价值、商业价值的潜在信息是当前专利信息应用领域的研究热点.文章研究将面向分析目标的专利文本深度标引应用到专利文本挖掘中,在数据预处理阶段就将分析目标作为知识抽取的基础,专利分析人员可依据分析需求,在文本挖掘时只提取标引结果的某一部分进行分析和处理,这不仅可提高专利文本挖掘的数据预处理质量,也可提高后期文本分析的效率.该文为<数字图书馆论坛>2008年第11期本期话题"科技创新中的专利应用研究"的文章之一.  相似文献   

4.
论新闻价值实现的层次性   总被引:3,自引:0,他引:3  
新闻价值实现的层次性是从新闻文本内容的纵向结构出发来揭示价值实现的特点。新闻文本对于一定的接受主体来说 ,可以实现三个层次的价值 :一是表层价值 ,它的核心在于实现对接受主体对最新事态信息的需求 ;二是内层价值 ,它的核心在于满足接受主体对蕴涵于文本之中的情态信息的体验 ;三是深层价值 ,它的核心在于满足接受主体对文本象征信息、意态信息的理知需求  相似文献   

5.
随着专利数据量的激增和新技术领域的交错重叠,迫切需要在专利信息分析中深化到内容层次,内容挖掘是其中的重要途径和必要手段。借鉴文本内容挖掘的思想和技术,提出基于内容挖掘的专利信息分析的方法体系,分别阐述方法体系中包含的专利文本信息预处理、专利信息内容分析和专利信息知识处理过程的主要步骤及其涉及到的各种技术和算法。最后,以混合动力汽车领域专利信息的内容挖掘为例进行实证研究。  相似文献   

6.
文本转换与时代转变及社会发展同步,势在必然。只要出版人勇于进取,大胆开拓,与时俱进,就能在出版文本转换的过程中有所作为,取得成就。文本转换也是一个系统工程,它涉及到文本所包含的内容和形式的各个方面与各个环节,出版人只有踏踏实实地艰苦工作,才能不负历史所赋予我们的这一神圣使命。  相似文献   

7.
曹新虎 《军事记者》2006,(6):19-19,21
信息技术彻底改变了人们生产、生活的方式。信息成为推动社会发展和技术进步的巨大动力,信息的获取和传输已成为信息社会迅速发展不可缺少的手段。数字化是信息社会的基本特征之一,各种事物和指令转化为数字形式,能够方便地进行传输和控制。从通信到自动化操作,从传媒业发展到图书馆建设,数字技术已经渗透到我们社会生活的方方面面。数字报刊的应用人类知识的传承,因记录载体的演变发展而越来越便利多元。信息技术的发展,使得数字报刊应运而生。它利用现代信息技术对报刊内容的图像、文本、语言和数据库等多种媒体信息或指令进行加工和处理,…  相似文献   

8.
李莉 《编辑之友》2003,(3):40-42
一在我们从事编辑活动的过程中,可以发现一种可称之为“编辑图式的东西的客观存在。它不仅使编辑主客体两方面原有的认识以及实际的运作得到了提升,有时甚至超越了其意义的本身:它深入到作者文本内部模式后的创新,使原有的文本蕴涵更深刻,信息场更丰富;而将它引进到编辑的平台里,又使编辑活动在内容和形式两方面有了一个递进式提升;具体到编排内容与实际操作,使我们有了一个更广的视阈。我们说的“编辑图式,是借鉴了其他边缘学科的理论研究和方法,将它引入到我们的现代编辑学之中的。先来看看图式理论发展的简单的脉络:它是由哲学的概念而演…  相似文献   

9.
汉语文本结构的自动分析   总被引:5,自引:1,他引:4  
薛翠芳  郭炳炎 《情报学报》2000,19(4):319-325
本文试图运用向量空间模型来确定文本段落之间内容的相关性,从而实现文本主题的自动分析,找出构成文本大主题的各个小主题,从这些小主题入手来实现自动文摘,可为自动文摘技术探索一条新途径。另一方面,通过文本结构的自动分析,可确定文本结构的类型,也为全文检索等信息处理技术提供一些有用的信息。  相似文献   

10.
梁越 《编辑之友》2010,(11):57-58
<理解媒介>(商务印书馆2000年10版)是麦克卢汉的传播学巨著.书中麦克卢汉所谈的"媒介"并不是我们通常意义上的"媒体".这个"媒介"的范围更为广阔,它是一切延伸人类器官的工具、技术和活动.在麦克卢汉看来,媒介不仅是空洞的、消极的、静态的信息、知识、内容的载体,也是对信息、知识、内容具有强烈的反作用,且积极的、能动的信息.因此麦克卢汉首要的,也是最著名观点即是"媒介即信息." 这里的"信息"又不同于我们日常在媒体或生活中接收到的信息内容.无论是选择还是放弃,麦克卢汉都不以媒介文本作为考察的对象和内容,而是将媒介本身的特点、效用、影响力与其某些决定性因素当做观察对象.媒介或技术的信息,是由它引入的"人间事物的尺度变化、速度变化和模式变化".  相似文献   

11.
[目的/意义]从定量分析和定性分析两个方面对英文网络书评进行内容挖掘,形成一套基于信息分类的英文网络书评的内容挖掘方法体系,实现多文本书评的信息整合。[方法/过程]对书评文本中句子的分类方法、关键信息的提取方法、情感分类的方法以及内容的呈现方式等几方面进行实验和改进。[结果/结论]用户评价结果表明,本文所设计的内容挖掘方法所生成的书评信息摘要在生成质量和有用性两方面都有较好的表现。  相似文献   

12.
王萍  乔晓东  张玲 《情报学报》2007,26(3):456-463
知识经济时代,知识作为一种资源在企业中显得越来越重要。知识是信息的一部分,信息经过加工可以转化为知识。信息需求和知识需求实际上是统一的、一致的,都是解决实际问题而产生的需。目前,因特网已经成为当今世界上最大的信息资源库,也是最主要的信息传播渠道。搜索引擎(Search Engines)的出现,尽管在一定程度上增强了人们定位信息的能力,但它的搜索结果却很难让人满意。本系统综合应用计算机网络技术、计算软件开发技术、现代汉语处理等技术,实现对科技类WWW文本信息的有效管理和信息高效应用。即能对采集来的WWW文本信息进行知识化处理并进而实现个性化知识服务的系统,以实规将提升信息为知识,并使之为信息用户所使用,依此改善信息使用现状。  相似文献   

13.
浅谈隐性广告的境界   总被引:1,自引:0,他引:1  
赵素欣 《今传媒》2007,(2):43-44
隐性广告,或称"植入式、嵌入式广告",之所以被冠以"隐性",主要指它隐藏于载体并和载体融为一体,共同构成了受众所真实感受到或通过幻想所感知到的场景的一部分,以非广告的形式在受众无意识的状态下,将商品或品牌信息不知不觉展露给受众(消费者).(1)隐性广告具有普遍的适应性,只要处理得当,可以嵌入任何情景和文本,其中最常见也最引人关注的是电影作品、电视节目中的隐性广告.  相似文献   

14.
张丽  张蕾  张阳  戢妍 《信息系统工程》2011,(7):71-73,43
网上书店除了提供品类繁多的图书外,还为读者呈现出丰富的在线评论。如何从海量书评中提取对网上书店、出版社或消费者有用的信息成为一个亟待研究的问题。通过自然语言处理的工具之一中文分词技术对图书在线评论的文本内容进行处理,基于词频统计结果提取文本关键词,从而发现读者阅读特征、评论关键要素等有价值的信息。进而以当当网的14197条图书在线评论为例,运用该文本分析方法,以评论标题和评论正文内容、图书种类、所有评论和有用评论三个维度对文本进行了比较分析。  相似文献   

15.
基于机器学习的文本自动分类研究进展   总被引:6,自引:0,他引:6  
张雪英 《情报学报》2006,25(6):730-739
文本自动分类是目前最常用的文本信息自动处理技术,也是机器学习、自然语言处理和信息检索领域的研究热点之一。本文比较全面、深入地论述了基于机器学习的文本自动分类所涉及的相关问题及解决方法,并提出了当前该领域面临的主要研究问题。  相似文献   

16.
基于因特网信息的挖掘与评价研究   总被引:2,自引:0,他引:2  
基于因特网信息的挖掘和评价,是网络信息服务领域中的新课题,本文概述了目前网上基于Push技术、WWW文本信息的挖掘技术、联机分析处理的信息挖掘等三种技术的内容,并就其挖掘信息评价提出定性、定量的标准。  相似文献   

17.
文本数字水印可用于文本电子文档的版权保护领域,它是信息隐藏技术的重要研究方向。本文提出一种基于人眼视觉冗余的文本数字水印算法.根据人眼对细微的颜色变化不敏感这一特性,提出了通过改变文本字符RGB颜色分量的低四位来嵌入水印信息。该算法具有较好的隐蔽性和鲁棒性,能够抵抗文本删除、修改等攻击,实验证明只要保留文档原始内容中的连续N/8.6(N为待嵌入的水印信息位数)个字符,利用该算法就能够提取出完整的水印信息.  相似文献   

18.
所谓文物信息组织,亦称文物信息资源组织,是根据信息检索的需要,以文本和各种文物信息资源为对象,通过对其内容特征等的分析、选择、标引、处理,使其成为有序化集合的过程。文物信息组织的目的是建立文物信息资源收藏系统和检索工具,方便  相似文献   

19.
《中国传媒科技》2004,(5):59-60
<正> TRS中文知识管理工具包(TRSCKM)是国内外首推的实用化中文文本挖掘产品,它突破了文本处理机械匹配的基本模式,实现了智能化的信息处理,可有效解决目前普遍存在的信息过量、信息丢失、信息无关等问题。TRS CKM集成了TRS公司最新推出的多项中文智能处理技术,为中文文本挖掘应用提供开放的开发工具箱。  相似文献   

20.
阅读很多优秀的新闻典型报道 ,笔者深深地为其字里行间所流淌的真情实感 ,其意识深处所蕴涵的哲理情趣 ,其文本肌理所折射的审美意境所感染。这一系列情感效应除了来自于文本本身的新闻价值外 ,还来自于文本情感化的叙事形式 ,来自于作者将笔触伸进人物心灵深处的情感世界 ,从而达到“情动而辞发”、“情动而言形”的审美情境。虽然情感不是新闻生命力的基石 ,但它却是新闻赖以生存的养料 ,它是沟通文本与受众的一种有效符码。“为情而造文”是致使文本产生情感效应的有效因素 ,作者对审美对象探赜索隐 ,对文本信息进行审美化的叙述 ,从而使…  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号