首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 203 毫秒
1.
为满足主题爬行器在线分类的轻量化设计要求,提出一种基于多项表示网络文档类型的统计特征实现网页按类型进行主题相关性判断的策略;借助WEKA提供的API,为该主题相关性判断策略设计相应的训练算法和分类算法。通过分类准确率、效率和特征选择实验,证明该主题相关性判断策略的有效性以及5项对类型识别起关键作用的统计特征。  相似文献   

2.
乔建忠 《图书情报工作》2011,55(13):108-146
主题爬行技术的应用领域不断扩大,但对主题的界定并无统一的标准。从需求的角度将现有主题爬行技术分为三种基本类型:面向内容的、面向类型的和面向网站的,分别论述它们的关键技术和典型案例。最后提出一种将各需求统一在一个框架内的组合爬行技术简称DDCFC,简要描述其定义和逻辑架构。  相似文献   

3.
主题爬行是专业搜索引擎的基础,爬行策略与爬行算法是主题爬行技术的核心,通过分析主题爬行的基本原理,对爬行策略与爬行算法进行分类比较,展示爬行策略与爬行算法的研究进展及当前研究热点,为主题爬行技术的进一步研究提供参考。  相似文献   

4.
乔建忠 《图书情报工作》2013,57(14):114-120
针对主题爬行技术中的单一分类算法在面对多主题Web抓取和分类需求时泛化能力不强的局限,设计一种利用多种强分类算法形成的分类器组合,主题爬行器根据当前主题任务在线评估并为分类器排名,从中选择最优分类器分类的策略,并开展在多个主题抓取任务下的分类实验,比较每种分类算法的准确率和组合后的平均分类准确率以及对分类效率等评价指标的综合分析,结果证明该策略对领域局域性有所克服,普适性较强。  相似文献   

5.
在总结主题爬行器的"真、假隧道"策略的基础上,提出一种解决"假隧道"问题的KBES算法。通过实验分析KBES算法能在一定程度上提高锚与链接文本在启发策略中预测新链接相关性的效率。  相似文献   

6.
微博主题发现研究方法述评   总被引:2,自引:1,他引:1  
[目的/意义]对现有微博主题发现的研究文献进行全面的梳理和评述,为研究人员深入开展相关研究提供借鉴。[方法/过程]针对传统的主题发现的基本原理和主要研究方法,分析微博文本的组织特征,从基于短文本特征和基于非文本特征的这两个角度对微博主题发现方法进行梳理,并对两类方法进行详细的阐述及特点分析,最后对微博主题发现研究的发展趋势进行展望。[结果/结论]目前微博主题发现的研究还处于探索阶段,未来应该继续深化理论探索、创新研究方法。  相似文献   

7.
在分析文献在不同研究阶段用词时间特征的倾向性基础上,提出一种基于主题模型的研究发展阶段识别方法。重点阐述该方法的构建过程,包括时间特征抽取、发展阶段界定、主题冷热变化分析等步骤。为验证该方法的有效性,针对词频统计法和主题模型方法在主题演化分析中的效果进行比较分析。结果表明,该方法能在识别主题热点和发展趋势的同时,有效地区分不同主题所反映的研究发展阶段。  相似文献   

8.
《新闻界》2016,(18)
在广告理论研究中,广告主题应该成为广告内容研究的重要内容,但是学术界对其缺乏足够的关注和深入的探究。本文通过对广告主题的界定以及广告主题研究现状的探析,结合广告发展历史的回顾,对不同时期广告主题内容及特征的表现进行探究。依据四个不同时期将其分为四种广告主题类型,这四种不同类型的广告主题,彼此联系相互融合,在企业发展的不同阶段,对广告传播策略的制定和广告理论的完善具有重要的指导意义。  相似文献   

9.
基于LDA与新兴主题特征分析的新兴主题探测研究   总被引:1,自引:0,他引:1  
本文尝试基于LDA主题模型探测文档集中的新兴主题.本文采用主题的新颖度、发文量指标,并引入被引量,得到新兴主题的特征指标,在此基础上对主题在进入成熟阶段前各个时期的特征进行了分析.并提出了针对上述新兴主题探测指标,基于LDA主题模型抽取文档的语义主题词,利用文档-主题矩阵建立主题和文档的映射,得到主题的新颖度指标和发文量指标、被引量指标,并形成新兴主题探测表格和探测曲线VDP,从而探测出新兴主题,并对新兴主题VDP与基线VDP距离的发展趋势进行预测,根据拟合的曲线对其进行分析,得到最值得关注的新兴主题.  相似文献   

10.
[目的 /意义]提出一种潜在学科交叉主题识别方法,主要开展学科交叉主题识别与知识融合测度两方面的研究,以识别处于知识融合潜伏期和萌芽期的潜在学科交叉主题。[方法 /过程]首先,设计并提出学科关联实体抽取规则,构建基于学科关联实体的学科交叉潜力计算方法,以实现学科交叉主题识别,解决潜在交叉点识别的问题;其次,构建以融合强度、融合广度、融合深度为中心的学科交叉主题知识融合阶段特征测度指标与方法,以揭示知识融合过程;最后,基于交叉主题知识融合阶段特征与判断规则,识别处于潜伏期与萌芽期的潜在学科交叉主题。[结果 /结论 ]以合成生物学和水稻遗传改良领域为例,开展潜在学科交叉主题识别研究,以验证方法的可行性。结果表明,提出的方法能够识别学科领域之间的潜在交叉主题,为高效探测有潜力的学科交叉研究领域,发掘未来的研究发展动向和机会提供可能。  相似文献   

11.
防网页篡改技术比较分析   总被引:5,自引:0,他引:5  
电子政务建设中,各级政府网站在为公众提供了更为便利的政务服务的同时,也遭受着各种破坏活动的威胁,其中以篡改网页最为严重。文章比较了常见的防网页篡改技术的功能、特点、技术评估,分析了全新防网页篡改系统技术的功能、需求及其技术实现。  相似文献   

12.
13.
隐蔽网络及应对策略研究   总被引:8,自引:0,他引:8  
袁顺波 《图书馆论坛》2005,25(5):189-191,247
阐述了隐蔽网络的概念及特点,并在此基础上分析了隐蔽网络不可见的原因,最后提出了有效检索、利用隐蔽网络的应对策略。  相似文献   

14.
选择2003-2007年间我国四种图书情报类核心期刊的998篇论文作为数据源,对网络引文总数、篇平均网络引文量、域名分类和作者情况等特征量进行统计分析,研究我国图书情报学界对网络学术信息资源的利用情况。  相似文献   

15.
认为知识管理是各种社会组织获取竞争优势的一个极其关键的因素,而信息技术的不断发展成为知识管理创新的核心因素。首先分析用户对现有知识管理系统不满意的原因,认为搜索限制、缺乏整合和功能的不方便是用户对系统质量不满意的关键点;另一方面,知识的冗余、残缺以及虚假知识的堆积是用户对知识质量不满意的关键因素;然后,通过对语义Web的分析,提出利用语义Web的相关技术来克服目前知识管理系统的缺点,进而提高知识管理系统的质量和效率。  相似文献   

16.
网络信息资源评价现状及构建研究   总被引:5,自引:0,他引:5  
刘记  沈祥兴 《图书情报工作》2006,50(12):88-91,43
从定性评价、定量评价、综合评价和自动评价4个方面对当今网络信息资源评价的主要方法进行分析,指出其中存在的主要问题。利用已有的研究成果和针对这些问题,认为网络信息资源评价必须从网站的内部和外部特征出发,提出基于可用性工程的自动网站评价(系统信息)构建方案。  相似文献   

17.
从定性评价、定量评价、综合评价和自动评价4个方面对当今网络信息资源评价的主要方法进行分析,指出其中存在的主要问题。利用已有的研究成果和针对这些问题,认为网络信息资源评价必须从网站的内部和外部特征出发,提出基于可用性工程的自动网站评价(系统信息)构建方案。  相似文献   

18.
论我国Web版分类法的研制开发   总被引:3,自引:0,他引:3       下载免费PDF全文
Web版分类法是基于WWW环境下的文献分类法 ,它是建立在Web站点上的文献分类体系 ,具有快捷的获取途径、数据更新及时、非线性超文本链接等特征。在《中图法》电子版的基础上 ,开发、研制《中图法》Web版是我国检索语言进入互联网 ,达到国际先进水平的重要标志。参考文献 5  相似文献   

19.
三坊七巷数据库是基于福州地域资源、突出福州文化和建筑特色的数据库。数据来源于闽江学院的馆藏、网络免费资源、地方特色资源及出版商资源等方面。以电子全文图书资料、电子全文期刊、图片库和视频资料四种形式表现,展示福州古建筑、名人、民风民俗文化、特色老铺老店和其他综合信息,其标准化、检索功能、共享度有待加强,数据覆盖面尚需扩大。  相似文献   

20.
Web2.O带给图书馆的机遇与挑战   总被引:6,自引:1,他引:6  
何韵 《图书情报工作》2006,50(9):136-139
介绍Web2.0的定义及相关技术,指出Web2.0具有交互性(参与性)、个性化、相关性和开放性的特点,探析它带给图书馆的机遇,包括服务观念的革新及工作新局面的开拓及挑战-可行性、馆员素质、版权等问题,并结合图书馆未来发展的趋势,提出Web2.0应用于图书馆的两点建议引入图书馆门户网站的共建机制与创建图书馆用户体验交流新模式.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号