共查询到20条相似文献,搜索用时 203 毫秒
1.
乔建忠 《现代图书情报技术》2012,(6):9-16
为满足主题爬行器在线分类的轻量化设计要求,提出一种基于多项表示网络文档类型的统计特征实现网页按类型进行主题相关性判断的策略;借助WEKA提供的API,为该主题相关性判断策略设计相应的训练算法和分类算法。通过分类准确率、效率和特征选择实验,证明该主题相关性判断策略的有效性以及5项对类型识别起关键作用的统计特征。 相似文献
2.
3.
4.
针对主题爬行技术中的单一分类算法在面对多主题Web抓取和分类需求时泛化能力不强的局限,设计一种利用多种强分类算法形成的分类器组合,主题爬行器根据当前主题任务在线评估并为分类器排名,从中选择最优分类器分类的策略,并开展在多个主题抓取任务下的分类实验,比较每种分类算法的准确率和组合后的平均分类准确率以及对分类效率等评价指标的综合分析,结果证明该策略对领域局域性有所克服,普适性较强。 相似文献
5.
乔建忠 《现代图书情报技术》2011,(3):45-50
在总结主题爬行器的"真、假隧道"策略的基础上,提出一种解决"假隧道"问题的KBES算法。通过实验分析KBES算法能在一定程度上提高锚与链接文本在启发策略中预测新链接相关性的效率。 相似文献
6.
7.
8.
9.
基于LDA与新兴主题特征分析的新兴主题探测研究 总被引:1,自引:0,他引:1
本文尝试基于LDA主题模型探测文档集中的新兴主题.本文采用主题的新颖度、发文量指标,并引入被引量,得到新兴主题的特征指标,在此基础上对主题在进入成熟阶段前各个时期的特征进行了分析.并提出了针对上述新兴主题探测指标,基于LDA主题模型抽取文档的语义主题词,利用文档-主题矩阵建立主题和文档的映射,得到主题的新颖度指标和发文量指标、被引量指标,并形成新兴主题探测表格和探测曲线VDP,从而探测出新兴主题,并对新兴主题VDP与基线VDP距离的发展趋势进行预测,根据拟合的曲线对其进行分析,得到最值得关注的新兴主题. 相似文献
10.
[目的 /意义]提出一种潜在学科交叉主题识别方法,主要开展学科交叉主题识别与知识融合测度两方面的研究,以识别处于知识融合潜伏期和萌芽期的潜在学科交叉主题。[方法 /过程]首先,设计并提出学科关联实体抽取规则,构建基于学科关联实体的学科交叉潜力计算方法,以实现学科交叉主题识别,解决潜在交叉点识别的问题;其次,构建以融合强度、融合广度、融合深度为中心的学科交叉主题知识融合阶段特征测度指标与方法,以揭示知识融合过程;最后,基于交叉主题知识融合阶段特征与判断规则,识别处于潜伏期与萌芽期的潜在学科交叉主题。[结果 /结论 ]以合成生物学和水稻遗传改良领域为例,开展潜在学科交叉主题识别研究,以验证方法的可行性。结果表明,提出的方法能够识别学科领域之间的潜在交叉主题,为高效探测有潜力的学科交叉研究领域,发掘未来的研究发展动向和机会提供可能。 相似文献
11.
防网页篡改技术比较分析 总被引:5,自引:0,他引:5
电子政务建设中,各级政府网站在为公众提供了更为便利的政务服务的同时,也遭受着各种破坏活动的威胁,其中以篡改网页最为严重。文章比较了常见的防网页篡改技术的功能、特点、技术评估,分析了全新防网页篡改系统技术的功能、需求及其技术实现。 相似文献
12.
13.
14.
15.
16.
网络信息资源评价现状及构建研究 总被引:5,自引:0,他引:5
从定性评价、定量评价、综合评价和自动评价4个方面对当今网络信息资源评价的主要方法进行分析,指出其中存在的主要问题。利用已有的研究成果和针对这些问题,认为网络信息资源评价必须从网站的内部和外部特征出发,提出基于可用性工程的自动网站评价(系统信息)构建方案。 相似文献
17.
从定性评价、定量评价、综合评价和自动评价4个方面对当今网络信息资源评价的主要方法进行分析,指出其中存在的主要问题。利用已有的研究成果和针对这些问题,认为网络信息资源评价必须从网站的内部和外部特征出发,提出基于可用性工程的自动网站评价(系统信息)构建方案。 相似文献
18.
Web版分类法是基于WWW环境下的文献分类法 ,它是建立在Web站点上的文献分类体系 ,具有快捷的获取途径、数据更新及时、非线性超文本链接等特征。在《中图法》电子版的基础上 ,开发、研制《中图法》Web版是我国检索语言进入互联网 ,达到国际先进水平的重要标志。参考文献 5 相似文献
19.
图书馆自建专题特色数据库的实践研究——以“三坊七巷特色数据库”为例 总被引:1,自引:0,他引:1
三坊七巷数据库是基于福州地域资源、突出福州文化和建筑特色的数据库。数据来源于闽江学院的馆藏、网络免费资源、地方特色资源及出版商资源等方面。以电子全文图书资料、电子全文期刊、图片库和视频资料四种形式表现,展示福州古建筑、名人、民风民俗文化、特色老铺老店和其他综合信息,其标准化、检索功能、共享度有待加强,数据覆盖面尚需扩大。 相似文献
20.
Web2.O带给图书馆的机遇与挑战 总被引:6,自引:1,他引:6
介绍Web2.0的定义及相关技术,指出Web2.0具有交互性(参与性)、个性化、相关性和开放性的特点,探析它带给图书馆的机遇,包括服务观念的革新及工作新局面的开拓及挑战-可行性、馆员素质、版权等问题,并结合图书馆未来发展的趋势,提出Web2.0应用于图书馆的两点建议引入图书馆门户网站的共建机制与创建图书馆用户体验交流新模式. 相似文献