首页 | 本学科首页   官方微博 | 高级检索  
文章检索
  按 检索   检索词:      
出版年份:   被引次数:   他引次数: 提示:输入*表示无穷大
  收费全文   5篇
  免费   0篇
教育   5篇
  2015年   1篇
  2011年   3篇
  2008年   1篇
排序方式: 共有5条查询结果,搜索用时 0 毫秒
1
1.
讨论了网页分类过程中数据预处理的相关技术,提出一种网页预处理方法,将网页解析为DOM树结构,通过分析、整理,得到噪音信息的特征,并依据判定规则,找出噪音信息并删除处理。网页去噪后,提取页面中的文本信息和每个相关链接目标URL、源URL及锚文本并存入数据库。实验结果证明,该去噪方法可以有效去除网页噪音,利用所提取的超链接结构信息分类网页,可以有效提高分类精度。  相似文献   
2.
根据"数据结构"课程特点,结合学生已具备的相关专业理论基础、学习能力以及地方发展对计算机人才的需求等因素,认真甄选教学内容、精心设计教学方案,并采用多种形式组织开展教学活动,进行基于实际应用的"数据结构"课程教学改革尝试,取得较好的教学效果.  相似文献   
3.
为了解决传统推荐算法在面临海量数据时出现的内存与速度问题,文章通过对二部图推荐算法进行系统分析,提出MapReduce的加权二部图推荐算法,并将其部署在由4台机器组成的hadoop集群上进行测试.在数据集MovieLens上的实验表明,该算法较好解决了传统推荐算法遇到的瓶颈问题,具有较好的加速比和良好的扩展性.  相似文献   
4.
介绍了中文网页分类的概念和过程,分析比较了中文网页分类的主要方法和关键技术,简述了实验数据集和实验方法,并讨论了网页分类研究存在的问题和未来的研究方向.  相似文献   
5.
基于Web超链接结构信息的网页分类技术研究   总被引:1,自引:0,他引:1  
充分利用相邻网页(包括链人和链出)的相关信息,提出一种基于Web超链接结构信息的网页分类改进方法.其方法分为5步:(1)预处理训练集,提取文本信息和超链接结构信息;(2)抽取特征向量和训练一个Web页面的全文本分类器;(3)根据网页的各个人口的锚点文本和扩展锚点文本创建虚文档,用虚文档代替Web页面全文本训练一个虚文档分类器;(4)利用Naive Bayes方法协调两个分类器得到初步分类结果;(5)利用链出网页对初步分类结果进行修正,得到最终分类结果.根据改进方法实现了网页自动分类原型系统,并进行分类实验,实验表明该方法有效提高了分类性能.  相似文献   
1
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号