首页 | 本学科首页   官方微博 | 高级检索  
文章检索
  按 检索   检索词:      
出版年份:   被引次数:   他引次数: 提示:输入*表示无穷大
  收费全文   3篇
  免费   0篇
科学研究   2篇
信息传播   1篇
  2013年   1篇
  2012年   1篇
  2011年   1篇
排序方式: 共有3条查询结果,搜索用时 140 毫秒
1
1.
以净化网页、提取网页主题内容为目标,提出一个基于网页规划布局的网页主题内容抽取算法。该算法依据原始网页的规划布局,通过构造标签树为网页分块分类,进而通过计算内容块的主题相关度,辨别网页主题,剔除不相关信息,提取网页主题内容。实验表明,算法适用于主题型网页的“去噪”及内容提取,具体应用中有较理想的表现。  相似文献   
2.
为了更好地挖掘和利用微博中的信息,设计了基于信号分析方法的微博信息分析系统,并探讨了具体的实现方法.该系统具有微博信息收集、信号辨识、信号解读等功能,系统输出结果具有多方面的应用价值.这一系统被应用到电影票房领域进行实证研究,发现电影相关微博数量与电影票房存在相关性,体现了微博信息的预测作用.此外,通过挖掘微博内容还能够分析网民的关注点和态度变化.研究结果表明,微博信息具有很高的应用价值,本文设计的专用信息分析系统可以有效地对其进行深入挖掘.  相似文献   
3.
本篇论文以去除网页噪声,整合网页内容为目标,提出了面向主题型网页,根据网页规划布局抽取网页内容的方法.算法首先分析原始网页的DOM结构生成标签树,再根据标签分类和对应节点的信息对标签树自底向上进行划分,并依据划分块的文字密度,链接密度及图片密度,分类信息块.进一步,提炼网页主题的文本特征向量,采用基于词条空间的文本相似度计算,获取划分块的主题相关度,以主题相关度为量化基准剔除噪声,识别网页主旨内容,重构页面描述.这一算法被应用于面向人才资讯的信息采集项目中,实验表明,算法适用于主题型网页的"去噪"及内容提取,具体应用中有较理想的表现.  相似文献   
1
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号