首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 357 毫秒
1.
基于Web挖掘的个性化服务研究   总被引:8,自引:0,他引:8  
论述了基于Web挖掘的个性化服务研究,提出了利用Web挖掘方法的个性化服务研究中的用户聚类、Web页面聚类、用户频繁访问路径发现算法及用户访问路径优化算法。利用这些算法得到的个性化信息可以准确把握用户兴趣模式并对Web信息资源的组织方式进行有效更新,从而提高网络信息服务效率,为用户提供“一对一”的具备自适应性的智能个性化服务。  相似文献   

2.
随着信息技术和Web技术的发展,如何从海量的Web文本信息中找到自己所需信息已成为一个重要的研究领域。在众多信息获取方法中,聚类技术是一种被广泛应用的方法。总结了文本聚类算法的研究现状,比较了算法的主要差异和整体思想,并分析了各种方法的优劣,同时指出了文本聚类研究今后的发展趋势,即在粒子群聚类过程中融入其它传统聚类方法的思想,以提高聚类性能。  相似文献   

3.
综合用户背景与资源特点,基于用户的协同过滤更适合高校图书馆在信息推荐中的应用。对其由于馆藏数字资源空间增大而导致推荐系统性能下降以及数据稀疏性问题,提出一种用户意图聚类的方法。通过运用K—means算法,对资源类别的意图特征值相似用户进行聚类,来提高推荐的实时性,降低数据稀疏性对信息推荐造成的影响。实验结果表明,基于用户意图聚类的协同过滤算法能有效提高推荐质量。  相似文献   

4.
利用话题识别技术将Blog文本信息按照所表达的话题进行归类和组织,可以使Blog信息更加有效、准确地为用户使用。文章重点研究话题识别模型中的词频,权重计算以及相似度计算,对聚类算法有简单的实现并通过该实验对聚类算法有了更深层次的认识。  相似文献   

5.
基于多因素方差分析的文本向量特征挖掘算法   总被引:2,自引:0,他引:2  
文本向量特征挖掘应用于信息资源组织和管理领域,在大数据挖掘领域具有较大应用价值,传统算法精度不好。提出一种基于多因素方差分析的文本向量特征挖掘算法。使用多因素方差分析方法得到多种语料库的特征挖掘规律,结合蚁群算法,根据蚁群适应度概率正则训练迁移法则,得到种群进化最近时刻获得的数据集有效特征概率最大值,基于最优划分的K-means初始聚类中心选取算法,先对数据样本进行划分,然后根据样本分布特点来确定初始聚类中心,提高文本特征挖掘性能。仿真结果表明,该算法提高了文本向量特征的聚类效果,进而提高了特征挖掘性能,具有较高的数据特征召回率和检测率,时间耗时较少,在数据挖掘等领域应用价值较大。  相似文献   

6.
刘国营 《情报杂志》2005,24(7):18-19,23
通过用户访问事务的方式将用户访问Web站点行为进行形式化描述。进一步给出了兴趣度、相似度、聚类中心的定义。提出了基于ISODATA算法的路径聚类方法。并通过对某实际网站Web日志文件进行分析实验,结果表明该方法不但能够发现群体用户访问模式,而且还能得到较为合理的模式聚类个数。  相似文献   

7.
文章以Web网站站点结构优化为目标,针对用户的Web日志数据采用K-均值聚类算法实现对该网站用户的聚类和该网站页面的分析,将具有相似属性和相似浏览模式的用户分为一组,通过聚类发现该类用户的访问兴趣和爱好,通过调整网站页面的内容和结构,达到优化站点结构的目的。  相似文献   

8.
文本聚类算法的质量评价   总被引:4,自引:0,他引:4  
文本聚类是建立大规模文本集合的分类体系实例的有效手段之一。本文讨论了利用标准的分类测试集合进行聚类质量的量化评价的手段,选择了k-Means聚类算法、STC(后缀树聚类)算法和基于Ant的聚类算法进行了实验对比。对实验结果的分析表明,STC聚类算法由于在处理文本时充分考虑了文本的短语特性,其聚类效果较好;基于Ant的聚类算法的结果受参数输入的影响较大;在Ant聚类算法中引入文本特性可以提高聚类结果的质量。  相似文献   

9.
基于Web访问挖掘的个性化智能信息推荐服务方法的处理过程分为在线部分和离线部分。离线部分主要完成从站点服务器的访问LOG文件中挖掘出适合在线智能个性化推荐服务的用户事务模式,采用基于聚类用户事务方法获取用户个性化模式。在线部分通过个性化智能推荐服务智能接口实现基于URL聚类模式的个性化信息推荐服务,给出了链接距离因子定义和基于URL聚类模式的生成算法。通过实验总结这种方法的优缺点,这种方法是有效和可实现的。  相似文献   

10.
利用话题检测技术将Blog信息按照所表达的话题进行归类和组织,可以使Blog信息更加有效、准确地为用户使用。研究了话题检测模型中的词频统计、权重计算以及相似度计算,把简单聚类算法与ISODATA算法相结合,并应用到中文Blog热门话题检测系统中,实验结果表明,文本分类的效果有了进一步的提高。  相似文献   

11.
基于语义网的网络智能导航系统研究   总被引:1,自引:0,他引:1  
高雪霞  田文强 《科技通报》2012,28(2):126-127,133
针对网络智能导航不能根据用户的真实需求,将用户快速、准确地引领到目的地的情况,提出一种基于语义网的网络智能导航系统。通过建立网络信息语义模型和用户需求语义模型,在网络信息和用户之间构建导航语义网,将用户文字描述的具体需求准确理解并输入到导航语义网,在导航语义网中完整理解导航需求,准确实现用户对信息搜索的导航。  相似文献   

12.
阮光册 《情报科学》2012,(1):105-109
运用文本挖掘技术发现网络新闻报道中潜在的、有价值的信息是情报研究的一个新尝试。笔者探讨了网络新闻的文本挖掘方法,以上海世博新闻媒体网络版报道为例,进行实证研究,并对报道差异进行对比分析。本文选取香港、台湾、境外媒体华语版、上海本地媒体对世博会相关报道,基于文本挖掘、特征提取对报道内容的差异进行阐述,并得出结论。  相似文献   

13.
科技发展前沿信息监测与分析平台的构建   总被引:1,自引:0,他引:1       下载免费PDF全文
设计并实现了动态监测与追踪、反应快速、分析深入、功能集成、可视化展现的科技发展前沿信息监测与分析平台,综合运用数据库技术,网络信息抓取技术,本体技术和文本聚类技术,实现了准确高效的信息获取、不同科技领域概念的组织及其相互关系的揭示、科技主题关联关系及其变化趋势的挖掘等功能,旨在为国家和相关部门的战略决策者提供对科技发展相关知识结构、发展趋势等方面的分析,并以多种可视化方式总结与呈现的高效的战略决策支持服务;为相关情报研究业务提供有效的研究方法和分析工具,提高情报研究能力和效率。  相似文献   

14.
A new dictionary-based text categorization approach is proposed to classify the chemical web pages efficiently. Using a chemistry dictionary, the approach can extract chemistry-related information more exactly from web pages. After automatic segmentation on the documents to find dictionary terms for document expansion, the approach adopts latent semantic indexing (LSI) to produce the final document vectors, and the relevant categories are finally assigned to the test document by using the k-NN text categorization algorithm. The effects of the characteristics of chemistry dictionary and test collection on the categorization efficiency are discussed in this paper, and a new voting method is also introduced to improve the categorization performance further based on the collection characteristics. The experimental results show that the proposed approach has the superior performance to the traditional categorization method and is applicable to the classification of chemical web pages.  相似文献   

15.
学科前沿信息的网上获取与利用   总被引:2,自引:0,他引:2  
张格丽 《现代情报》2007,27(5):191-193,196
在对学科前沿信息资源特色分析的基础上,提出了多渠道挖掘网络资源、及时跟踪网络信息、重点选用大型英文检索系统等检索思路与策略,并就文献全文信息、引文信息和机构知识库等几大类信息的选择利用进行了探讨。  相似文献   

16.
WNBTE网页正文抽取方法研究   总被引:1,自引:0,他引:1  
李纲  戴强斌 《情报科学》2008,26(3):333-336
WNBTE是一种基于文本字数统计信息,从网页中抽取正文内容的方法。该方法分析网页上存在的各种文字及其特点,寻找网页中包含字符数最多的结点,去掉该结点内的布局文字和说明文字,从而得到正文信息。该方法不需要人工参与,也不需要样本学习,克服了传统网页内容抽取方法中需要根据不同数据源构造不同抽取器的问题。  相似文献   

17.
本文立足于用信息技术支持农业技术服务的思想,就南阳市县、乡镇农技信息服务的网上农技知识查询、电子邮件支持农民-专家互问答等做了设计与实现,并对短信技术和可视化技术支持农枝信息服务方面做了深入的研究。  相似文献   

18.
19.
随着Web2.0的迅速发展,互联网成为人们表达观点、抒发情感的重要工具,如何有效地从Web文本中提取、归纳出用户的情感观点是研究者所面临的重要问题。本文首先提出对日益增多的Web文本进行情感分析的必要性。然后从文本主客观性分类、情感极性分类和主题及观点持有者抽取等方面介绍文本情感分析在国内外的研究进展;最后总结出今后需深入研究的问题。  相似文献   

20.
老年在线社区用户健康信息需求挖掘研究   总被引:4,自引:0,他引:4  
[目的/意义]研究老年在线社区用户的健康信息需求,为利用互联网开展精准的医学教育和科普服务提供依据,优化在线社区服务,吸引和鼓励更多老年人使用网络分享和获取健康信息。[方法/过程]本文采取网络文本挖掘的方法,选取老年论坛"老年人之家"中5 296条用户发布的健康相关文本作为语料库,利用TextRank和TF-IDF两种关键词抽取算法对每条文本抽取关键词,构造关键词共现网络,进行社会网络分析,识别重要关键词和主题,研究老年在线社区用户的健康信息需求。[结果/结论]老年在线社区用户信息需求主要可划分为中医养生原理与方法、生活方式调整与改变、疾病防治与应对老化、食品营养价值与功效4个类型,且不同需求类型间存在复杂的交错关系;用户表露的健康信息需求停留在生理健康层面,而心理健康和社会适应力是潜在的信息需求。通过网络文本挖掘的方法能有效利用用户生成的文本数据,展现用户健康信息需求并发现其中的问题。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号