排序方式: 共有74条查询结果,搜索用时 125 毫秒
51.
[目的/意义]通过实验分析不同特征提取算法对新闻文本聚类效果的影响。[方法/过程]选取搜狗实验室的搜狐新闻语料库以及澳大利亚广播公司2003-2017年间的新闻标题语料库,对TF-IDF、Word2vec以及Doc2vec三种单一特征,TF-IDF+Word2vec、TF-IDF+Doc2vec、Word2vec+Doc2vec以及TF-IDF+Word2vec+Doc2vec四种组合特征在K-means、凝聚以及DBSCAN算法上分别进行聚类分析,通过Purity以及NMI两个评测指标对聚类效果进行评价。[结果/结论]单类特征中三个特征的聚类质量呈Word2vec> TF-IDF> Doc2vec关系;组合特征中TF-IDF+Word2vec的效果最优。Word2vec在单一特征中的表现最优,其也是不同组合特征间差异的主要因素,特征组合是否可以提升聚类性能需基于多因素进行综合判定。 相似文献
52.
53.
相关反馈是近年来信息检索领域的研究热点,是自动查询扩展中的一种重要形式,相关反馈主要包括检索词加权和检索词选择。本文介绍了在相关反馈技术中经典的检索词排序算法,对它们带来的性能改进做了比较,并提出了相关反馈的实际应用中需要解决的一些问题。 相似文献
54.
基于整合理念的信息素质教育 总被引:7,自引:0,他引:7
本文首先介绍了行为主义、认知主义以及建构主义学习理论的基本观点,在此基础上指出了三者的优势与不足。文章最后提出了基于整合理念的信息素质教育思想,即应当依据不同的学习任务,采用合适的学习理论予以指导的思路。 相似文献
55.
情报与信息、数据、知识、智慧、智能的关系,以及信息链、DIKW链在分析这些概念及关系时所体现的价值,都是情报学中最基本、最核心且尚未达成共识的理论问题。本文依据不同定义的内核,将现有的情报定义归纳为军事说、文献—知识说、企业说三种观点;利用文献分析法、概念分析法以及案例分析法,立足于中国情报实践,综合各种观点的合理之处,在取最大“公约数”的基础上凝练出情报的新定义:情报是为特定目的、在特定时间传递给特定对象的特定关键信息;从多源视角对该定义进行分析,并整合了信息哲学、全信息理论以及DIKW链的代表性观点,优化了现有的信息链理论,进而提出了新的信息链。图1。参考文献45。 相似文献
56.
基于TAM扩展模型的用户网络学术信息资源利用初探 总被引:2,自引:1,他引:1
用户网络学术信息资源利用,指的是用户对自己所需要的网络学术信息资源的获取.文章根据用户使用网络学术信息系统的具体特点,通过整合技术采纳模型(TAM)和任务-技术适配模型以及系统使用经验、信任等其他变量,而构建了一个网络学术信息资源利用理论模型.TAM是国外学者在办公自动化软件、电子商务等信息技术(系统)使用研究中广泛采用的一个模型,将其用于网络学术信息资源利用问题的研究还是一个新的尝试.文章对理论模型中各变量之间的相互关系进行了简要说明和初步分析,并讨论了理论模型在网络学术信息系统设计、评价和诊断中的社会实践价值. 相似文献
57.
58.
59.
60.