首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 31 毫秒
1.
介绍SNS开放平台及其应用的相关概念,分析开放平台应用现状和运营模式,基于国内此类软件的统计数据,采用DTW算法度量变长时序数据的形状相似性,使用一维序列变换改进K中心点聚类的簇中心计算方法,并对数据进行时间序列聚类挖掘,最后使用产品生命周期理论分析聚类结果。  相似文献   

2.
利用引文时序可视化挖掘专业学科发展规律   总被引:1,自引:0,他引:1  
文献计量学中的引文时序研究可以用来展示某个研究主题的论文源流、最初著者以及该研究主题发展的来龙去脉,并从中探讨科学技术的发展规律.本文对中国25年来关于杂交水稻研究的文献的引文数据进行整理,利用引文时序可视化软件构建引文编年图,鉴别出代表杂交水稻研究学科发展关键事件的文献,并就它们的关系和引用序列进行分析,梳理出杂交水稻研究在这段时间内的发展规律,最后把结果与从事杂交水稻研究的专家的观点进行对比,发现二者具有高度的重合性,证明了利用引文时序网络挖掘专业学科发展规律的可靠性和准确性.  相似文献   

3.
针对图书馆读者借阅事务中存在的序列特征,提出一种基于序列模式挖掘的读者借阅行为分析方法,其思想是通过将借阅事务转化为序列数据库,基于PrefixSpan算法来识别读者借阅行为序列模式。以某高校图书馆读者借阅事务数据为例,通过序列模式挖掘实验表明,此方法可有效获取读者借阅行为的时序规律,其结果在图书馆信息服务中具有一定的应用价值。  相似文献   

4.
基于序列模式的个性化Web页面推荐模型*   总被引:1,自引:1,他引:0  
基于数据挖掘中的序列模式方法,提出一种个性化Web页面推荐模型。该模型首先利用Web使用数据预处理提取Web交易事务集,然后应用序列模式算法挖掘频繁(连续)序列,最后通过构建频繁(连续)序列树生成用户偏好视图以生成个性化Web页面推荐集。  相似文献   

5.
[目的/意义]梳理当前情报学中涉及时间序列分析的研究,并总结常见问题,为情报学研究的模型化、预测化发展提供借鉴。[研究设计/方法]从任务、过程与问题视角,对情报学研究中时间序列分析的应用任务场景、研究过程以及存在的问题进行归纳分析。[结论/发现]从任务视角来看,已有研究已经在包括学科主题演化、学术影响力评价、网络舆情分析、技术趋势分析任务场景得到了很好的应用,应用内容主要包括历史演化与未来预测两方面;从过程视角来看,已有研究主要按照时间序列的观测数据选取、时间切片方式、形态规律挖掘、预测与评价的顺序展开;从问题视角来看,未来的研究应多关注时间序列模型在短序列数据方面的应用,加强对时间序列分析结果的评估。[创新/价值]通过综合性的梳理,系统地总结了当前情报学中关于时间序列分析的研究,为该领域的研究者提供了一个全面的概述和参考。  相似文献   

6.
提出一种基于概念格的数字图书馆用户检索行为序列模式挖掘方法。该方法采用“基于概念格的自顶向下与分治相结合”的挖掘思想,通过自顶向下的概念格迭代,利用概念格的复用性和提取频繁项集的优势,获得数字图书馆用户检索行为的序列模式。该方法不需要遍历原始用户信息数据库,能够大大压缩挖掘时间,有助于数字图书馆提高用户检索速度、改进个性化服务。  相似文献   

7.
《全国新书目》2013,(12):141-141
时间序列问题是一类在各领域广泛存在的问题,在经济、气象、水利、林业等多个领域更是多有涉及,其中大多数时序问题的解决可归属为时序数据挖掘的范畴,时序问题的有效解决可为各领域实际问题的解决提供有效的技术支持。  相似文献   

8.
基于概率图模型的科研文献主题演化研究   总被引:3,自引:2,他引:1  
学术文献的主题分析对于研究者进行思路整理及发现研究主题非常重要.通过进一步的分析,能够理解主题如何发展变化,以及如何影响研究者的行为等等.探索了基于概率图模型的科研文献主题演化问题,特别分析了主题随时间的相互影响问题,提出了基于模块化网络的方法研究主题之间的相互关系,从而理解其相互影响.首先,利用主题模型获取时间文本的主题及其强度曲线,然后利用时间序列的逐段线性表示方法去除序列中的噪音,从而有效反映趋势信息,使得利用模块化网络能够更加准确地反映主题的影响关系,实验结果及其相关分析证明了方法的有效性.  相似文献   

9.
设计基于网络数据的时序主题演化系统Hot Topics Analysis System(HTAS),实现网络热点话题数据源自动定制、自动获取和自动存储。针对中文话题分析,HTAS集成了Google的开源分词系统IKAnalyzer,批量处理中文文档。采用LDA模型对网络热点话题主题进行提取,并利用时间标签发现热点话题,通过图标形式可视化展示其演化规律。通过"钓鱼岛事件"的实验证明,HTAS系统能快速获取、存储网络热点话题,并能有效地分析其演化趋势。  相似文献   

10.
基于时间序列分解法,建立了图书借阅流量预报模型.引入灰色系统理论来分离趋势,从预报结果可以看出,所建模型具有较高的准确性.  相似文献   

11.
基于概率主题模型的文献知识挖掘   总被引:1,自引:0,他引:1  
对海量的科技文献资源进行知识挖掘能够发现大量有价值的、潜在的知识,有效地提高文献信息的可用性。作者前期研究验证了使用LDA主题模型进行文献知识挖掘的可行性。本文提出了一种新的概率主题模型:Topic-Author模型,该模型对文献的文本信息和作者信息进行联合建模,在分析文献主题同时,发现相关主题方向的研究者分布。基于Topic-Author模型,提出了多维度文献知识挖掘的方法,包括主题挖掘,专家发现,文献标注,重要文献挖掘,文献相似度分析,研究趋势分析和主题关系挖掘。基于教育技术学文献数据集,进行了实验研究。  相似文献   

12.
判断新兴研究趋势的技术框架研究   总被引:1,自引:0,他引:1  
目前,新兴研究趋势的探测成为国内外的研究热点。本文分析了新兴研究趋势的概念以及国外在新兴研究趋势探测上所做的相关工作,并分析了当前研究存在的一些问题。同时结合对新兴研究趋势表现特点的总结,笔者提出从海量的信息资源中判断新兴研究趋势的技术框架,并以医学信息资源为数据来源,综合采用文本挖掘技术、文献计量学、网络计量学、时间序列分析等方法,来完成主题领域界定、主题特征表示以及最终的综合判断。  相似文献   

13.
杨思 《图书馆界》2009,(1):64-67
由于网站的结构设计,对特定用户而言信息获取的代价与所经过的浏览路径长度成正比,这些位于路径中间的不必要的文档就无疑增加了用户获取信息的代价。本文利用Web挖掘的方法和技术对用户所访问的页面序列进行挖掘,构建路径优化的模型,实现对当前站点排序方式的优化,从而最大限度地优化用户访问体验,提高当前站点信息获取的整体效率。  相似文献   

14.
文章利用origin8.0对兰州大学图书馆最近两年多时间的纸质图书借阅量,以出版年龄为时间序列进行曲线拟合,并利用编目延迟与图书出版年龄和编目年龄的关系,推导出以编目年龄为时间序列的图书老化模型;对比计算两种模型的图书老化测度指标,由数理统计分析得出,编目延迟使图书的老化速度减慢,使仍在使用的图书所荷载的知识年龄偏大、陈旧过时,这一结论对图书馆馆藏的采购、剔旧及优化具有重要的参考价值.  相似文献   

15.
孙国超  徐硕  乔晓东 《情报工程》2016,2(4):020-029
随着科研人员需要处理的文献集规模的日益庞大,以LDA 为代表的主题模型能够从语义层面挖掘大规模文献集中隐含的主题,因此,LDA 主题模型的应用越来越广泛。LDA 模型仅仅关注文献集的内容,而忽略了文献其他重要的外部信息,AToT 模型在LDA 主题模型的基础上引入了文献作者和文献发表时间两个属性,使AToT 模型不仅可以挖掘文献中隐含的信息,还可以分析文献作者的研究兴趣及文献主题随时间的变化。AToT 模型对文献集建模的结果是以概率矩阵的形式呈现,不能直观、全面、清晰的呈现挖掘出来的信息,特别是对数据挖掘不熟悉的科研人员,因此,本文开发了一个基于AToT 模型的可视化系统,该可视化系统清晰、美观地展现了AToT 模型中文献、主题、作者、时间、词项间的关系。如文档中的主题分布、主题的词项分布、作者的研究兴趣分布、主题的相似主题和主题的演化趋势等。  相似文献   

16.
文章基于感知价值理论,从情感、社会、质量及价格四个维度对国家图书馆文化创意产品的在线评论进行文本挖掘,利用Python等工具进行高频词分析、LDA模型构建和情感分析,探究图书馆文化创意产品感知价值与消费需求关系,发现情感与社会价值对消费需求的影响较大,质量和价格感知对消费需求的影响相对较弱,且四个感知价值维度相互影响、相互交织。  相似文献   

17.
[目的 /意义]在大数据浪潮和"新文科"背景下,中国图情档学科的人才培养范式亟需改革.与此同时,大数据相关专业的建设方兴未艾,对于图情档学科的人才培养新范式建设具有借鉴意义.[方法/过程]采用一种时序主题网络模型及计算方法;通过搜集、处理、统计、分析259所高等院校的大数据专业培养方案文本,在时间维度上进行主题挖掘,总...  相似文献   

18.
图书借阅流量行为季节预测模型   总被引:2,自引:0,他引:2  
指出图书借阅流量行为预测是图书借阅行为学的一个重要研究方向,常规的借阅流量预测大多采用的是ARIMA时间序列模型,但普通时间序列预测模型的参数难以估计并且模型较难处理非平稳时间序列问题。基于时间序列的神经图书借阅模型研究是,根据图书借阅流量行为的季节性特点,提出季节型神经图书借阅模型。用模型对图书借阅流量行为的预测分析表明,该模型预测效果较好,结果合理,对进行图书借阅实时监控及图书借阅管理都具有一定的理论和实践价值。  相似文献   

19.
利用SSA降噪技术对沪深300指数股票价格进行降噪并建立LSTM模型,发现在预测性能方面,奇异谱分析能够进一步提高模型预测的精度,优化算法对于模型的优化或许也能间接提高模型的预测性能。通过将原始时间序列构建轨迹矩阵,将轨迹矩阵进行奇异值分解、重构,由此提取出时间序列中代表不同成分的信号,有效、准确地运用数学模型预测股票价格。  相似文献   

20.
本文以专利中的技术术语作为事务、以术语中的词汇作为项,通过闭频繁项集挖掘方法,对专利文献中的技术术语的结构变化情况进行时序分析,以从新的角度来研究技术演化趋势,之后以硬盘驱动器磁头技术为例进行实证分析,实证结果表明,该方法能够对技术演化过程中所产生的技术变化进行有效识别。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号