共查询到20条相似文献,搜索用时 265 毫秒
1.
【目的/意义】通过综合使用论文和专利数据源,开展新兴技术的识别与演化路径方法研究,期望以此提高学科领域新兴技术探测研究的准确性和科学性。【方法/过程】首先,针对集成电路这一特定领域使用Word2Vec语义相似度与字符串相似度相结合的方法构建词袋,并利用LDA主题模型发现并识别集成电路领域隐含的技术主题,构建新颖度、强度和热度等多维指标对新兴技术进行对比和甄别。其次,划分时间窗,采用余弦相似度算法计算相邻时间窗内主题间的相似性,以可视化路径的形式将筛选结果进行呈现,以此判断主题演化关系类型。【结果/结论】研究发现,集成电路领域呈现学界与业界研究成果相互促进的良好态势,结合论文与专利数据的新兴技术识别方法,可以有效且清晰的发现集成电路研究领域的热点型、增长型、成熟型和潜在型技术主题,并通过新兴技术演化路径的构建,揭示了领域科学与技术间知识的交互与转移。【创新/局限】本研究创新性采用Word2Vec语义相似度与字符串相似度相结合的方法构建词袋,提高了词袋构建质量,为后续基于LDA主题模型识别隐含的技术主题奠定了基础,但在数据源的多样性、时滞性问题,以及模型阈值设置的客观性上还存在局限性,需要... 相似文献
2.
【目的/意义】突发事件类网络舆情演化情况的掌握对舆情监管部门而言至关重要。鉴于此,本文致力于构 建能够准确预测舆情演化的模型,此预测模型的建立可拓宽舆情预测的渠道,为舆情参与主体和监管部门及时掌 握舆情演化态势提供方法依据。【方法/过程】基于随机森林(RF)算法建立突发事件网络舆情演化预测模型,以微博 和第三方舆情监测平台作为变量数据来源,以R语言为操作环境,然后进行模型的训练与预测。【结果/结论】实验 表明,较之其它方法,本文构建的模型有更高的拟合度和更低的误差值。从结果来看,本模型的预测输出值与真实 值最为接近,较好地实现了对舆情演化的预测,将RF算法应用在舆情预测的研究中具有一定的先进性。 相似文献
3.
4.
【目的/意义】梳理情报学的研究内容分布以及研究主题发展情况。【方法/过程】选取2006年到2015年十年
内发表于九种情报学核心刊物的论文作为研究数据源,采用构建基于LDA算法的主题模型的方法挖掘情报学的研
究主题。【结果/结论】2006年到2015年情报学的研究主题有13个,其中在内容分布上,总体研究热度较高的是图书
馆管理、文献计量、知识管理与服务、信息素养和情报学基础理论。在主题变化上,研究热度上升的主题有文献计
量、社会网络分析、信息行为研究和数据挖掘;研究热度下降的主题有信息素养、情报学基础理论、信息检索和企业
竞争情报。 相似文献
5.
6.
【目的/意义】构建主题-主题关联的学科知识网络,从主题之间语义关联角度度量主题在学科知识网络中
的影响力,分析学科知识结构演化规律,为热点、前沿主题探测提供方法支撑。【方法/过程】基于 LDA主题模型抽取
学科领域研究主题,利用主题在科学文献中的共现关系构建主题-主题关联的学科知识网络,并提出主题影响力概
念和度量方法;基于复杂网络结构分析方法对学科领域生命周期内主题-主题关联的学科知识网络进行演化分
析。【结果/结论】实证分析表明主题的网络影响力是主题强度、被学者关注度等外部特征指标的有力补充,可用来
探测热点、前沿主题。同时,学科知识结构随着学科领域的发展表现出较强的小世界网络特征。 相似文献
7.
【目的/意义】为了解近年来图书情报研究的热门主题及其演化趋势,利用LDA模型进行文本挖掘。【方法/ 过程】选取CNKI作为检索数据库,以2006年至2017年图书情报学领域10本核心期刊中的论文摘要作为研究数 据,借助开源工具JGibbLDA构建LDA模型,运用困惑度来确定模型主题数目,根据主题-词项分布文件进行主题 标识,根据文档-主题分布文件计算主题强度。【结果/结论】2006年至2017年图书情报学领域有20个研究主题,其 中比较热门的主题有7个; 8个主题的强度呈上升趋势, 9个主题的强度呈下降趋势, 3个主题的强度变化幅度较小。 相似文献
8.
9.
【目的/意义】主题发展等级划分是信息组织研究的基础性问题,也是科研人员和科研管理部门进行研究选
题和学科服务的重要工作,对学科研究主题进行高效的发展等级划分与趋势预测,能够帮助相关科研人员和机构
把握学科领域研究态势,准确做出科研决策。【方法/过程】本文结合主题模型、Sen’s斜率估计法、Mann-Kendall法、
指数平滑法,提出一种学科研究主题发展等级划分与趋势预测方法。首先,在主题识别的基础上,形成主题发文度
和主题引文度两个指标,并参考波士顿矩阵对学科研究主题发展等级进行划分;然后,融合研究主题发文量、被引
量和下载量,形成主题热力度指标,采用指数平滑法对研究主题未来发展态势进行预测。【结果/结论】以我国“智慧
图书馆”研究的实验表明,本文所提方法能够对学科领域研究主题进行全方位、细粒度地发展等级划分和趋势预
测。【创新/局限】本文所提方法对其他学科研究主题的分析具有普适性,为实现动态情报分析提供了新的视角,局
限在于需要提高主题建模的可解读性,并进一步优化趋势预测方法。 相似文献
10.
【目的/意义】从学者的合作网络中进行社区发现及主题分布研究是具有十分重要的意义点。本文从社区 结构及其主题分布演化的角度分析并归纳情报学领域的研究现状和预测未来发展趋势。【方法/过程】本文通过构 建动态社区-主题模型,拟研究情报学文献中合著社区及其研究主题演变过程。【结果/结论】2000-2017年间,合著 网络社区演化呈现松散到聚合的趋势,在2012-2017年间基本形成三个大型的社区,每个社区的主题演化路径有不 同的模式:分裂融合模式、主干聚集模式和主干分解细化模式。不同社区的主题变化影响着社区演化路径。每个 社区的主题分布具有逐步多样化的特点,并且与数据挖掘、大数据分析、人工智能的研究日益紧密。 相似文献
11.
【目的/意义】针对不同主题下资源数量的差异对用户兴趣建模存在影响的问题,提出一种基于主题热度的
兴趣建模策略,提升模型的预测能力与推荐系统的推荐效果。【方法/过程】以主题下不同资源的数量代表该主题的
热度,以此对用户兴趣特征进行调权处理,并在此基础上利用向量空间模型进行兴趣表示。以抓取的“豆瓣电影”
675351 位用户的观影数据进行推荐实验,验证本文策略的效果。【结果/结论】实验结果显示,基于主题热度调权的
兴趣建模方法的推荐准确率明显高于传统基于绝对频次的兴趣建模方法,该策略可以提升用户兴趣建模效果。 相似文献
12.
【目的/意义】基于文献数据的领域知识图谱构建有助于探测某学科领域的主要研究内容及其发展方向,是
进行技术创新的基础情报工作,对于研究人员、企业都具有一定的意义。【方法/过程】提出基于交互式可视化技术
的知识图谱构建方法,首先基于经典LDA模型进行主题识别,然后基于社会网络分析方法构建领域主题网络识别
关键主题词;最后,基于JS(D3 工具)绘制可交互的关键主题词关联与检索知识图谱,发现关键主题词的隐含联系,
辅助进行领域知识挖掘与分析。【结果/结论】通过对我国医疗健康信息领域进行实证研究,验证了本文提出方法的
准确性和有效性。 相似文献
13.
【目的/意义】构建高校师德舆情微博用户评论LDA模型,可以更精准识别舆情演化特征和分析关键主题传
播路径,帮助高校和相关部门更为有效地进行舆情监管和舆情引导。【方法/过程】本文以“天津大学一教授学术造
假”事件为例,基于 LDA模型构建高校师德舆情下微博用户主题生成模型,采用困惑度评价指标确定 LDA模型最
优主题数,采用信息熵确定每一主题在不同日期的主题强度,通过关键词共现知识图谱、词云展现舆情话题的演
变,最后基于主题相似度确定主题传播路径。【结果/结论】LDA模型和信息熵可以解析出网络用户群体关注的重要
主题热点,精准识别舆情演化特征,识别主题最优传播路径进行舆论引导,对爆发的舆情实现预测和管制优化。【创
新/局限】文章创新性地构建高校学术道德舆情的LDA主题模型,有效确定微博用户群体主题、识别舆情演化特征、
分析主题间传播路径,具有普适性;进一步扩大高校师德其他舆情分析及结合网络舆情情感分析为下一步的研究
内容。 相似文献
14.
【目的/意义】跨学科输入知识是指其他学科(跨学科)的知识被目标学科多次引用,并逐渐成为目标学科的研究内容,刺激知识创新与生长,进而促进学科发展。因此,识别跨学科输入知识,测量其对目标学科发展的影响力,有利于分析学科进步的跨学科来源及作用力大小,有利于把握学科创新发展的现状与趋势。【方法/过程】基于跨学科引用,从跨学科输入知识在目标学科的研究热度、研究广度、研究深度3个方面,构建跨学科输入知识对目标学科发展的影响力模型,测度影响力程度。并以图书情报学跨学科程度较高的6种期刊数据为研究对象进行实证研究。【结果/结论】通过影响力模型,测量跨学科输入知识对图书情报学的影响力大小,并根据趋势分析法将跨学科知识的影响力趋势分为上升型、稳定型和下降型。【创新/局限】本文构建跨学科知识对学科发展的影响力模型并验证其有效性,后续将进一步分析跨学科知识对目标学科的作用点,识别跨学科知识生长点。 相似文献
15.
【目的/意义】探测特定领域政策文本语义主题,揭示我国政策部署领域与未来发展趋势。【方法/过程】提出
一种融合词向量语义增强和DTM模型的公共政策文本时序建模与可视化方法,采用DTM模型实现政策文本的时
序切割和主题建模,利用深度学习Word2vec算法中Skip-gram词嵌入技术可以对上下文词汇进行有效预测,增强
其语义表达性和政策解释性,以更为准确地揭示我国公共政策的部署重点。【结果/结论】实验表明本文提出的方法
对于公共政策主题识别和政策文本量化具有更好的知识抽取和语义表达能力,对我国公共政策挖掘和信息揭示具
有良好的揭示。【创新/局限】提出融合词向量语义增强和DTM模型的公共政策文本时序建模方法,一定程度上提
升了政策文本的主题语义表达,未来考虑利用深度学习技术如LSTM算法、BERT模型等识别政策中的领域知识单
元和语法结构。 相似文献
16.
【目的/意义】数字阅读给人们的知识与信息获取带来了巨大的变化,识别数字阅读领域的研究热点及其主题演化路径,有助于对数字阅读领域建立起动态的全景化视野。【方法/过程】文章以数字阅读领域的高水平论文为基础数据源,基于关键词共现关系构建领域知识网络,通过高频次与高度值关键词识别领域研究热点,采用SLM社团发现算法和主题密度图跟踪分析领域的主题演化路径。【结果/结论】研究结果表明,数字阅读领域已具有相对稳定的知识体系架构;从数字出版到阅读推广再到问题消解,领域研究逐渐走向成熟;从关注阅读形式到关注阅读效果,领域研究进入内涵式发展道路。【创新/局限】研究工作主要聚焦于国内学术界具有代表性的高水平研究层次,未来的研究工作将纳入更广泛的数据来源,进行更加全面细致地研究。 相似文献
17.
【目的/意义】随着网络社交媒体的发展,舆情文本中隐含的主题越来越能体现出人们的关注点所在及变化
情况,因此对其进行检测及演化分析具有重要意义。【方法/过程】为了解决OLDA模型存在的主题混合及权重定义
问题,本文提出了一种可变在线LDA模型(variable online LDA,VOLDA),通过构建主题相似度矩阵,明确主题变化
关系,在主题内容演化矩阵中剔除含有旧主题的时间片,从而构建变长的演化矩阵,并在此基础上设计动态权重计
算方法及先验参数优化方法。【结果/结论】基于论坛文本数据的实验结果表明,VOLDA模型能够有效减少新主题
出现后的主题混合问题,并且提高主题在演化过程中的表示能力。 相似文献
18.
【目的/意义】基于机器学习算法对信息进行聚类及预测引起了广泛关注,本文将以航空公司客户信息为对
象构建出k-means,BP神经网络模型,对航空用户进行聚类及预测,实现用户的精准营销。【方法/过程】首先,对航
空公司的客户信息进行预处理,并根据信息聚类和信息预测理论,构建出k-means客户聚类模型与BP神经网络的
流失预测模型。【结果/结论】实证结果表明,在聚类模型上,k-means算法将客户聚为五类,实现了不同价值客户的
差异化识别;在客户预测模型上,BP神经网络的准确性更高。【创新/局限】本次研究将LRFMC模型引入到用户聚
类模型的实验中,使得模型泛化能力上存在了一定的局限,但也为该问题的未来研究提供了新的方式。 相似文献
19.
【目的/意义】颠覆性技术具有隐蔽性和突变性,而技术主题在演化过程中会释放颠覆性趋势产生的早期信号,本文提出一种基于专利主题演化的颠覆性技术识别方法。【方法/过程】首先,基于S曲线法判断技术生命周期;其次,综合运用文本挖掘和社会网络分析方法识别技术主题的演化事件;最后,定义新主题出现、原主题趋热和多主题融合三类突变情况,用于识别具有颠覆性潜力的技术主题。【结果/结论】通过类脑智能领域专利实证,发现六个新出现主题、四个趋热型主题和六个融合型主题,通过专家判读,证明了所提方法的有效性,同时筛选出五项主题作为最终预测结果。【创新/局限】本文基于动态社区发现算法对技术主题的演化特征进行分析,进而基于主题突变性筛选颠覆性技术,但数据来源较为单一,将在未来研究中加以扩充。 相似文献
20.
【目的/意义】提出基于Stacking集成学习的问答信息采纳行为识别策略,促进在线健康社区问答的精准化推送、助推数字化医疗服务高质量发展。【方法/过程】构建以集成学习方法和非集成学习方法为基学习器、以逻辑回归算法(LR)为元学习器的Stacking集成学习模型,比较单预测模型、同类预测模型组合、不同类预测模型组合的Stacking集成学习模型预测精度,选取“寻医问药”平台的慢性病问答构建数据集验证模型的优越性,并选取“快速问医生有问必答120”平台数据验证模型的可移植性。【结果/结论】Stacking集成模型相比于单预测模型能够更精准识别被采纳问答信息,模型具有较强的泛化性,可以适用于不同的在线健康社区。【创新/局限】本文基于Stacking集成思想构建两阶段预测模型,并借助机器学习构建最佳预测模型组合,显著提高在线健康社区问答信息采纳识别精度,但伴随问答信息积累,在线健康社区问答模式不断发展变化,考虑结合历史数据和每日更新数据的动态预测方法是未来研究工作重点。 相似文献