共查询到20条相似文献,搜索用时 31 毫秒
1.
2.
【目的/意义】基于机器学习算法对信息进行聚类及预测引起了广泛关注,本文将以航空公司客户信息为对
象构建出k-means,BP神经网络模型,对航空用户进行聚类及预测,实现用户的精准营销。【方法/过程】首先,对航
空公司的客户信息进行预处理,并根据信息聚类和信息预测理论,构建出k-means客户聚类模型与BP神经网络的
流失预测模型。【结果/结论】实证结果表明,在聚类模型上,k-means算法将客户聚为五类,实现了不同价值客户的
差异化识别;在客户预测模型上,BP神经网络的准确性更高。【创新/局限】本次研究将LRFMC模型引入到用户聚
类模型的实验中,使得模型泛化能力上存在了一定的局限,但也为该问题的未来研究提供了新的方式。 相似文献
3.
【 目的/意义】解决获取虚假网络医疗信息数据集时专业知识不足的问题,帮助在小样本领域构建虚假网络
医疗信息识别模型。【方法/过程】本文提出一种基于权威辟谣信息转化提取构建网络虚假医疗信息数据集的思路,
并依次构建传统机器学习模型、CNN模型和BERT模型进行分类识别。【结果/结论】结果表明,基于辟谣信息能够
实现以较低成本、不依赖专家标注构建虚假医疗信息数据集。通过对比实验发现,基于微博数据预训练的 BERT
模型准确率为 95.91%,F1值为 94.57%,相比于传统机器学习模型和 CNN模型提升分别接近 6%和 4%,表明本文构
建的基于预训练的BERT模型在网络虚假医疗信息识别任务上取得了更好的效果。【创新/局限】本文提出的方法能
以较低成本建立专业领域的虚假信息数据集,所构建的BERT虚假医疗信息识别模型在小样本领域也具有实用价
值,但在数据集规模、深度学习模型对比、模型性能评价指标等方面还有待拓展与延伸。 相似文献
4.
5.
【目的/意义】提出基于Stacking集成学习的问答信息采纳行为识别策略,促进在线健康社区问答的精准化推送、助推数字化医疗服务高质量发展。【方法/过程】构建以集成学习方法和非集成学习方法为基学习器、以逻辑回归算法(LR)为元学习器的Stacking集成学习模型,比较单预测模型、同类预测模型组合、不同类预测模型组合的Stacking集成学习模型预测精度,选取“寻医问药”平台的慢性病问答构建数据集验证模型的优越性,并选取“快速问医生有问必答120”平台数据验证模型的可移植性。【结果/结论】Stacking集成模型相比于单预测模型能够更精准识别被采纳问答信息,模型具有较强的泛化性,可以适用于不同的在线健康社区。【创新/局限】本文基于Stacking集成思想构建两阶段预测模型,并借助机器学习构建最佳预测模型组合,显著提高在线健康社区问答信息采纳识别精度,但伴随问答信息积累,在线健康社区问答模式不断发展变化,考虑结合历史数据和每日更新数据的动态预测方法是未来研究工作重点。 相似文献
6.
【目的/意义】对大数据知识领域的研究前沿及未来发展趋势进行预测。【方法/过程】利用引文网络结构变
换模型方法,通过 CiteSpace信息可视化软件工具,对下载于 Web of Science检索平台的大数据研究领域文献进行分
析,绘制文献共被引和引文结构变换知识图谱,分别从共被引文献和施引文献的视角,对大数据领域的研究前沿和
未来发展趋势进行预测。【结果/结论】预测出了对学科发展具有潜在影响力、交叉属性最强、对中心度影响最大的
文献以及相关研究主题。这种分析方法,避免了从施引文献或被引文献的单一角度分析知识领域研究前沿的不
足,对系统地分析知识领域的前沿,预测未来潜在变化趋势具有一定的参考价值。 相似文献
7.
【目的/意义】针对现有主题演化方法难以满足预测目的的需求,本文从知识动态发展的角度出发,构建知
识主题演化预测模型,为探究科学领域发展脉络与研究趋势提供方法。【方法/过程】通过Lda模型抽取知识主题,利
用马尔可夫和隐马尔可夫构建主题稳态与主题热度的演化预测模型。【结果/结论】以云计算领域的科学文献作为
实证分析对象,结果表明本模型可以根据历史数据来预测知识主题稳态分布情况与未来热度趋势,且在热度预测
精度上较灰色模型更高。【创新/局限】本文只考虑了横向主题内部的热度高低变化,没有进行纵向维度上各知识主
题间的对比。 相似文献
8.
【目的/意义】探测特定领域政策文本语义主题,揭示我国政策部署领域与未来发展趋势。【方法/过程】提出
一种融合词向量语义增强和DTM模型的公共政策文本时序建模与可视化方法,采用DTM模型实现政策文本的时
序切割和主题建模,利用深度学习Word2vec算法中Skip-gram词嵌入技术可以对上下文词汇进行有效预测,增强
其语义表达性和政策解释性,以更为准确地揭示我国公共政策的部署重点。【结果/结论】实验表明本文提出的方法
对于公共政策主题识别和政策文本量化具有更好的知识抽取和语义表达能力,对我国公共政策挖掘和信息揭示具
有良好的揭示。【创新/局限】提出融合词向量语义增强和DTM模型的公共政策文本时序建模方法,一定程度上提
升了政策文本的主题语义表达,未来考虑利用深度学习技术如LSTM算法、BERT模型等识别政策中的领域知识单
元和语法结构。 相似文献
9.
【 目的/意义】为探析研究前沿与发展趋向,突破现有跨学科科研协作研究在主题识别预测中的不足,本文提
出跨学科科研协作新兴主题识别及预测研究框架,实现新兴主题识别及未来发展趋势预测。【方法/过程】以时间切
片的形式对 SciTS 会议文本进行主题抽取,提出新兴主题测量指标,探测领域内新兴主题并构建新兴主题时间序
列;而后分别采取BP神经网络和SVR两种经典机器学习算法对新兴主题未来三年发展趋势进行预测分析。【结果/
结论】根据历史数据对跨学科科研协作新兴主题进行识别及预测有较好的效果,在识别出的五个新兴主题中,跨学
科交流与对话、跨学科协作社区搭建、跨学科教育与培训等主题未来发展状态将趋热。【创新/局限】选取美国SciTS
会议文本为典型案例展开探索性分析,丰富当前跨学科科研协作研究内容的层次性和多样性。 相似文献
10.
【目的/意义】中医医案中包含的隐性知识具有巨大的价值,通过数据挖掘技术对中医医案进行分析,挖掘
临床医案中的隐性知识,有利于知名中医个人知识经验的传承和中医理论知识的积累和拓展。【方法/过程】收集中
医医案中患者的主诉和现病史,并对主诉和现病史进行数据清洗,通过基于cart算法的数据挖掘技术挖掘中医医案
中的隐性知识,探究病症与患者症候各个属性之间的关系。【结果/结论】本文以胃脘痛为例,发现了胃脘痛与患者
症候各个属性之间的相关程度,为数据挖掘技术在中医医案隐性知识挖掘研究提供借鉴。【创新/局限】本文采用的
cart算法判断胃脘痛与患者属性之间的相关性与医案中确诊结果进行比较,得出该方法相关性准确率高于ID3算
法、C4.5算法和SLIQ算法,判断相关性最高。 相似文献
11.
【目的/意义】词是语言的最小单元,词的向量表示决定了机器学习模型的构建方法。深度学习的神经网络 训练得到的词向量,通过无监督的机器学习方法从海量数据中自动学习词汇的语义特征,无需人工标注和复杂繁 琐的特征工程,端到端的完成各种自然语言处理任务,带来了一种新的研究范式,成为学术界的研究热点。【方法/ 过程】介绍了词向量语义表示及优化方法,存在的问题及解决方法,最后指出了词向量未来的研究方向。【结果/结 论】将句法特征、词形特征、(知识库)先验语义知识融入到神经网络模型能增强词向量的语义表示能力,针对词向 量存在的一词多义、解释性差等问题,总结了最新的研究成果。 相似文献
12.
【目的/意义】通过构建数学模型,研究大数据背景下微博舆情热度预测问题。【方法/过程】分析大数据背景
下的微博舆情的首发信息特征,定义首发信息影响系数,建立微博首发信息热度预测方程模型。【结果/结论】利用百
度指数、清博舆情等软件,研究 47个微博舆情实例分析模型特征,并用 6个微博舆情案例验证模型,得出该模型根据
微博首发信息的少量数据而得到较为准确的预测结果。研究成果有利于政府面对复杂微博舆情时做到“心中有
数”, 也为进一步研究大数据背景下微博舆情预测问题提供参考。 相似文献
13.
14.
【目的/意义】从大量非结构化文本中抽取出结构化的实体及其关系,是优化搜索引擎、建立知识图谱、开发
智能问答系统的基础工作。【方法/过程】介绍了深度学习框架下不同神经网络模型实现实体关系抽取的方法,比较
了各种模型的优劣势,结合远程监督和注意力机制进一步提高关系抽取性能,最后指出了深度学习模型的不足及
未来发展方向。【结果/结论】实验发现,卷积神经网络擅长捕获句子局部关键信息,循环神经网络擅长捕获句子的
上下文信息,能反映句子多个实体之间的高阶关系,递归神经网络适合短文本的关系抽取。如果模型能结合自然
语言的先验知识,实体关系抽取将会取得更好的效果。 相似文献
15.
【目的/意义】读者的阅读兴趣可分为短期兴趣和长期兴趣,具有不稳定性。读者兴趣发现模型作为图书馆
个性化服务推送的基础和核心,其准确性和时效性是图书馆个性化服务有效的关键。当前,采集读者的阅读行为
信息,从中挖掘隐性知识并获取读者的阅读兴趣,已成为目前图书馆个性化服务一个重要的研究方向。【方法/过
程】本文提出了一种基于小数据决策的读者兴趣发现与预测模型。【结果/结论】通过对读者小数据的测试和分析,
可增强图书馆对读者服务需求预测的精度,提升图书馆个性化服务推荐的效率,改善图书馆个性化服务的质量,满
足读者的个性化服务需求。 相似文献
16.
【目的/意义】如何将网络文物信息资源中不同的知识提炼后推荐给有关用户,是文物信息资源开发与利用
过程中的关键问题。【方法/过程】通过主题-知识关联模型构建文物知识网络并识别网络中文物信息资源文本中的
主题词,而后根据知识及主题词的重要性对耦合后的知识进行重要性排序,按照知识与主题的关联程度实现文物
信息资源的知识推荐。【结果/结论】在实验中实现了不同网络文物信息资源的知识推荐,对比了不同数量主题词下
知识发现的效果,发现该方法在学术型文物信息资源的知识发现与推荐中效果较好。【创新/局限】利用知识库与信
息资源内容构建知识网络,通过计算网络节点的重要性进行知识推荐,为文物信息资源的利用提供了新的方法。
但受制于知识库知识储备的影响,可能无法挖掘信息资源的知识全貌。 相似文献
17.
18.
【目的/意义】在线健康社区的快速发展为用户获取医疗健康信息和服务提供了重要平台。但用户主要以 搜索和浏览信息为主,缺乏知识分享意愿,这将影响社区的可持续发展。整合信息系统成功模型和社会支持两个 视角,研究了在线健康社区用户知识分享行为。【方法/过程】对收集的326份有效问卷采用结构方程模型进行分 析。【结果/结论】研究结果发现,信息质量和服务质量显著影响用户对社区的信任,信息支持和情感支持显著影响 用户对其他成员的信任,信任和隐私风险决定用户知识分享的意愿。研究结果启示在线健康社区应重视信息服务 质量,为社区用户创造可信的互动环境,减少用户隐私担忧,从而促进成员的知识分享意愿和行为。 相似文献
19.
【目的/意义】不同学科知识的相互整合是交叉研究领域形成和发展的基础。对交叉领域知识整合过程的理解有助于促进交叉领域的知识发现和知识创新。【方法/过程】本文利用自然语言处理技术,从交叉领域文献题录数据、引文上下文和参考文献文本信息中抽取知识短语,以引证关系和词汇匹配关系为线索,提出吸纳知识和内化知识的识别方法,深入揭示交叉领域中“知识吸纳-知识内化”的知识整合过程。【结果/结论】以电子健康领域(eHealth)为例,揭示了该领域的知识内化总体特征和不同来源学科所提供知识的内化特征差异。【创新/局限】本文结合引文内容对交叉领域知识内化过程进行量化分析,提出了一种新颖的全文本量化分析方法,为理解交叉领域的知识生长过程提供了新的视角和分析方法。未来研究可以结合参考文献全文以进一步优化这一方法,同时在更多的交叉研究领域开展实证。 相似文献
20.
【目的/意义】对信息行为理论进行分类归纳,提出统一的思想框架。【方法/过程】运用模型分析方法,对经
典信息行为理论进行了综述,指出其发展的主要趋势,提出集成模型。【结果/结论】将信息行为理论划分为个体和
社群两大维度,以德尔文的意义构建论隐喻模型为胚底集成个体与社群维度的各种理论,提出知识行动者的心智-
行为集成模型。 相似文献