首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 671 毫秒
1.
文章提出了一种基于本体和设计情景的产品设计领域知识问答系统解决方案,利用本体表示产品设计知识库,提出了基于问句语义特征匹配的问题分类算法以及本体查询转换技术,并充分考虑问句中带有设计情景的复杂问题,提出情景相似度和问句相似度综合加权的设计情景问题相似度算法,最后设计实现了身管设计知识问答系统,并对实验结果进行分析验证方案的可行性。  相似文献   

2.
网上销售以多媒体方式展示产品,销售人员使用即时通讯工具进行客户服务。问答系统可以将销售人员从简单智能活动中解放出来,进一步提高生产效率和降低成本。系统由问题分析处理、信息检索、答案分析处理3大部分组成,问句与答案之间的相似度计算是整个系统的核心部分。系统对于超出范围的问句,使用人工坐席进行辅助。知识表示和智能Agent的应用,可以进一步减少对人工干预的依赖。  相似文献   

3.
本文利用统计翻译模型计算单词之间的语义相似度,并将此语义信息嵌入至核函数,实现了一个基于语义核函数的问句检索系统,利用语义核函数计算问句之间的语义相似度。通过在真实问答对数据上进行的实验,表明基于语义核函数的问句检索模型的效果优于传统的相似度计算模型,可以提高问句语义匹配准确率,具有一定的实用性。  相似文献   

4.
桂思思  徐健 《情报科学》2021,39(11):90-95
【 目的/意义】针对查询意图歧义性自动识别,探讨特征有效性及采用不同分类算法识别三类查询意图歧义 性的分类准确率,以期对后续研究提供借鉴与指导。【方法/过程】首先提出了一个面向查询意图歧义性的查询表达 式分类体系;随后,构建了查询表达式特征及相关文档特征共六类;最后,分别采用决策树算法、神经网络算法及k 最邻近算法,探讨采用不同特征组合的有效性及不同分类算法的分类准确率。【结果/结论】①分类准确率较基准实 验提升比例为49.5%;②使用查询表达式特征分类优于使用相关文档特征;③决策树的分类准确率略高于其他两类 分类算法。【创新/局限】构建了一个面向查询意图歧义性的查询分类体系;完成了面向三类查询意图歧义性的分类 任务;然限于数据集获取途径,仅对200数据验证。  相似文献   

5.
相似度计算是自动问答领域里的重要内容。为了保证候选答案集中各答案能具备合理的排序,解决传统自动问答系统不能高效的综合评价相似度问题,提出利用综合指数法对关键词相似度、语义相似度等进行综合评价,得到综合相似度。并针对部分候选答案冗余信息过多,不利于答案提取的情况,设计了衰减相似度参数,用来解决句子冗余信息对答案提取的影响。实验结果表明,综合指数法的相似度算法能够有效的提高问答的正确率。  相似文献   

6.
王日花 《情报科学》2021,39(10):76-87
【目的/意义】解决自动问答系统构建过程中数据集构建成本高的问题,以及自动问答过程中仅考虑问题或 答案本身相关性的局限。【方法/过程】提出了一种融合标注问答库和社区问答数据的数据集构建方法,构建问题关 键词-问题-答案-答案簇多层异构网络模型,并给出了基于该模型的自动问答算法。获取图书馆语料进行处理作 为实验数据,将BERT-Cos、AINN、BiMPM模型作为对比对象进行了实验与分析。【结果/结论】通过实验得到了各 模型在图书馆自动问答任务上的效果,本文所提模型在各评价指标上均优于其他模型,模型准确率达87.85%。【创 新/局限】本文提出的多数据源融合数据集构建方法和自动问答模型在问答任务中相对于已有方法具有更好的表 现,同时根据模型效果分析给出用户提问词长建议。  相似文献   

7.
针对基于word2vec的专利语义检索方法无法处理多义词引起的召回率低,同时需要大量内积运算从而检索效率低下等问题,本文设计了一种基于Bert与Milvus的专利智能语义检索系统。系统将专利标题和摘要文本通过Bert预训练模型转化为词向量,并导入Milvus向量检索引擎,从而实现语义检索功能。同时,基于Django架构,在前端使用Vue.js进行网页的设计,再结合MySQL数据库,最终实现了一个专利的智能语义查询系统。系统分为登录管理模块、系统模块、个人中心模块、用户数据管理模块、检索模块五个模块的分析设计与实现。开发的智能语义检索系统在手工标注的专利数据集上测试,其检索召回率达到86%,平均准确率达到80%。实验证明通过Bert能有效提高检索准确率。同时,通过Bert结合Milvus,可以快速搭建智能语义检索系统。  相似文献   

8.
余本功  王胡燕 《情报科学》2021,39(7):99-107
【目的/意义】对互联网产生的大量文本数据进行有效分类,提高文本处理效率,为企业用户决策提供建 议。【方法/过程】针对传统的词向量特征嵌入无法获取一词多义,特征稀疏、特征提取困难等问题,本文提出了一种 基于句子特征的多通道层次特征文本分类模型(SFM-DCNN)。首先,该模型通过Bert句向量建模,将特征嵌入从 传统的词特征嵌入升级为句特征嵌入,有效获取一词多义、词语位置及词间联系等语义特征。其次,通过构建多通 道深度卷积模型,将句特征从多层级来获取隐藏特征,获取更接近原语义的特征。【结果/结论】采用三种不同的数 据对模型进行验证分析,采用对比相关的分类方法,SFM-DCNN模型准确率较其他模型分类性能有所提高,这说 明该模型具有一定的借鉴意义。【创新/局限】基于文本分类中存在的一词多义、特征稀疏问题,创新性地利用Bert来 抽取全局语义信息,并结合多通道深层卷积来获取局部层次特征,但限于时间和设备条件,模型没有进行进一步的 预训练,实验数据集不够充分。  相似文献   

9.
[目的/意义]围绕图书功用分类问题,提出开展图书功用自动化分类研究,并融合预训练和深度学习方法进行实现方案设计,为图书功用属性揭示和信息组织提供参考。[方法/过程]文章基于功用视角进行图书分类体系调研与数据验证,构建图书功用分类体系框架。在此基础上,融合BERT预训练模型和BiLSTM模型构建图书功用分类模型,并基于大规模数据集进行实验验证。[结果/结论]实验结果显示,模型的准确率达到0.89以上,召回率达到0.87以上,总体效果相对较好,能够较为准确地实现图书功用特征的提取。  相似文献   

10.
王佳敏  吴乐艳  李鹏程  熊资  陆伟  杜佳 《情报科学》2021,39(11):173-179
【目的/意义】本文构建了一个大规模学术文献致谢功能数据集,并提出一种基于SciBERT的致谢功能识别 模型,为致谢文本的挖掘和分析提供高质量的数据支持和有效的识别方法。【方法/过程】采用人工的方式扩展和完 善致谢功能分类规则,生成学术文献致谢功能自动标引规则模板,对1,750,275条致谢文本进行功能标引。在此基 础上,采用 SciBERT 模型对致谢文本句进行向量表达,引入 Softmax 回归模型实现致谢功能自动分类,采用 warmup策略进行模型调优,并与基准实验进行对比。【结果/结论】得到一个大规模、高质量的学术文献致谢功能数 据集,经人工检验准确率达到93%;基于SciBERT的识别模型比基准模型表现更好,在扩展数据集上的F1值高于 98%,在各个类别上的预测结果也有不同程度的提升。【创新/局限】致谢功能识别模型缺少对致谢文本独有特征的 考虑和融合。  相似文献   

11.
物联网涉及学科种类多、专业性强、知识体系不完善,现有搜索引擎难以准确回答物联网专业问题。为此,本文设计实现了一种面向物联网教学的智能问答系统IEQA(Io T Education QuestionAnswer),IEQA通过提取实体并分析实体关系获得问题的结构化表示,进而生成查询语句,最后在知识图谱中查询问题答案。为提高实体关系准确性,本文还设计了一种基于模板相似度匹配的实体关系分析算法TBRA(Template-based Relationship Analysis),与传统基于规则的算法相比,准确率高且工作量少。实验表明,基于TBRA构建的IEQA系统可以在极短时间内找到问题准确答案,比传统搜索更为高效。  相似文献   

12.
[目的/意义]为帮助用户在拥有海量文本信息的问答社区高效率、高质量定位到符合自身需求的信息。[方法/过程]本文提出基于主题特征的问答文本摘要生成模型,该模型融合Word2Vec和SLDA算法多层次表达问答文本语义特征,而后基于图排序的思想,结合MRR冗余控制算法与文本句特征标签,调整句子权重,高效筛选出贴合问题标签的摘要内容。[结果/结论]本文对知乎问答社区多个问题下的问答文本数据进行验证,结果证明该模型具有较高的可行性和有效性。但本文选取了500份回答文本数据进行实证,未来可进一步扩大数据量开展更为充分的验证。  相似文献   

13.
随着人工智能技术的不断发展,直升机的智能化程度越来越受到人们的重视。本文设计了直升机智能交互系统架构,并基于卷积神经网络训练了用户意图识别模型,在数据集上对模型进行了验证,平均准确率达到了94.6%,说明了所提架构的有效性。  相似文献   

14.
[目的/意义]针对在线医疗社区问答文本复杂程度高、结构化程度低的特点,结合卷积神经网络(CNN)和双向长短记忆神经网络(BiLSTM)两种深度学习模型以及条件随机场(CRF)模型,提出一套适用于在线医疗问答文本的实体识别方法并进行验证。 [过程/方法] 将问答文本进行清洗和BIO标注后,分别用CNN和BiLSTM进行字级别的特征抽取,将两种模型抽取到的特征进行融合,后放入CRF中训练出实体预测模型,再将问答文本放入训练好的模型中得到最终的实体识别结果。[结果/结论]在所选取的乳腺癌医疗社区问答文本数据集上,所提出的方法结果优于其他模型,且识别准确率达到92.3%,召回率达到89.3%,F值达到90.8%。  相似文献   

15.
   潜在标准必要专利在未来市场中具有极高的战略价值和经济价值,企业如何抢先识别这些专利对建设创新型国家、优化企业专利布局、加快技术创新、提升行业地位、规避专利挟持具有重要意义。但目前关于自动化识别潜在标准必要专利的研究尚少。本文从提取标准必要专利语义特征的视角下,提出利用Bert-CNN网络模型结合上下文对已知标准必要专利的隐性全局语义特征和高维层次语义特征双重提取,依据特征提取结果识别潜在标准必要专利,并通过计算Bert向量相似度预测潜在标准必要专利可能对应的标准。实证部分以ETSI欧洲标准化协会发布的标准必要专利构建数据验证集对模型的性能进行验证,结果显示本模型在大规模专利数据实验中的精准率、召回率、F1值优于已有研究。  相似文献   

16.
【目的/意义】通过概念层次关系自动抽取可以快速地在大数据集上进行细粒度的概念语义层次自动划分, 为后续领域本体的精细化构建提供参考。【方法/过程】首先,在由复合术语和关键词组成的术语集上,通过词频、篇 章频率和语义相似度进行筛选,得到学术论文评价领域概念集;其次,考虑概念共现关系和上下文语义信息,前者 用文献-概念矩阵和概念共现矩阵表达,后者用word2vec词向量表示,通过余弦相似度进行集成,得到概念相似度 矩阵;最后,以关联度最大的概念为聚类中心,利用谱聚类对相似度矩阵进行聚类,得到学术论文评价领域概念层 次体系。【结果/结论】经实验验证,本研究提出的模型有较高的准确率,构建的领域概念层次结构合理。【创新/局限】 本文提出了一种基于词共现与词向量的概念层次关系自动抽取模型,可以实现概念层次关系的自动抽取,但类标 签确定的方法比较简单,可以进一步探究。  相似文献   

17.
针对移动电子商务消费者和商家对智能客服的需求,设计一种支持消费者购买意向评估和语音自动问答的跨平台智能客服系统,依据消费者购买意向大小优化商家人工客服响应顺序,实现自动客服与人工客服的有效融合。实验结果表明,智能客服系统能够有效提高移动电子商务消费者对商家客服的满意度和店铺的订单成交率,降低商家人工客服的工作量和消费者在线咨询的平均等待时间。  相似文献   

18.
王浩君  周斌  潘玉良 《科技通报》2020,36(3):43-48,58
海上舰船目标分类检测技术可广泛用于海事监管、船只救援、打击非法犯罪等活动,具有重要应用价值。本文选取高分辨率光学遥感影像进行数据筛选及预处理,建立了含有2. 4万艘不同类型舰船的分类检测数据集。依据中华人民共和国海事局《船舶登记工作规程》中的舰船分类规则,结合遥感影像实际情况,建立了基于遥感影像的海上舰船分类体系。通过搭建深度学习训练平台,使用YOLOv3神经网络算法对舰船进行分类检测。在测试集上对训练完成的模型进行验证,舰船分类检测结果的召回率达到91%以上,准确率达到95%以上。在GPU加速的情况下,可达30 fps以上的检测速率,使得该模型在具备鲁棒性和准确性的同时也具备实时分类检测的能力。  相似文献   

19.
[目的/意义]作为科技创新的重要手段,技术融合预测对于改进技术研发的策略选择具有重要参考和借鉴意义,文章提出一种专利共类与深度学习模型结合的技术融合预测方法,以提高预测结果的准确性和可靠性。[方法/过程]以燃料电池技术为例,首先采用关联规则挖掘算法识别专利数据中具有强关联的IPC频繁项集,计算技术相对相似度,基于AP聚类算法进行技术聚类;然后运用生成式拓扑映射算法识别其中技术融合点,构建训练数据集和测试数据集。最后基于深度学习模型进行学习训练,预测燃料电池技术未来可能出现的技术融合。[结果/结论]这种方法在准确率和召回率上表现优异,可以快速、客观地识别技术融合,为技术创新的智能决策和预测提供支持和帮助。  相似文献   

20.
随着自然语言处理技术的快速发展,藏文信息处理技术也取得了较大进展。其中,藏文舆情分析作为藏族地区社会舆情分析的重要技术,受到广泛关注。但是,现有的藏文文本情感分析研究由于起步较晚,还存在很大提升空间。本文提出基于深度集成学习的藏文文本情感分析算法。并通过建立藏文情感数据集进行实验,本文算法在三类情感(正向、负向、中性)中精确率平均提升1.65%,召回率提升1.63%,F1分数提升1.96%。实验结果表明,本文采用的深度集成学习有效地提高了文本情感分类的性能。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号