共查询到20条相似文献,搜索用时 31 毫秒
1.
针对钢板表面缺陷图像分类传统深度学习算法中需要大量标签数据的问题,提出一种基于主动学习的高效分类方法。该方法包含一个轻量级的卷积神经网络和一个基于不确定性的主动学习样本筛选策略。神经网络采用简化的convolutional base进行特征提取,然后用全局池化层替换掉传统密集连接分类器中的隐藏层来减轻过拟合。为了更好的衡量模型对未标签图像样本所属类别的不确定性,首先将未标签图像样本传入到用标签图像样本训练好的模型,得到模型对每一个未标签样本关于标签的概率分布(probability distribution over classes, PDC),然后用此模型对标签样本进行预测并得到模型对每个标签的平均PDC。将两类分布的KL-divergence值作为不确定性指标来筛选未标签图像进行人工标注。根据在NEU-CLS开源缺陷数据集上的对比实验,该方法可以通过44%的标签数据实现97%的准确率,极大降低标注成本。 相似文献
2.
在线健康社区用户信息需求的层级多标签分类研究 总被引:1,自引:0,他引:1
[目的/意义]用户健康信息需求研究能够发现用户潜在需求,解决用户健康信息盲区,帮助用户实现更好的自我健康管理。研究目标为挖掘识别用户信息需求主题,提取用户特征,促进完善网络社区交互性与多元性发展,为更好地改善健康信息服务提出建议与意见。[方法/过程]针对在线健康社区的母婴群体,提出在线健康社区用户信息需求层级多标签分类模型。通过扎根理论提出在线健康社区用户信息需求主题体系,利用ALBERT对母婴健康需求类数据进行预训练,使用双向GRU与注意力机制构建基础分类器,以此来构建层级多标签分类模型Multi-BiGRU-Attention,实现在线健康社区提问数据的层级多标签分类。[结果/结论]实验对比发现,随着层级的增加,研究提出的模型相比于单层的基础分类器BiGRU-Attention在micro-Precision, micro-Recall, micro-F1等各项指标上均有所提升,说明该模型的层级结构信息能够一定程度上改善模型效果;相比于层级多标签相关模型,在各项指标上均有所提升,说明该模型存在一定的适用性与扩展性。 相似文献
3.
4.
【目的/意义】由于自媒体平台中的多标签文本具有高维性和不平衡性,导致文本分类效果较差,因此通过
研究5G环境下高校图书馆自媒体平台多标签文本分类方法对解决该问题具有重要意义。【方法/过程】本文首先通
过对采集的5G环境下高校图书馆自媒体平台多标签文本进行预处理,包括无意义数据去除、文本分词以及去停用
词等;然后采用改进主成分分析方法进行多标签文本降维处理,利用向量空间模型实现文本平衡化处理;最后以处
理后的文本为基础,采用Adaboost和SVM两种算法构建文本分类器,实现多标签文本分类。【结果/结论】实验结果
表明,本文拟定的自媒体平台标签文本分类方法可以使汉明损失降低,F1值提高,多标签文本分类效果好,且耗时
较低,具有可靠性。【创新/局限】由于本研究中的数据集数量不够多,所以在测试和验证方面,得出的结果具有一定
局限性。因此在未来研究中期望利用更为丰富的数据库,对所设计的方法做出进一步的改进与创新。 相似文献
5.
6.
7.
[目的/意义]构建多源数据融合获得细粒度的用户画像标签,加强和提升服务场景的用户画像识别与精准推荐,对于洞察用户需求、开展群体精准营销、提高用户忠诚度等有着重要的参考意义。[方法/过程]融入服务场景构建多源数据融合的用户画像识别与推荐分析框架,以用户价值模型RFM重构表征用户行为的RFCLS标签,采用LDA模型提取用户资源使用偏好的文本语义标签,继而将用户属性、用户行为和资源使用偏好等多源异构数据汇聚成用户画像标签体系后,选取随机森林模型对不同标签组合展开用户画像识别的模型训练和分类性能评估。[结果/结论]实证研究表明,与单一的数值型或者文本型画像标签体系相比,多源数据融合的用户画像模型提升了用户画像识别和分类的精准度,有效支撑高校图书馆开展更为针对性的营销服务策略和个体精准化服务推荐。 相似文献
8.
【目的/意义】为在线医疗问诊平台中的医生自动生成高质量标签,更好地服务于对医生资源的分类、检索和管理。【方法/过程】基于在线问诊文本信息,提出了结合时间周期特征与文本主题特征的医生标签自动生成算法。首先根据医生相关文本信息提取关键词生成候选标签,然后从患者问题文本和医生回答文本两个方面进行LDA主题模型训练,按时间周期挖掘出问题文本和回答文本的主题特征,对候选标签进行质量控制;最后经标签加权混合后得到最终的医生标签。【结果/结论】实验结果表明,该标签自动生成算法能够反映出医生标签生成的动态性,能够准确生成符合医生专业知识特征的高质量标签,具有较好的标签生成效果。 相似文献
9.
10.
非物质文化遗产数据库对非遗资源的分类,必须遵从《非物质文化遗产数字化保护专业标准》,但这种分类方式存在一些问题。为了充分揭示非遗资源的特性和非遗资源之间的文化关联性,以建设承德地区非遗数据库为例,引入大众标注标引资源的方式来补充专家分类的不足:用户协作建设基础标签库,使用基础标签作为推荐标签,使用时间、空间、文化场所标签作为文化空间标签,由推荐标签等形成的高频标签作为专家分类的二级类目的备选,构建基于用户协作的非遗数字资源混合分类模式。 相似文献
11.
[目的/意义]目前各大电子商务网站产生了海量的评论信息,对于消费者而言,查阅和分析这些信息将面临巨大的挑战。因此,有必要对评论的有用性进行综合评价,为消费者过滤出真正有价值的内容。[方法/过程]为此,本文提出并研究了一种在线消费者评论的有用性评价模型,为消费者的网购决策提供支持。该模型主要基于分类算法,识别在线消费者评论的有用性,并按其概率值大小进行排序。根据在线消费者评论的特点,提取了一系列分类特征用于其有用性评价,然后利用支持向量机对评论进行分类并从中识别有用的记录。利用来自B2C电子商务网站的3个在线消费者评论数据集(手机、女鞋、糖果巧克力)对提出的模型进行实证分析。[结果/结论]研究结果显示,该模型能够量化地评价在线消费者评论的有用性并对其进行有效的分类排序。该模型主要依赖语义特征进行排序,而对非语义特征的依赖较少。通过选择合适的概率阈值,能够缩小验证空间,并显著提升分类精确度。 相似文献
12.
为了提高垃圾标签检测精度,提出一种核K均值聚类和改进神经网络相融合的垃圾标签检测模型。首先核K均值聚类算法提抽取垃圾标签的特征向量,然后将特征向量集输入到BP神经网络进行训练,并采用混沌粒子群算法对BP神经网络的参数进行优化,最后建立垃圾标签检测模型,并通过仿真实验对模型性能测试。结果表明,该垃圾标签检测算法模型不仅提高了垃圾标签识别率,训练时间大幅度减少,垃圾标签检测效率得到提高,可以较好满足垃圾标签实时、在线检测要求。 相似文献
13.
【目的/意义】为了提高图书情报的实时检索能力,需要进行图书情报共引数据整合模型设计。【方法/过程】
提出一种基于文献计量共引分析的图书情报数据的整合方法,构建图书情报文献计量共引数据整合的射频标签识
别模型,采用RFID标签技术进行图书情报文献计量共引数据的自动采样,对采样的大数据采用语义相似度特征提
取方法进行信息融合;结合文献计量共引分析方法进行图书情报数据的自适应聚类分析和整合分类,构建反映图
书情报归类的语义本体模型。通过自相关特征匹配方法实现对图书情报文献计量共引数据的优化分类检索和整
合。【结果/结论】测试结果表明,采用该模型进行图书情报文献计量共引数据整合的分类性能较好,数据检索的查
全率和查准率较高,提高了图书情报的检索效率。 相似文献
14.
进入Web2.0时代,大众分类成为其中一种主要的信息组织方式之一,而大众分类则是通过标签系统实现对网络信息资源的分类,因此标签在大众分类中占据重要地位。以豆瓣网中的"豆瓣电影"为例,分析标签检索存在的局限,并提出对应的优化方法和措施。 相似文献
15.
当前建设工程合同管理工作量大,长期依赖人工审核和主观经验,为改变合同审查依赖主观经验的现状,进一步探索和实现合同条款智能识别和智能审核,尝试引入基于深度学习(DL)的自然语言处理(NLP)技术,提出一种建设工程合同智能分类方法。首先,设计合同智能分类方案,分别采用卷积神经网络(CNN)、长短期记忆网络(LSTM)和融合模型进行计算实验;其次,将CNN和LSTM模型用于合同文本特征提取和合同文本分类中,通过融合两个神经网络以提升分类模型的性能指标。结果显示,精确率和召回率的调和平均数(F1值)最高的为融合模型,其次是LSTM模型,CNN模型最低。相较于基于机器学习的其他同类研究,基于NLP和DL的建设工程合同分类融合模型能够提高合同文本分类任务的效果,实现对大规模数据量的施工、勘察、监理等不同类型合同的准确识别以及快速分类和归档。 相似文献
16.
在射频识别(Radiofrequency Identification)系统的应用过程中,有一个关键的问题,就是当多个标签同时出现在识别区域时,如何无遗漏的读取各个标签的信息而不产生读取碰撞。本文基于动态树形技术对RFID防碰撞算法进行了研究。结果表明,该方法能够较好地解决标签读取碰撞问题。 相似文献
17.
18.
提出一种基于模糊的客户细分方法——多因子评价模型。该模型采用客户生命周期时间、客户生命周期价值、客户份额和客户满意度作为客户分类的评价因子,对客户进行快速有效的分类。该模型既注重客户的行为,也考虑了培养客户成长的影响。 相似文献
19.
一种基于主题和分众分类的信息检索优化方法 总被引:1,自引:0,他引:1
本文针对目前搜索引擎存在的检索结果缺乏组织导致检准率不高的问题,提出一种基于主题和分众分类的信息检索优化方法.首先对用户检索主题进行获取和表达,然后以社会标签为聚类项,采用向量空间模型实现基于分众分类的文档主题聚类,并将检索结果按相似度和标签"受欢迎度"复合排序,达到提高检索准确率和优化检索的效果. 相似文献
20.
【目的/意义】通过对大数据环境下的多源用户兴趣特征有效融合,缓解个性化推荐中用户兴趣偏好数据的稀疏性和准确性问题。【方法/过程】考虑到多域的数据权威度、内容质量及体系结构的差异化较为明显,提出了基于多源用户标签的跨域兴趣融合模型,首先把多个域中的用户兴趣进行标签化处理,然后利用跨域用户识别和标签权重归一方法得到多个域的用户实体-标签矩阵,最后使用域权重影响系数对标签进行融合,构造具有复合权重的用户兴趣标签集。【结果/结论】使用5个来源数据域进行实验与分析,融合模型能够有效提高标签用户覆盖效果,在查全率不断提高的情况,融合域能够保持较高的标签用户查准率,有效提高用户兴趣特征的描绘效果。 相似文献