基于深网图像识别模型的语音认证模式期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

按检索

基于深网图像识别模型的语音认证模式

引用本文：	潘树诚,章坚武.基于深网图像识别模型的语音认证模式[J].教育技术导刊,2018,17(10):22-26.

作者姓名：	潘树诚章坚武

作者单位：	杭州电子科技大学通信工程学院，浙江杭州 310018

摘要：	目前，互联网身份认证普遍采用单一的固定密码认证模式，认证安全性非常低，因此迫切需要一种安全系数高又能普及的身份认证方式。声纹作为一种高活性生物特征，用于身份认证具有十分广阔的应用前景。基于深度学习（DL）的语音认证系统包含两个模型：声纹辨别（VI）模型和声纹文本匹配（VTM）模型，都基于卷积神经网络（CNN）。其中，VI模型是一个二分类模型，主要用于确认当前说话人是否为恶意（录音）攻击者；VTM模型是一个多分类模型，主要用来匹配用户预先设定的身份认证信息。通过实验，两个模型在ASVD数据集的识别率分别达到100%和98.3%，相比caffe-net模型，VTM模型的识别率提高了10.8个百分点。
关键词：	VI模型 VTM模型深度学习卷积神经网络

	点击此处可从《教育技术导刊》浏览原始摘要信息
	点击此处可从《教育技术导刊》下载免费的PDF全文