基于深网图像识别模型的语音认证模式 |
| |
引用本文: | 潘树诚,章坚武.基于深网图像识别模型的语音认证模式[J].教育技术导刊,2018,17(10):22-26. |
| |
作者姓名: | 潘树诚 章坚武 |
| |
作者单位: | 杭州电子科技大学 通信工程学院,浙江 杭州 310018 |
| |
摘 要: | 目前,互联网身份认证普遍采用单一的固定密码认证模式,认证安全性非常低,因此迫切需要一种安全系数高又能普及的身份认证方式。声纹作为一种高活性生物特征,用于身份认证具有十分广阔的应用前景。基于深度学习(DL)的语音认证系统包含两个模型:声纹辨别(VI)模型和声纹文本匹配(VTM)模型,都基于卷积神经网络(CNN)。其中,VI模型是一个二分类模型,主要用于确认当前说话人是否为恶意(录音)攻击者;VTM模型是一个多分类模型,主要用来匹配用户预先设定的身份认证信息。通过实验,两个模型在ASVD数据集的识别率分别达到100%和98.3%,相比caffe-net模型,VTM模型的识别率提高了10.8个百分点。
|
关 键 词: | VI模型 VTM模型 深度学习 卷积神经网络 |
|
| 点击此处可从《教育技术导刊》浏览原始摘要信息 |
| 点击此处可从《教育技术导刊》下载免费的PDF全文 |
|