GMM-ResNext:革新说话人验证技术的新星
摘要
本文介绍了一种名为GMM-ResNext的新型模型,该模型结合了生成模型(GMM)和判别模型(ResNext)用于说话人验证。传统的GMM模型在处理语音特征时忽略了帧特征在所有高斯组件上的得分分布以及相邻语音帧之间的关系。GMM-ResNext模型通过提取基于原始声学特征的对数高斯概率特征,并使用ResNext网络作为主干来提取说话人嵌入,从而提高了模型的泛化能力。实验结果显示,该模型在VoxCeleb1-O测试集上相对于ResNet34和ECAPA-TDNN实现了显著的性能提升。
Read more...








