文件名称:matlabtosolve
介绍说明--下载内容均来自于网络,请自行研究使用
基于MATLAB实现的说话人识别程序,分别用bp、pnn、som、rbf、lvq等算法,对语音文件进行训练和测试,效果不错。~..~
下面说明一下bprengong程序:
数据分别用来训练和测试两部分。
具体程序分为两部分,第一部分为:计算识别模型 变量v是mfcc处理以后的矢量。因为数据可能长短不一,所以放在同一进行截取。p的每一行代表一个语音数据(共15个)。变量Pr为每一行的最大最小值。变量T为目标值。输出神经元个数为15。
在训练阶段,如果用于训练的输入训练样本的类别标号为i(即语音数据的标号),则训练时设第i个节点的期望输出设为1。其余节点期望输出均为0。
在识别时,当一个未知类别的样本作用到输入端时,考查各输出节点的输出,并将这个样本的类别判定为输出值最大的那个节点对应的类别。
下面说明一下bprengong程序:
数据分别用来训练和测试两部分。
具体程序分为两部分,第一部分为:计算识别模型 变量v是mfcc处理以后的矢量。因为数据可能长短不一,所以放在同一进行截取。p的每一行代表一个语音数据(共15个)。变量Pr为每一行的最大最小值。变量T为目标值。输出神经元个数为15。
在训练阶段,如果用于训练的输入训练样本的类别标号为i(即语音数据的标号),则训练时设第i个节点的期望输出设为1。其余节点期望输出均为0。
在识别时,当一个未知类别的样本作用到输入端时,考查各输出节点的输出,并将这个样本的类别判定为输出值最大的那个节点对应的类别。
(系统自动生成,下载前可以参看下载内容)
下载文件列表
压缩包 : 67506229matlabtosolve.rar 列表 data\test\s1.wav data\test\s10.wav data\test\s11.wav data\test\s12.wav data\test\s13.wav data\test\s14.wav data\test\s15.wav data\test\s2.wav data\test\s3.wav data\test\s4.wav data\test\s5.wav data\test\s6.wav data\test\s7.wav data\test\s8.wav data\test\s9.wav data\test data\train\s1.wav data\train\s10.wav data\train\s11.wav data\train\s12.wav data\train\s13.wav data\train\s14.wav data\train\s15.wav data\train\s2.wav data\train\s3.wav data\train\s4.wav data\train\s5.wav data\train\s6.wav data\train\s7.wav data\train\s8.wav data\train\s9.wav data\train data bprengong.m cfmfcc.m demo1.m demo2.m demo3.m ENFRAME.M lvqrengong.m MELBANKM.M melfb.m mfcc.m pnnrengong.m rbfrengong.m somrengong.m vad.m 说明.txt