0-9(Speech-Recogenition) - 源码下载|其它|语音合成与识别|源代码

用matlab仿真0到9十个数字的语音识别

1、对语音的WAV文件和LAB文件进行处理，产生十个文件，每个文件对应于一个数字，存贮着该数字的波形文件。（shujuzhengli.m）

2、分别利用上面十个文件训练出十个HMM模板，具体方法是：首先将语音的波形文件分帧，以128个点为一帧，帧移为64，每一帧通过mfcc.m计算出13个系数，随着波形的长度不同，一个语音文件可以计算得到13*N个系数，截取13*15的矩阵（mfcc系数）用作训练数据。一般一个HMM模板用20组mfcc系数训练，得到初始状态分布、状态转移矩阵、高斯正态分布的均值和方差以及混合矩阵，这就是该语音的特征，存贮下来，识别的时候使用。（trainmfcc.m）

3、识别过程：识别的前面部分与训练相似，都是要计算得到mfcc系数，不同在于，识别时，将计算得到的mfcc 参数分别代入训练得到的HMM模板求出概率，比较出最大概率者，则该模板对应的数字就是识别的数字。(shibiesb.m)

4、用大量语音文件做测试，结果正确率为90 以上。-Speech Recogonition: Mumber 0-9
相关搜索：语音识别
mfcc
语音识别
matlab
speech
matlab
speech
语音
matlab
matlab
语音识别
speech
0-9
MATLAB
mfcc
matlab

(系统自动生成,下载前可以参看下载内容)

下载文件列表

dist2.m

em_converged.m

fwdback.m

gaussian_prob.m

gmm.m

gmminit.m

isposdef.m

kmeansNetlab.m

logdet.m

max_mult.m

mfcc.m

mhmm_em.m

mhmm_logprob.m

mixgauss_init.m

mixgauss_Mstep.m

mixgauss_prob.m

mk_stochastic.m

normalise.m

process_options.m

READHTK.M

readlab.m

shibiesb.m

shujuzhengli.asv

shujuzhengli.m

sqdist.m

t200.lab

t200.wav

t201.lab

t201.wav

t202.lab

t202.wav

t203.lab

t203.wav

tongjijieguo.m

trainmfcc.m

consist.m

下载资源主分类

源码下载

Web源码

开发工具

文档下载

其它资源

资源分类

在结果中搜索

相关资源

文件名称:0-9(Speech-Recogenition)

介绍说明－－下载内容均来自于网络，请自行研究使用

下载文件列表

相关说明

相关评论

发表评论

源码中国 www.ymcn.org

*主　　题：
*内　　容：
*验证码：