未来智讯 > 人脸语音识别论文 > 基于反卷积的双LSTM语音识别

基于反卷积的双LSTM语音识别

发布时间:2019-04-26 14:06:50 文章来源:未来智讯    
基于Bi-LSTM的反向卷积语音识别:未知摘要:自己的语音具有一定的性别背景,而传统语音识别系统在模拟历史信息时不会留下深刻的印象,学习性不能完全是语音序列。 为了解决这个问题,提出了一种基于反向卷积的双向非时间印象(Bi-LSTM)网络语音识别方法。 该模型在反向非时间印象单元路径的末尾添加卷积层。 两个完全相干的层,分类器输出的最终分辨率确定了局。 该模型与目前主流的深度学习模型进行了比较,证明该模型可用于提高语音识别的准确性。 关键词:语音识别; 双向是一种非时间印象神经网络; 深训练DOI:10.11907 / rjdk.173082中图分类号:TP301文档ID:A文章编号:1672-7800(2018)007-0027-04
摘要:Thespeechitselfhasacertaindegreeofcontextualrelevance.However,thelanguagemodelinthetraditionalspeechrecognitionsystemisnotcapableofrememberinghistoricalinformationandcannotsufficientlylearntherelevanceofthespeechsequence.Tosolvethisproblem,thispaperproposesaspeechrecognitionmethodbasedonreverseconvolutionaryBidirectionalLongShortTermMemory(双LSTM 网络。模式信息分析了内存中的内存信息路径,然后将信息连接到了最终的连接层。最后,认识到了分类器的输出。与现有的主流学习模型相比,这种模式有效地提高了它的速度。4结论本文讨论了主流的深度神经网络模型,发现传统模型存在一些问题。 例如,RNN模型中存在梯度湮灭问题,并且不可能保持长距离信息。 LSTM模型仅按时间顺序处理序列,忽略了Future信息; 应用于英语语音识别系统的Bi-LSTM模型可以解决上述问题。 它可以捕获历史信息,完全捕获语音序列向量的上下文信息,但单词识别准确率不高,训练时间长。 问题。 因此,本文提出了一种基于反卷积的Bi-LSTM模型,该模型参与反向LSTM路径末端的卷积层,以优化和减少语音特征参数并缩短训练时间。 已经尝试证明基于反向卷积的Bi-LSTM模型可以相对提高英语数字语音识别的准确性。 然而,在本文中,反向卷积的Bi-LSTM模型只进行了少量的训练和测试,仍有许多理论和应用问题需要进一步探索。 训练中使用的语音数据集仅为英文数字。 为了获得更好的识别效率,应收集更多不同类型的数据集以供进一步请求。 参考文献:[1]卢伟。 噪声情况下的语音识别算法[D]。 合肥:安徽大学,2011。[2]魏艳娜。 矢量量化语音识别技术技巧[D]。邯郸:河北工程大学,2007。[3]陈诚。 基于HMM的语音识别系统[D]。 长沙:中南大,2008。[4]陈硕。 深度学习神经网络在语音识别中的应用[D]。广州:华南理工大学,2013。 [5]周亚倩。 最大熵要素及其在自然语音处理中的应用[D]上海:复旦大学,2005。[6] SCHAPIRE,ROBERTE。强度弱化[J]。机器学习,1990,5(2):197-227。 [7] HINTONGE,OSINDEROS,TEHYW.Afastlearningalgorithmfordeepbeliefbelnets [J] .NeuralComputation,2006,18(7):1527-1554。 [8] DENGL.Anoverviewofdeep-structuredlearningforinformationprocessing [C]。西安:APSIPAASC,2011。 [9] GRAVESA,MOHAMEDA,HINTONG.使用dee预处理神经网络进行语音识别[C]。 在声学,语音和信号处理,2013 IEEE International Conference,2013:6645-6649。 [10] HOCHREITERS,SCHMIDHUBERJ。 长期记忆[J]。 NeuralComputation,1997,9(8):1735-1780。 [11] GRAVESA,SCHMIDHUBERJ。 FramewisephonemeclassificationwithbidirectionalLSTMandotherneuralnetworkarchitectures [J]。 NeuralNetworks,2005,18(5):602-610。 [12] LEVYO,ZESCHT,DAGANI,etal.UKP-BIU:similarityandentailmentmetricsforstudentresponseanalysis [C] .InSecondJointConferenceonLexicalandComputationalSemantics,2013:285-289。 (责任编辑:黄健)
转载请注明来源。原文地址:https://www.7428.cn/page/2019/0426/80381/
 与本篇相关的热门内容: