未来智讯 > 人脸语音识别论文 > 语音辨认技艺原理概述
    语音辨认技艺原理概述作者:未知  摘 要:语音辨认技艺作为信息社会向智能化成长的关头技艺之一,对人们的糊口发生着普遍的影响,具有严重的切磋意义和适用价值。本文归纳综合先容了语音辨认技艺和语音辨认技艺体系的兑现原理,并对语音辨认技艺的成长趋向做了简略的阐明。
  关头词:语音辨认;特性参数提取;隐马尔可夫模子
  0 引言
  语音辨认作为一门交织学科,近30年来获得麻利的成长,逐步由尝试室技艺向市场产物转化,越来越多地应用到人们的糊口中。语音辨认由于具有利便快捷、易于把握的上风,会被应用到越来越多的范畴中,对人们的糊口发生更普遍的影响。
  1 语音辨认技艺概述
  语音辨认技艺便是让机械议决辨认和领会过程把语音旌旗灯号转折为响应的文本或下令的高技艺。语音辨认技艺因此语音旌旗灯号为切磋对象,涉及旌旗灯号处置、模式辨认、几率论和信息论、人造智能等多个范畴。
  1.1 语音辨认体系分类体式格局
  语音辨认技艺具有多种分类体式格局,多见的有凭据辨认对象分类、是否针对特定发音人和待辨认语音的词汇量巨细鳳体式格局。
  凭据辨认的对象各异,能够分为联力词辨认,关头词辨认和赓续语音辨认三类。个中,联力词辨认的义务是辨认事先已知的联力的词;关头词辨认的义务是检测赓续语音中已知的若干关头词的位置,但并不辨认所有文字;赓续语音辨认的义务则是辨认随意率性的赓续语音。
  凭据针对的发音人,能够把语音辨认技艺分为特定人语音辨认和非特定人语音辨认。特定人语音辨认只可辨认一个或几小我的语音,而非特定人语音辨认则能够辨认任何人的语音。非特定人语音辨认体系更相符现实必要,但兑现难度更大。
  凭据待辨认语音的词汇量巨细,能够分为小词汇量、中等词汇量和大词汇量语音辨认体系。小词汇量语音辨认体系的辨认局限为几十个词,中等词汇量的语音辨认体系的辨认局限为几百个词到千个词,而大词汇量语音辨认体系的辨认局限为几千到几万个词。
  2 语音辨认体系兑现原理
  各异语音辨认体系的具体兑现细节各异,但基本的技艺原理相似。一个基本的语音辨认体系首要包罗语音辨认单位的采用、特性提取技艺、模式匹配规则和模子训练技艺四个局部。
  2.1 语音辨认单位的采用
  语音辨认单位有单文句、音节和音素三种。起首必要凭据切磋的具体义务确定辨认的单位:单文句单位普遍应用于中小词汇语音辨认体系,但不适合大词汇体系;音节单位常见于汉语语音辨认;音素单位以前常见于英语语音辨认的切磋中。
  2.2 特性参数提取技艺
  特性参数提取的目的是从语音旌旗灯号中提掏出对语音辨认有效的信息,即去除与辨认无关的冗余信息,保持与辨认相关的信息。今朝应用最普遍的特性参数提取技艺为线性展望(LP)剖析技艺,很多老练的语音辨认体系都选取基于LP技艺提取的倒谱参数。Mel参数和基于感知线性展望(PLP)剖析提取的感知线性展望倒谱也是常用的特性参数提取要领。
  2.3 模子训练及模式匹配技艺
  模子训练是指凭据必然的规则,从大量己知模式中猎取表征该模式性子特性的模子参数,语音辨认便是议决这些提取的特性参数所设立的。模式匹配是按照必然的规则,使未知模式与模子库中的某一个模子得到最好匹配。常用的模子训练及模式匹配技艺有动态时间规整技艺(DTW)、隐马尔可夫模子(HMM)和人造神经元网络(ANN)。
  动态时间规整技艺是基于动态规划的思惟,解决了发音是非纷歧的模板匹配问题,普遍应用在联力词的语音辨认中,但不适合赓续语音和大词汇量辨认体系。
  隐马尔可夫模子由相互联系的两个随机过程共描绘旌旗灯号的统计特征,个中一个是隐蔽的(不行观测的)具有有限状况的链,另一个是与链的每一状况有关联的窥察矢量的随机过程(可观测的)。
  人造神经元网络的成长为语音辨认的兑现供给了新的解决方案,人造神经元网络模仿了人类神经元举止的原理,具有自学、遐想、对照、推理和归纳综合等才力。这些才力都是隐马尔可夫模子不具备的,但人造神经元网络不具有隐马尔可夫模子的动态时间规整本能。以是若是将两者的长处联合起来,能够提高整个模子的鲁棒性。
  3 语音辨认技艺成长趋向
  今朝,种种体例的隐马尔可夫模子和算法日趋老练,以它为根本形成了语音辨认的总体框架模子,同一了语音辨认中声学层和语音学层的算法布局,以几率的体例将声学层中获得的信息和语音学层中已有的信息联合在一同。
  别的,议决语音下令把握能够使原本必要手工操作的事情用语音来完成。是以,语音下令把握可普遍用于家电语音遥控、玩具、智能仪器及移动德律风等便携设备中。天下列国也都加速了语音辨认应用体系的切磋开辟,并已有一些适用的语音辨认体系投入贸易运营。
  参考文献
  [1]詹新明,黄南山,杨灿.语音辨认技艺切磋进展[J].当代谋略机(专业版),2008(09):43-45+50.
  [2]禹琳琳.语音辨认技艺及应用综述[J].当代电子技艺,2013,36(13):43-45.
  [3]马志欣,王宏,李鑫.语音辨认技艺综述[J].昌吉学院学报,2006(03):93-97.
  [4]段红梅,汪军,马良河,徐冉.隐马尔可夫模子在语音辨认中的应用[J].工科数学,2002(06):16-20.
  [5]孙宁,孙劲光,孙宇.基于神经网络的语音辨认技艺切磋[J].谋略机与数字工程,2006(03):58-61.
  [6]刘长明,任一峰.语音辨认中DTW特性匹配的改良算法切磋[J].中北大学学报(天然科学版),2006(01):37-40.
  [7]吴炜烨.基于神经网络语音辨认算法的切磋[D].中南大学,2009.
转载请注明来源。原文地址:https://www.7428.cn/page/2020/0405/87355/
 与本篇相关的热门内容: