未来智讯 > 人脸语音识别论文 > 关于语音识别技能发展趋势的分析

关于语音识别技能发展趋势的分析

发布时间:2018-11-28 01:06:04 文章来源:未来智讯    
    关于语音识别技能发展趋势的分析作者: 周英   摘要:在2010年前十年间,信息技能领域中发生了众多重大的科技发展,语音识别技能便是其中之一。这种技能包括3个方面:特征提取、模式匹配及模型训练。所涉及的技能范围相当广泛,主要有:信号的处理、人工智能技能的研讨、语言抑制等方面。而本文通过对语音识别技能的发展历史、发展方向和发展趋势的分析,使各位对语音识别技能的发展有所明白。
  关键词:语音识别;信息技能;发展趋势
  中图分类号:TP391.42 文献标识码:A 文章编号:1007-9599 (2012) 19-0000-02
  近年来,随着科学技能的进步,语音识别技能的发展,通过语言操纵机器的梦想正在逐渐变为现实。语音识别是语音信号处理的一个重要的研讨方向,经过50多年的积累研讨,尤其是近20年来,语音识别技能取得了显著进步,并且广泛应用于商业,比如苹果的siri系统。本文从语音识别的发展历史、发展方向来着重分析未来语音识别技能的发展趋势。
  1 语音识别技能的发展历史
  1.1 语音识别技能在国际的发展
  早在三四十年前,美国的一些大学和实验室就起初了语音识别技能的研讨,50年代的AT& T Bell实验室研发的Audry系统第一个实现了可识别十个英文数字。60和70年代,提出了线性预测分析技能(LP)等相关理论并深入研讨,创造出能够实现特定人孤立语音识别系统;80年代和90年代是语音识别技能应用研讨方向的高潮,HMM模型和人工神经元网络(ANN)的成功应用,使得语音识别系统的本能比以往更优异;伴随着多媒体时代的来临,微软,Apple等著名公司都研发出非常成功的商业应用语音识别系统,比如,Apple的Siri系统,微软的Phone Query (电话语音识别)引擎等。
  1.2 语音识别技能在国内的发展
  我国的语音识别研讨事务虽然起步较晚,但由于国家的重视,研讨事务进展顺利,相关研讨紧跟国际水平。由于中国有不可忽视的庞大市场,国外对中国的语音识别技能也相当重视,汉语语音语义的特殊性也使得中文语音识别技能的研讨更具有挑战。然而,国内研讨机构在进行理论研讨的同时,应注重语音识别系统在商业中的应用,加快从实验室演示系统到商品的转化。
  现现在,许多用户已经能享受到语音识别技能带来的方便,比如智能手机的语音操作等。然而,这与实现真正的人机交流还有非常遥远的距离。目前,计算机对用户语音的识别程度不高,人机交互上还存在一定的问题,语音识别技能还有很长的一段路要走,必须取得突破性的进展,才能做到更好的商业应用,这也是未来语音识别技能的发展方向。
  2 语音识别技能的技能实现及困难
  语音识别技能的实现方式是声音通过转换装置进入机器,而机器配有“语音辨识”程序,程序将得到的声音样本与数据库存储的样本进行比对,输出最匹配的结果,转化为机器语言,进而执行下令。真正建立辨识率高的语音辨识程序组,是相当困难而专业的,专家学者们研讨出许多破解这个问题的方法,如傅立叶转换、倒频谱参数等,使目前的语音辨识系统已达到一个可接受的程度,并具有较高辨识度。
  2.1 语音识别的技能实现方式
  语音识别技能主要包括特征提取技能、模式匹配规则及模型训练技能三个方面,其中,最基础的便是语音识别单元的采用。
  (1)语音识别单元的采用。语音识别研讨的基础是选择语音识别单元。语音识别单元有单词(句)、音节和音素三种,具体选择哪一种语音识别单元由具体研讨任务的类型决定:
  单词(句)单元在中小词汇语音识别系统中应用广泛,但由于模型库过于庞大,模型匹配算法复杂,实时性不强,所以不符合大词汇系统;
  音节单元主要应用于汉语语音识别,因为汉语是单音节结构的语言,虽然有大约1300个音节,但无调音节共408个,相对较少,所以音节单元在中、大词汇量的汉语语音识别系统上是可行的。
  音素单元之前曾广泛应用于英语语音识别,也越来越多的应用于中、大词汇量汉语语音识别系统中。原因在于汉语音节仅由22个声母和28个韵母构成,把声母细化,虽然增加了模型数量,然而提高了易混淆音节的区分能力
  (2)特征参数提取技能。特征提取便是对语音信号进行分析处理,把丰富的语音信息中的冗余信息去除,获得对语音识别有用的信息。这是一个对语音信号进行信息压缩的过程,目前经常选取的特征参数提取技能是线性预测(LP)分析技能。基于LP技能提取的倒谱参数再加上Mel参数和基于感知线性预测(PLP)分析提取的感知线性预测倒谱对人耳处理声音的模拟,进一步提高了语音识别系统的本能。
  (3)模式匹配及模型训练技能。早期的语音识别应用的模式匹配和模型训练技能是动态时间归正技能(DTW),它在孤立词语音识别中获得了良好本能,然而由于对大词汇量以及连续语音识别的不正确,目前已经被隐马尔可夫模型(HMM)和人工神经元网络(ANN)所取代。
  2.2 语音识别遇到的困难
  目前,语音识别研讨事务进展缓慢,困难具体表如今:
  (一)语音识别系统对环境敏感,采集到的语音训练系统只可应用于与之对应的环境,而且当用户输入错误时不能准确响应,应用起来相对困难;(二)必须采取新的新号处理方法来处理人在高噪声环境下的发音变化的问题;(三)语言模型、语法及词法模型在中、大词汇量连续语音识别中无法准确、合理的运用,需要有效地利用语言学、心理学及生理学等方面的研讨成果;现阶段的科学技能对人类生理学诸如听觉系统分析理解功能、大脑神经系统的抑制功能等还不够,更无法应用于语音识别;语音识别系统从实验室演示系统向商品的转化过程中还有许多具体细节技能问题需要解决。
  3 语音识别技能的发展趋势
  3.1 进一步提高可靠性
  目前语音识别系统很难做到排除各种声学环境因素的影响,而人类语言在日常生活中的随意性和不确定性给语音识别系统造成极大的识别困难。所以,要应用现代技能智能化语音识别系统,以达到更好的识别效果;
  3.2 增加词汇量
  目前语音识别系统使用的声学模型和语音模型过于局限,需要通过改进系统建模方法、提高搜索算法的效率来做到词汇量无限制和多重语言混合,削减词汇量对语音识别系统的限制;
  3.3 微型化并降低成本
  语音识别系统在商业上的用途非常广泛,利用先进的微电子技能,将具有先进功能和本能的语音识别应用系统固化到更加细小的芯片或模块上,能够缩减成本,更方便的推广和使用。语音识别系统和微电子芯片技能的发展将引领信息技能革命到一个新的台阶。语音识别系统使人沟通更加自由,使人能够方便地享受到更多的社会信息资源和现代化服务。这必然会成为语音识别技能研讨和应用的重要发展趋势。
  4 结束语
  21世纪,信息和网络飞速发展,信息和网络的时代已经来临,人与人之间的距离随着Internet和移动电话网的连接和普及变得越来越近,信息资源扩散的越来越迅速,人与机器的交互显得尤为重要。语音识别技能的研讨和应用能够让人无论何时何地都能够通过语音交互的方式实现任何事,能够使人更方便的享受更多的社会信息资源和现代化服务,所以,如何将这一技能可靠的、低成本的应用于商业和日常生活,是语音识别技能的发展方向和趋势。
  参考文献:
  [1]刘钰.语音识别技能概括[J].计算机光盘软件与应用,2010:14-17.
  [2]盛青.语音自动识别技能及其软件实时实现[J].西北工业大学,2001:45-47.
  [3]廖锎.浅析语音识别技能的发展及趋势[J].科技传播,2010:34-36.
  [4]陈方,高升.语音识别技能及发展.CIO时代论坛,2009:67.
  [5]王敏妲.语音识别技能的研讨与发展[J].微型机与应用,2009:55-58.
  [作者简介]周英(1973,8-),男,四川省达州市,达州职业技能学院,计算机讲师,计算机教学,达州职业技能学院学生处。
转载请注明来源。原文地址:https://www.7428.cn/page/2018/1128/48204/
 与本篇相关的热门内容: