未来智讯 > 人脸语音识别论文 > 论基于机器人的语音识别技能

论基于机器人的语音识别技能

发布时间:2018-11-28 01:06:04 文章来源:未来智讯    
    论基于机器人的语音识别技能作者: 王顺利 夏长春 付嘉铭   摘 要 语音识别技能是一个涉及多种学科的集成技能,目前已在工业、军事和医疗部门,产品检验和人机语音通讯等领域取得了广泛的实际应用。语音识别技能长期以来一直是研讨热点,但现有的语音识别系统运行缓慢,成本高,不方便使用。这些缺点影响了语音识别的速度,系统的硬件实现和应用。特别是在吵闹的环境中应用智能机器人语音识别更是相当困难。用于识别的工业智能机器人技能研讨也越来越受到人们的关注。
  关键词 机器人 语音识别 声学模型 语音特征参数
  中图分类号:TP242 文献标识码:A
  1语音识别技能的研讨意义
  人们使用的声音语言是一种人在特定高度思想和意识活动下的产品。语言是人类最直接以及最理想的交流方式,也是人机通讯是最方便的方式。在机器人发展的高级发展阶段中,机器人的智能语音识别与人类的活动是亲密相关的,有声语言的人机交互信息成为重要的手段。例如,语音识别获取外界信息很自然,没有特殊的训练方法,随着机器人技能的发展和广泛应用,有越来越多的机会来接触人类和机器人,所以人们希望通过语音识别和机器人去处理,不管谁能能正确平安,方便地操纵机器人。机器人和人类之间的信息交互,表如今两个方面,一是对更高层次的机器人操作,方便软件的设计开发,这种多为教学机器人,另一种是在实际操作的要求下完成信息交互任务的机器人。智能机器人作为机器人技能发展的高级阶段,其发展趋势是:不但要求机器人具有高度的自治能力,还要使机器人和人类之间的协调也具有一定的智能性。这就要求机器人具有不同的高本能主动做事能力,而不是被动地接受任务,为了实现这一指标,自然语言作为人机信息交换将发挥越来越重要的作用。目前,智能机器人已成为机器人研讨领域的一个热点。工业机器人是智能机器人的一个重要研讨领域。当今,工业机器人的发展方兴未艾,巨大的市场潜力,使真正的工业机器人的已经在市场上崭露头角,以满足人们日益增长的需求,我们不能没有一个高本能的语音识别系统。由于工业机器人是面向生产实际的需要,最好的事务方式是让机器人能顾听懂最常见的人类语言,完成指定的事务,并能与人交流。机器人语音识别是机器人研讨领域中的语音识别应用,最后的指标是让机器人明白人们的口头语言,然后按照人们的下令来行动或反应,从而变成一个良好的人机对话系统。为了可以进一步推动智能机器人的开发应用,因此,在语音识别机器人的研讨领域中,机器人语音识别系统是工业机器人的实际推广应用,具有重要的意义。
  语音识别技能在智能机器人中的应用已经有很多年的历史,作为智能机器人的一个分支,工业机器人得到了迅速发展,工业机器人通过语音识别从工业噪声中提取有效的语音下令。为了实现机器人在一些特殊工业环境中事务的目的,机器人要可以识别下令意图。语音识别技能,能够实现人机对话,从而让机器能模仿人类完成所有事务的分配,使其在各行各业中可以得以应用。目前所面临的实际问题是:噪声和干扰环境下对大型工业机器人的语音识别有严重的影响。在机器人识别领域,工业环境中的实时性是一个相当重要的任务。机器人在工业环境下应用的听觉识别是使智能机器人发展速率低的瓶颈。
  2语音识别系统的发展
  2.1语音识别系统的发展方向
  语音识别系统是基于一套应用软件系统的硬件平台和操作系统的一些。语音识别一般分为两个步骤。第一步是学习或培训。这一阶段的任务是建立基本单元的声学模型来进行识别和模型的语音语法分析等。第二步是识别或测试。根据识别系统的类型能够满足一个识别方法的要求,使用语音分析的方法来分析语音特征参数,并建立了对照和测量系统模型,根据一定的标准,鉴定结果。
  语音识别系统的应用可分为两个发展方向,其中一个是大词汇连续语音识别系统,主要应用于计算机的听写机,以及联合电话网或互联网的语音信息服务系统,这些系统是在计算机平台上的一个重要发展方向。其次是应用的小型化,便携式音频产品,如无线移动电话的拨号,语音抑制车载设备,智能玩具,家用电器和其他方面的应用的远程抑制,这些应用系统大多选取特殊的硬件系统来实现,特别是语音信号处理芯片和语音识别芯片,近来几年快速发展,为其广泛应用创造了极为有利的条件。
  2.2语音识别系统的模型与模式
  语音识别系统的核心是声学模型和模式分类。最初通过学习算法,训练语音声学模型的特点是通过学习过程来生成声学模型,这是识别潜在的模型的前提,是最关键的语音识别系统的一局部。声学模型的目的是提供一种有效的方法来计算特征向量的声音序列和每个发音模板之间的距离。人的发音在每一刻发音之前和之后都会受到影响。
  为了模仿自然连续的协同发音和识别不同的发音,常常需要使用复杂的声学模型。声学模型和语言的发音特点的设计是亲密相关的。声学模型单元大小与单词发音,音节模式和音位语音训练数据大小有关,故要求其系统识别具有很大的灵活性。大词汇量语音识别系统,常常选取较小的单元和小量的计算,该模型惟有较小的存储容量,削减训练数据的数量,但相应的声音定位和分割问题就显得更加困难,准则识别模型变得越来越复杂。常常大型模型中识别单元包括协同发音,这有利于提高系统的识别率,但训练数据也相对增加。必须根据不同语言的特点来识别词汇,词汇量大小决定单位大小。
  参考文献
  [1] 李昌禄,苏寒松.?基于单片机平台下语音识别技能的应用方式[J].实验室科学,2009(06).
  [2] 薛同泽,陈书旺.?语音识别的智能门控系统设计[J].微计算机信息,2008(14).
转载请注明来源。原文地址:https://www.7428.cn/page/2018/1128/48196/
 与本篇相关的热门内容: