未来智讯 > 人脸语音识别论文 > 浅析语音识别技能的发展及趋势

浅析语音识别技能的发展及趋势

发布时间:2018-11-27 01:06:05 文章来源:未来智讯    
    浅析语音识别技能的发展及趋势作者:未知   摘要 近20年来,随着信息技能的不时发展,语音识别技能也逐渐的发展成熟。语音识别技能研讨让人更加方便地享受到更多的社会信息资源和现代化服务,对任何事都可以通过语音交互的方式。本文就对语音技能的发展及趋势作了大略的阐述。
  关键词 语音识别技能;发展;趋势
  中图分类号TP391.4 文献标识码A 文章编号 1674-6708(2010)26-0216-02
  
  语音识别是一门交叉学科。语音识别研讨履历了50多年的研讨历程,经过50多年的积累研讨,获得了巨大的进展。特别是近20年来,语音识别技能取得了显着的进步,并逐渐的走向市场。在未来的日子里,语音识别技能将应用更为广泛。本文就语音识别的发展及趋势作大略的阐述。
  1 语音技能的发展历史
  50年代,研讨人员多数致力于声学和语音学的基本观念。1952年,在AT& T Bell实验室实现了一个单一发音人孤立发音的10个英文数字的语音识别系统,方法主要是度量每个数字的元音音段的共振峰。1956年,RCA Lab 开展了另外一项独立研讨,试图识别单一发音的10个不同的音节,同样选取了度量共振峰的方法。1959年,英国University College的研讨人员起初尝试另外一种思绪,用谱分析和模板匹配方法构建音素识别器,用来识别4个元音和9个辅音。60年代,相继出现并发表了语音识别的几个重要的思维。1962年,东京大学进行了另一个音素识别器的硬件实现的尝试。它使用过零率方法分离语音信号的不同局部,并进行识别。1963年,日本NEC Lab对数字进行语音识别的尝试能够算得上最值得注意的事务,因为它不但是NEC研讨语音识别的开端,还导致一个长期的和卓有成效的研讨打算。在60年代中,3个研讨项目的开展对其后20多年的语音识别研讨和开发产生了重大影响。第一个研讨项目在RCA Lab起初于60年代后期,目的是研讨语音事件在时间刻度上不均匀性的现实解决办法。在可以可靠检测出语音事件的始末点的基础上,发展了一套时间归正的基本方法。
  2 语音识别技能的发展现状
  语音识别技能通过全球科学家的共同努力,履历半个多世纪的研讨,目前已经发展到了接近实用的阶段。在实验室环境下,大词汇量的朗读式连续说话的宽带语音信号的平均识别率能够达到90%以上。正式有了如此高的识别率之后,语音识别技能慢慢地从实验室演示系统逐渐走向实用化商品。以IBM Via Voice和Dragon Dictation为代表的两个听写机系统的出现,使“语音识别”逐渐进入大众视线,引起了广泛的社会关注。
  由于校对和更正识别的错误很麻烦和浪费时间,这样便降低语音识别的优势。同时,由于使用的环境或讲话口音习惯等因素的影响,语音识别的内容大大降低,识别的内容不能达到100%的准确,所以很多人认为目前的语音识别系统还无法满足实用要求。
  目前,AT&T和MIT等将语音识别技能应用在一些有限词汇的特定任务上,如电话自动转接、电话查询、数字串识别的任务中,当讲话的内容是系统所存储的内容存在的,且使用环境的声学特性与训练数据的声学特性相差不太大时,语音识别的准确识别率能够接近100%。然而,在实际使用中如果这些条件被破坏,则会对识别系统造成一定的影响。
  3 语音识别技能发展趋势
  虽然语音识别在过去的20年里有了很大的发展,然而,仍然存在很多的不足,有待于进一步的探索,具体可分为以下几个方面:
  1)提高可靠性。语音识别技能需要能排除各种声学环境因素的影响。在对照嘈杂的公共环境中,人的意识会故意识的排除非需要的声学环境因素,这对语音识别系统而言,是很难做到的。另外,在日常生活中,人类的语言通常具有较大的不确定性,对照随意,并带有明显的言语习惯。这同样会给语音识别系统很大的识别麻烦。目前,在提高语音系统在不同环境中的可靠性,同时要应用现代技能让语音识别系统更加智能化,掌握人们语言随意性的局部规律,以达到最佳的识别效果。
  2)增加词汇量。系统能够识别的词汇的数量是系统可以做什么事情的一个重要度量。一个语音识别系统使用的声学模型和语音模型如果太过于局限,当用户所讲的词汇超出系统已知的范围时,则语音识别系统不能正确的识别出相应的内容,比如,当忽然从中文转为英文、法文、俄文时,计算机就会通常输出混乱奇怪的结果。然而,随着系统建模方法的不时改进、搜索算法效率的提高以及硬件资源的发展,未来的语音识别系统可能会做到词汇量无限制和多种语言混合,这样用户在使用的时候能够不必在语种之间来回切换,这样就能大大削减词汇量的对语音识别系统的限制。
   3)应用拓展。语音识别技能能够用于把费脑、费力、费时的机器操作形成一件很容易很有趣味性的事,比如,当人们出现手忙、手不能及以及分身无术的场景时,通过语音识别系统的模型构造,则可以在象驾驶室、危险的工业局面、远距离信息获取、家电抑制等各个方面,语音识别技能可能带动一系列崭新或更便捷功能的设备出现,更加方便人的事务和生活。其应用的范围和前景相当广泛。不但可以应用于日常生活,更重要的会带来生产方式的革命,是下一代智能化抑制的基础。
  4)降低成本减小体积。微型化是语音识别技能商业应用的另一个重要途径,其推广程这取决于语音识别技能本身进步的程度,同时与微电子芯片技能的进一步发展关系亲密。将具有先进功能和本能的语音识别应用系统固化到更加细小的芯片或模块上,能够大幅度降低产品成本和体积,产品必然受到消费者的青睐,语音识别系统和微电子芯片技能的发展是会引领我们的信息技能革命到一个新的台阶。
   21世纪是信息和网络的时代,Internet和移动通讯、固话通讯的网络把全球各地连接起来。自然口语对话、电子商务、信息索取、数字图书馆、语音翻译、远程教育等一系列的人类活动都可在网络上实现。语音识别系统的出现,会让人更加自由的沟通,让人在任何地方,任何时间,对任何事都可以通过语音交互的方式,方便地享受到更多的社会信息资源和现代化服务。这必然会成为语音识别技能研讨和应用的重要发展趋势。
  
  参考文献
  [1]杨尚国,杨金龙.语音识别技能概括[J].福建电脑,2006 (8).
  [2]孙宁,孙劲光,孙宇.基于神经网络的语音识别技能研讨 [J].计算机与数字工程,2006.
  

转载请注明来源。原文地址:https://www.7428.cn/page/2018/1127/47745/
 与本篇相关的热门内容: