未来智讯 > 人脸语音识别论文 > 基于语音识别技能的智能台灯

基于语音识别技能的智能台灯

发布时间:2018-11-29 01:06:05 文章来源:未来智讯    
    基于语音识别技能的智能台灯作者:未知   摘 要:随着语音识别技能的迅速发展,它在通讯与电子,信息处理等领域呈现出巨大的潜力。我们已经可以把语音识别系统集成到芯片中,能够满足语音拨号,语音查询,语音应答等功能。
  本文从设计基于语音识别技能的智能开关起程,设计语音抑制的台灯。阐述了智能开关的硬件及其结构,软件及其语音算法和电路设计。硬件选取语音识别芯片LD3320和STC11L08XE主控芯片,实现对语音的抑制和识别。软件选取非特定语音识别技能(ASR)。实现了语音抑制台灯的开关以及亮灭的同时,使用者还能够通过不同的指令实现同一抑制,达到一位多控的目的。
  关键词:语音识别芯片;ASR技能;一位多控
  中图分类号: TN912 文献标识码: A 文章编号: 1673-1069(2016)24-175-2
  1 语音识别技能简述
  本项目所用的是非特定语音识别(SI-ASR,Speaker Independent Automatic Speech Recognitich)技能。高级工程师分析语音模型中各个基元语音时,惟有让它的统计几率最优化,才能使语音模型转化的硬件芯片具有普适性。因此工程师建立了数学模型,通过对数千人数万小时的有效声音数据进行采集分析,重复训练提取,对照各个语音基元的特征差异和细节特征,最终得到算法和语音模型,并将其应用到嵌入式系统中。故而这是一项基于“关键词语列表”的非特定语音识别技能。ASR技能每次识别的时候,把语音流做频谱分析,提取其中的语音特征后,通过语音识别器将其与“关键词列表”中的预设值进行对照,得出最接近其中的一个预设值作为识别结果。本项目所使用的LD3320芯片就是基于此项技能的嵌入式芯片。
  2 语音电路硬件设计
  2.1 整体设计
  整个系统的硬件电路主要包括核心主抑制局部、语音识别局部和照明电路局部。主抑制局部设计是以STC11L08XE为核心的抑制电路,语音识别局部设计是以LD3320语音芯片为核心的语音电路,照明电路局部则通过搭建LED点阵以及其他电路构成。使用者的语音通过麦克风进入语音识别局部,经过LD3320处理后,将数据并行传输到抑制电路,通过抑制器处理事后,发送指令抑制照明电路。基本设计如图1所示:
  ■
  图1 语音识别的台灯电路图
  2.2 主控模块
  由于要处理来自语音芯片的数据,因此要求抑制芯片的处理速度要快,抗干扰能力强,功耗要低。同时考虑到市场价格等问题最后选取STC10LO8XE单片机。STC11L08XE的定时器0/定时器1/串行口与传统8051兼容,增加了独立波特率发生器,省去了定时器2。与传统8051的指令相比,执行速度全面提速,比最慢指令快三倍,比最快的指令快二十四倍。它的事务电压为3.3―5.5V,拥有40个I/O接口,512字节的SRAM和8K的FLASH,内部集成高可靠复位电路。因此足以满足主抑制系统的需要。
  2.3 语音识别模块
  LD3320芯片不需外接 Flash和 RAM等存储设备,它的内部集成了快速稳定的优化算法。而且LD3320芯片也不需要使用者事先训练和录音。语音识别芯片内部集成了AD/DA,所以它要完成的事务便是:为得出得分最高的关键词语作为识别结果输出。通过把麦克风输入的语音进行频谱分析后提取语音特征,再和关键词语列表中的关键词语进行对比匹配,得出最优解。因此LD3320芯片的语音识别率对照稳定,正确率也对照高。
  本文的LD3320语音芯片采取并行方式(即主控芯片P1.0与语音芯片第46引脚相连,并设置为低电平)直接与STC11L08XE单片机主控芯片相接,并均选取10k电阻上拉。抑制信号第42引脚(WRB)、第43引脚(CSB)、第45引脚(RDB)、第47引脚(RSTB)以及停止返回信号第48引脚(INTB)与STC主控芯片直接相连,选取10k电阻上拉,辅助系统稳定事务。第44引脚(A0)用于判断是数据段还是地址段。语音芯片和主控芯片选取同一个外部22.1184MHz晶振;第12引脚(MBS)作为麦克风偏置,接一个MIC增益辅助RC电路,以确保能输出一个浮动电压给麦克风。电路如图2所示:
  ■
  图2 语音识别模块电路图
  3 语音电路软件设计
  本文语音识别软件设计选取停止的事务方式,其流程分为芯片初始化,写入关键词列表,起初识别,响应停止,输出抑制等。
  ①芯片初始化:主要完成主控芯片串口初始化,语音芯片软复位、模式设定和 FIFO设定。芯片复位为激活内部数据处理模块,便对语音芯片的第47引脚(RSTB)发送低电平,对片选第43引脚(CS)做从拉低到拉高的操作,实现复位。②写入关键词列表:分辨设置“开灯、关灯”基础关键词。再设置“变亮、变暗”等关键词使人为语音调控实现用多种指令完成同一指标的抑制。③起初识别:设置若干个寄存器,即可起初语音识别,其识别流程如图3所示。0x37寄存器是抑制下令入口,用来启动芯片内部的语言识别运算模块。0xb2寄存器是内部忙闲的状态寄存器。一些内部状态由0xbf寄存器汇报出来。
  4 归纳
  通过这段时间的研讨与开发,整体完成以下几项事务。最初,我们研讨了语音识别技能的原理和算法,参考了语音识别芯片LD3320的数据手册,对它的功能和内部结构有一定的认识和明白,为设计语音电路提供理论支持。
  另外,我们还研讨了STC11L08XE主控芯片结构和参数设置。LD3320语音识别芯片在语音进入语音识别局部后,LD3320芯片将把处理过的数据传输到主抑制器,主抑制器处理后,发送下令数据到外围串行设备,实现抑制操作的功能。
  在语音识别模块的设计方法和原理基础上,以此为核心,我们设计出了外围电路的结构和辅助通讯电路的结构,同时也给出了总体设计图。根据该设计方案,基本能够达到基于语音识别技能的台灯的设计要求。
  参 考 文 献
  [1] 杨行俊,迟惠生.语音信号处理[M].北京:电子工业出版社,1995.
  [2] 王炳锡.实用语音识别基础[M].北京:国防工业出版社,2005.
  [3] 俞铁成.语音识别发展现状[J].通信世界,2005.
  [4] 赵建光.嵌入式连续语音识别系统研讨[D].河北工程大学,2007.
转载请注明来源。原文地址:https://www.7428.cn/page/2018/1129/48665/
 与本篇相关的热门内容: