未来智讯 > 人脸语音识别论文 > 具有语音识别功能的无线网络节点开关抑制系统

具有语音识别功能的无线网络节点开关抑制系统

发布时间:2018-11-26 01:06:05 文章来源:未来智讯    
    具有语音识别功能的无线网络节点开关抑制系统作者:未知   摘 要基于语音识别的抑制技能在一些局面具有不可替代的作用。本文基于隐马尔科夫(HMM)理论,选用凌阳SPCE061A处理语音信号,选取以ZigBee技能实现了无线通讯技能,设计实现了一种具有语音识别功能的无线网络开关抑制。经测试该系统语音识别准确率可达到93%以上。
  关键词语音识别;HMM;SPCE061A;ZigBee;CC2430
  中图分类号TP文献标识码A文章编号1673-9671-(2011)042-0108-03
  
  语音识别技能是近年来十分热门的一个研讨方向,被广泛应用于智能家居、工业抑制、医疗卫生、家电、汽车等多个领域;无线网络抑制系统组网灵活、使用便利、具有移动性等优势,已成为网路化测控系统研讨的一个热点。本文把语音识别和无线网络抑制系统联合起来,实现远距离的无线语音抑制。本文通过对硬件,软件,语音算法和最后测试四个方面的介绍,概括了整个系统的搭建测试过程。
  1系统硬件设计
  本系统硬件结构可分为主节点、从节点,图1为整体硬件结构图。其中主节点由基于凌阳SPCE061A的语音识别模块和基于CC2430的ZigBee无线通讯模块组成,从节点则由ZigBee通讯模块与被控对象组成。语音识别模块实现对语音下令的识别,并将识别结果通过SPI发送至ZigBee模块;ZigBee模块根据不同的语音指令,发送指令到相应的的ZigBee从节点,抑制相应的被控对象。本系统所选取的网络拓扑结构为星型,即一个主节点与多个从节点选取星型方式连接。
  图1系统硬件结构
  1)语音识别模块。语音识别模块主要以SPCE061A为核心,实现对语音信号进行采集和处理,以及输出识别结果。其中,SPCE061A是凌阳公司推出的一款性价比相当高的16位DSP,它的u'nSP指令系统还提供具有较高运算速度的16位×16位的乘法运算指令和内积运算指令,为其应用增添了DSP功能,在复杂的数字信号处理方面相当便利,而且比专用的DSP芯片便宜得多,因此,以μ’nSPTM为核心的SPCE061A微抑制器是适用于数字语音识别应用领域产品的一种最经济的选择。
  2)ZigBee通讯模块。本系统中的无线局部包含一个发送节点(FFD)和多个接收节点(RFD),并自组建成星型网络。节点的基本硬件构架是ZigBee射频电路。ZigBee射频电路则以CC2430为核心。CC2430是TI公司推出的一款2.4GHz射频收发器,其MAC层和物理层协议都适合IEEE802.15.4标准,CC2430可通过4线SPI总线设置芯片的事务模式并实现读/写缓存数据、读/写状态寄存器等。语音识别模块的识别结果通过SPI总线与ZigBee射频电路相连。不同的语音指令传输到CC2430中,经分析将指令通过FFD传送给不同的RFD。
  3)继电器抑制模块。因为本实验所用到的CC2430的输出电压惟有3.3V,为了抑制直接接在220V上的被控对象,需要一个继电器,由于继电器线圈需要流过较大的电流(约50mA)才能使继电器吸合,一般的集成电路不能提供这样大的电流,因此必须加上驱动电路,实现低电压,低电流抑制高电压,高电流。
  2系统软件设计
  本系统的软件设计为利用SPCE061A实现语音识别过程及利用CC2430实现无线传输协议。最后实现无线远距离语音识别,并能够独立运行。
  2.1语音信号处理
  语音识别模块选取SPCE061A芯片进行软件开发,以实现语音的识别、交互和抑制功能。系统软件设计是在凌阳科技公司提供的集成开发环境IDE下进行的,它集程序的编辑、编译、链接、调试和仿真等功能为一体,使程序的设计事务更加方便、高效。本系统对代码进行了必要的整合和优化,以使其达到系统设计要求,整合后的总体软件流程如图2。
  图2总体流程图
  2.2ZigBee节点软件设计
  ZigBee节点上的软件负责完成接收由语音识别模块发送的抑制下令,并将下令无线传送到RFD节点,RFD节点通过解析数据帧中的地址码来判断是否接收。如果是则接收数据包,解析下令并产生相应的抑制动作,送出信号给相应的被控对象。由于CC2430芯片提供了802.15.4的物理层和MAC层功能,我们只需完成如下事务:①上层协议。使用成熟的协议栈:Z-Sack。②用户程序。利用Microchip提供的API函数实现了Zigbee的全部功能。
  3语音识别算法的设计与实现
  3.1语音识别概括
  语音识别的一般方法是预先对语音信号提取特征参数变成模板,然后将待识别的语音经特征提取后逐一与参考模式库中的各个模板按某种原则进行对照,来找出最相像的参考模板所对应的发音,其一般过程如图3所示。
  图3语音识别系统的一般结构
  系统中包括预处理、特征提取、模板库、模式匹配和后处理五大局部。针对本系统特点与实际需要,在进行语音处理的过程中,选取线性预测分析来进行语音特征参数提取、选取隐马尔科夫算法(HMM)法来进行语音识别。
  3.2线性预测分析
  线性预测的目的即是用过去的状态来预测如今或将来的某一状态。在随机信号谱分析中常把一个时间序列模型化为白噪声序列通过一个数字滤波器H(z)的输出。在一般情况下,取滤波器的全极点形式(Auto Regressive)AR 模型,即:
  其中系数为ak,G即为模型参数。
  当输入信号u(n)为零均值的随机信号时,系统的输出s(n)与输入之间的关系能够用相关函数或功率谱来表示:
  RSS(z)=H(z)H(z-1)Ruu(z)
  式中RSS(z)和Ruu(z)分辨为信号的输出与输入的自相关序列的Z变换。在信号模型中,u(n)为零均值,方差为σ2u的白噪声序列,其自相关:
  Ruu(z)=σ2uδ(n)
  所以有:Rss(z)=H(z)H(z-1)Ruu(z)=Rss(z)=H(z)H(z-1)σ2u
  写成功率谱的形式为:λ=(π,A,B)
  上式假如σ2=1,这证明,信号s(n)的功率谱,完全能够由滤波器的幅度频率响应来决定,从这个意义上讲,系统H(z)确实能够用来模型化信号是s(n)。由此得出结论:在语音分析中,求出预测滤波器H(z)的参数,便能够将其用在语音识别与分类中。这种线性系统在离散时域能够表示成:
  其中输入为e(n)(高斯白噪声),输出为x(n),即在高斯白噪声的激励下,该系统输出为指定的语音信号。设定预测误差:
  其中:
  p为阶数,ak滤波器系数。当利用预测x(n+r)时,即求出使E最
  小的情况下的{ak}。那时,可
  以写成如下形式:(分辨取n=1,2,…,L-1+p)
  n=1
  n=p
  n=L-1-r
  图4原始一帧语音信号的时域及256点频域图形
  通过频域波形观察能够看出该预测误差滤波器基本上能够模拟出原语音信号。从而证实了线性预测系数的有效性。
  图5通过训练得到的预测误差滤波器的频域模型
  图6随机白噪声预测的原语音信号的时域及频域波形
  3.3HMM语音识别算法
  HMM可分为两局部,①Markov链,由π,A描述,其产生的输出为状态序列;②随机过程B,产生的输出是观测序列。T为观测时间长度。如图7所示。
  图7HMM的组成示意图
  1)HMM参数。HMM是状态隐藏的马尔可夫(Markov)数学模型.HMM包含一定数量的状态,每个状态会产生一个观察分布。其状态由两套几率分布描述:状态转移分布和观察量分布。除此之外,HMM的第三个几率分布是隐藏状态的初始分布,因此,HMM模型包含以下参数:
  ①隐藏状态集θ={θ1,θ2,…θN},N为状态数,t时刻HMM所处的状态为θ的元素,即qi∈θ;
  ②状态转移几率分布A={aij},其中aij=P[qt+1=θj],1≤i,1≤j;
  ③观察量聚集V={V1,V2,…VM},M为每个状态中可观察量的数量,t时刻的观察值Ot∈V;
  ④观察值几率分布B={bj(k)},其中 bj(k)=P[Oi=Vk|qt=θj],1≤j≤N,1≤K≤M;
  ⑤初始状态几率分布π={πi},其中πi=P[qi=θi],表示各个状态在初始时刻发生的几率1≤i≤N以上是HMM的基本参数,在建模之前需根据识别类型确定常数N和M 的值,本方案选N=6,M=4。因此,HMM常常用三个参数的聚集λ=(π,A,B)表示。
  2)语音特征提取。本文语音信号选取8 kHz采样率,再通过预加重、分帧,最终将每帧语音转换成用20阶Mel倒谱系数表示的特征矢量,然后选取LBG算法将语音特征矢量转换为观察值序列θ={θ1,θ2,…θM}。
  3)HMM模型训练。HMM模型训练的目的,便是在已知观察值序列Ο和初始模型λ=(π,A,B)的条件下,用迭代法估计HMM的参数值λ(包括π,A,B),使P(Ο | λ)收敛于一个最大的稳定值,具体算法为:
  ①前向几率;
  ②后向几率;
  ③观察值几率分布B的估计:
  ,
  ;
  ④状态转移几率分布A的估计:
  ,
   ;
  ⑤初始状态几率分布的估计:。
  由上述公式每迭代一次,求得一组新参数,和,得到一个
  新的模型,总有,反复该过程,逐渐
  改进模型参数,直到不再明显增大,此时的即为所求的模
  型。模型训练结束后,将结果存储在HMM参数库中以备识别时调用。
  4)HMM语音识别。以训练过程得到的HMM参数库为基础,再选取Viterbi 算法进行识别,待识别的语音信号转换为观察值序列后,按Viterbi算法与HMM参数库中的模型逐个进行匹配,Viterbi评分最高的亦即输出几率P(O|λ)最大的作为识别结果。
  4系统测试与分析
  4.1语音识别测试
  无线智能开关抑制主要针对小词汇量、特定人和特定的环境,本系统能够实现实时在线的模板训练。针对系统的特点,语音识别准确率的测试分辨对“起初”、“开灯”、“关灯”三个孤立词进行测试。并抑制灯光的开关,测试结果如表1所示。
  4.2ZigBee通讯模块测试
  1)最远传输距离测试。测试条件:接收灵敏度为-94dBm,发送功率为0dBm(1mW),发射频率为2.4GHz。
  测试结果:无线通讯传输距离最远为70米。
  结果分析:通讯距离主要受几个因素影响:接收灵敏度,发射功率灵敏度,事务频率和传输损耗。
  2)有障碍测试。有障碍的测试受障碍的环境条件影响较大,且与摆放位置有关系。在实验室中进行测试,相隔三堵墙直线传送距离约为20米。
  3)系统功耗测试。分辨对主节点和从节点在正常运行和休眠状态时进行测试。测试结果如表2所示。
  结果分析:若选取1000mAh电池,则主节点可连续事务约40小时,待机约5000小时;从节点可连续事务约111小时,待机约5000小时。
  通过分辨对系统语音识别率以及ZigBee通讯本能作了详细的测试,测试结果证明该系统完全能够达到实用目的。
  5结语
  本文提出基于SPCE061A单片机语音识别系统的设计方案,选取ZigBee芯片作为通讯模块处理器,并完成了两大模块的相关硬件和软件的设计。设计中,以语音语言学和数字信号处理以及ZigBee无线传感器技能为基础,涉及多学科领域。语音处理技能是系统设计的关键所在,重点阐述语音信号特征参数的提取方法以及语音识别的算法等。经测试,本系统语音识别率达到93%以上,具有较强的应用价值。
  
  基金项目:江西省教育厅2010年科技项目(GJJ10480)。
  
  参考文献
  [1]TI.CC2430 2.4GHz IEEE802.15.4 RF Transceiver User's Manual [OL].[2005-10]. www.TI.com.
  [2]SPCE061A (v7.3)[M/OL]. http://2.dx1.elecfans.com/l/elecfans.com-SPCE061.pdf
  [3]王和顺,邓成中,黄惟公.基于SPCE061A的语音识别系统的研讨[J].计算机工程与设计,2004.
  [4]高守玮,吴灿阳.ZigBee技能实践教程[M].北京:北京航空航天大学出版社,2009.
  [5]蔡莲红,黄德智,等.现代语音技能基础与应用[M].北京:清华大学出版社,2003.
  [6]俞铁城.语音识别的发展现状[J].通讯世界,2005.
  [7]杨行峻,迟惠生.语音数字信号处理[M].电子工业出版社,1995.
  [8]张焱,张杰,黄志同.语音识别中动态时间规整和隐马尔可夫统一模型[J]据采集与处理,1997,03.
  [9]Rabiner L,A tutorial on hidden Markov models and selected applications in speech recognition,Proc,of IEEE,77(2)257-286,1989.
  
  作者简介
  李佳(1985―),男,在读硕士研讨生,主要研讨方向:网络化抑制。
  何鹏举(1961―),男,教授,硕士生导师,主要研讨方向:网络化测控传感器技能。
  吴礼裕(1984―),男,在读硕士研讨生,主要研讨方向:网络化测控。

转载请注明来源。原文地址:https://www.7428.cn/page/2018/1126/47258/
 与本篇相关的热门内容: