未来智讯 > 人脸语音识别论文 > 语音识别在监狱安防管理中的应用
    关键词:语音识别;噪音监测;智能语音预警
    中图分类号:TP18文献标识码:A文章编号:1009-3044(2011)23-5722-02
    语音识别是解决机器“听懂”人类语言的一项技术。作为智能计算机研究的主导方向和人机语音通信的关键技术,语音识别技术一直受到各国科学界的广泛关注。
    监狱是关押、改造犯人的场所,是重要的国家机器之一。监狱的安全防范工作关系着社会的稳定、国家的安宁。特别是在“构建和谐社会”的大环境下,构建好监狱的安全防范体系就显得格外重要。近年来,国家司法部大力提倡科技强警和监狱信息化,监狱安防作为其中的核心部分,受到了高度重视,全国各大监狱都在积极筹建现代化安防系统,“向科技要警力”已经成为一种趋势。
    目前国内监狱安防系统主要还是以视频监控为主,再附带一些安防报警装置,通过安防设备之间的联动处理使得监狱达到一个高效的安防等级。但是安防系统很多业务大多时候只能用于事后处理和取证,无法起到预防、预警的作用。不过,随着语音识别技术研究的突破,以语音识别技术开发出的产品应用非常广泛,在安防系统中加入依靠语音技术开发出的智能语音预警功能将使安防系统的满足更多的要求,而且该技术国外一些监狱已经成功采用。
    1 语音识别技术简介
    语音识别技术,也被称为自动语音识别Automatic Speech Recognition,(ASR),其目标是将人类的语音中的词汇内容转换为计算机可读的输入,例如按键、二进制编码或者字符序列。与说话人识别及说话人确认不同,后者尝试识别或确认发出语音的说话人而非其中所包含的词汇内容。
    早在计算机发明之前,自动语音识别的设想就已经被提上了议事日程,早期的声码器可被视作语音识别及合成的雏形。而1920年代生产的"Radio Rex"玩具狗可能是最早的语音识别器,当这只狗的名字被呼唤的时候,它能够从底座上弹出来。最早的基于电子计算机的语音识别系统是由AT&T贝尔实验室开发的Audrey语音识别系统,它能够识别10个英文数字。其识别方法是跟踪语音中的共振峰。该系统得到了98%的正确率。到1950年代末,伦敦学院(Colledge of London)的Denes已经将语法概率加入语音识别中。
    1960年代,人工神经网络被引入了语音识别。这一时代的两大突破是线性预测编码Linear Predictive Coding (LPC), 及动态时间弯折Dynamic Time Warp技术。
    语音识别技术的最重大突破是隐含马尔科夫模型Hidden Markov Model的应用。从Baum提出相关数学推理,经过Labiner等人的研究,卡内基梅隆大学的李开复最终实现了第一个基于隐马尔科夫模型的大词汇量语音识别系统Sphinx。此后严格来说语音识别技术并没有脱离HMM框架。
    广泛意义上的语音识别按照任务的不同可以分为4个方向:说话人识别、关键词检出、语言辨识和语音识别。说话人识别技术是以话音对说话人进行区别,从而进行身份鉴别和认证的技术。关键词检出技术应用于一些具有特定要求的场合,只关注那些包含特定词的句子。语言辨识技术是通过分析处理一个语音片断以判别其所属语言种类的技术,本质上也是语音识别技术的一个方面。语音识别就是通常人们所说的以说话的内容作为识别对象的技术,它是4个方面中最重要和研究最广泛的一个方向,也是本文讨论的主要内容。
    2 语音识别技术的实现方法
    一般来说,语音识别的方法有三种:基于声道模型和语音知识的方法、模板匹配的方法以及利用人工神经网络的方法。其中模板匹配的方法发展比较成熟,目前已达到了实用阶段。在模板匹配方法中,要经过四个步骤:特征提取、模板训练、模板分类、判决。
    一个完整的基于统计的语音识别系统一般由语音信号预处理与特征提取,声学模型与模式识别,语言模型与语音处理3部分组成. 4 总体上说,语音识别就是一个模式识别和匹配的过程,首先计算机必须根据人的语音特点来建立语音特征模型或字典库;然后对获取的语音输入信号经过噪声去除和端点检测等预处理后进行特征分析和提取,建立所需识别的语音信号模板;再采用模式识别理论和技术,将计算机中已经存在的语音模板特征与输入的语音信号特征进行比较,并根据一定的搜索和模式匹配的策略从语音特征库中找出最优的语音模版与输入语音进行匹配处理;最后通过查表或判别算法来给出识别结果.目前语音识别主要集中在特定人和非特定人语音识别、孤立词和连续语音识别、小词汇量和大词汇量的语音识别方面.其语音识别系统结构如图1所示。
    常用的技术有三种:动态时间规整(DTW)、隐马尔可夫(HMM)理论、矢量量化(VQ)技术。
    3 语音识别在监狱安防中的应用
    在监狱安防系统中使用好语言识别技术能够在预警方面发挥作用。而且,笔者参与过的监狱安防项目中也采用了这一技术来实现噪音预警功能。噪音预警功能能够识别采集到的声音对群殴、哄监等异常事件做到事先预警的作用。
    噪音预警是语音识别应用中相对容易实现的部分,技术难度不大,目前我们在监狱安防中应用的噪音预警功能是通过硬件支持和软件分析两部分来实现。硬件支持指的是拾音器设备,也就是音量采集设备,它将采集到的声源不间断的发给软件进行分析;软件分析指的是将硬件设备采集到的声源进行音量、音色、音调三个方面的分析。具体实现的思想如下:
    1)通过识别音量的大小,我们可以对监舍以及一些公共场所进行噪音监测,当音量大小超过正常秩序下设定的音量值,就发出预警报警信息,相关摄像头也会自动切换到该区域,可以有效预防犯人大声吵架而可能引起的打架斗殴事件。
    2)通过对玻璃破碎声、物品撞击声、洗漱器具与地面撞击声、餐饮器具与地面撞击声等的音色和音调进行分析,提取可识别的特征,当语音识别系统识别出与该特征相似的声音时,就发出预警报警信息,相关摄像头也会自动切换到该区域,可以有效预防犯人自杀、斗殴等事件的发生。
    3)通过音调的快速变化可以识别(突然变高、突然变快),可以预测干警或者犯人遇到紧急情况。
    4)通过敏感词汇(如逃跑、越狱、翻墙、挖地道等)音调的特征提取可以识别某一区域的人在讨论敏感信息发掘罪犯密谋信息,还可以加入多种方言音调特征,避免一些用方言密谋犯罪行为的遗漏。
    5)通过声音特征和位置的特性,设计专门针对某一特殊点的的语音识别方式,在声音预警报警中往往能够发出意想不到的作用。如:禁闭室里采集到低频率的“砰砰”声,可能是犯人在撞墙;值班室里采集到闷哼声,可能是值班干警被不法分子捆绑并堵住嘴巴;监舍里采集到呼喊声,可能是发生斗殴事件;房间里采集到砸碎玻璃的声音,可能是犯人拿碎玻璃片自杀或者行凶等。
    针对上述识别思想设计专门的音色模型库,通过拾音器设备采集到语音信号,再进行处理,然后提取该声音的特征与音色模型库里的声音进行比较,如果特征和音色模型库里的一种或多种音色模型相符,则发生预警信号;否则,拾音器将会继续采集。噪音预警分析流程如图2所示。
    4 语音识别在监狱安防领域的发展方向
    通过语音/噪音识别技术的介绍,可以发现语音识别技术在监狱安防中可以有更大的作为。如语音验证、智能语音识别预警等方面的实现与应用都会给监狱安防带来新的突破。
    门禁语音识别验证:在门禁系统中加入语音验证模块,配合目前安防领域内的视网膜门禁、指纹识别门禁等一并使用,增加门禁的验证环节,大大提高了门禁系统的安防等级。
    智能语音识别预警:只要建立强大的语音模型库,对一些紧急情况下的语音进行研究,收集大量的求救、呼喊类语音模型,尤其是对说话内容进行分析,只要采集到的声音文件经过分析后与语言模型库中的声音相符合就会立即发出预警信号提示值班干警通过视频查看现场状况。
    5 结束语
    语音识别技术发展到今天,语音识别系统的识别精度在不断提高,这些技术已经能够满足通常应用的要求。随着噪音环境下的语音识别技术、语言模型和声学模型的建立的进一步突破,使得语音识别技术的应用范围更广、识别精度更高,使得音色模型库更加丰富全面,从而为监狱安防中的语音预警功能提供了强有力的支持,相信不久的将来智能语音识别预警功能的定会被广泛使用,成为监狱安防系统“技防”中不可或缺的重要组成部分。
    参考文献:
    [1] 胡光锐.语音处理与识别[M].上海:上海科学技术文献出版社,1994.
    [2] 赵立.语音信号处理[M].北京:机械工业出版社,2003.
    [3] 拉宾纳 L,Rabiner Lawrence,阮平望,等.语音识别基本原理[M].北京:清华大学出版社,1999.
    [4] 詹新明,黄南山,杨灿.语音识别技术研究进展[J].现代计算机,2008.
    [5] 杜利民,侯自强.汉语语音识别研究面临的一些科学问题[J].电子学报,1995,23(10):110-115.
    注:本文中所涉及到的图表、注解、公式等内容请以PDF格式阅读原文

转载请注明来源。原文地址:https://www.7428.cn/page/2017/1207/9121/
 与本篇相关的热门内容: