未来智讯 > 人脸语音识别论文 > 通话中的语音识别技能

通话中的语音识别技能

发布时间:2018-11-29 01:06:05 文章来源:未来智讯    
    通话中的语音识别技能作者: 李晋   【摘要】 手机是我们日常生活中最常使用的工具之一,但在通话过程中的语音技能还没有相对成熟的解决方案,可智能识别通话过程中涉及的数字,地点,人名等关键信息,来自动判断你所需要的信息和安排你的行程,并可应用于语音聊天、视频通话甚至在语音聊天、视频聊天中与云端大数据整合。
  【关键词】 语音识别 通话 大数据 互联网
  该文主要致力于解决通话中的语音识别技能,长期可推广至QQ语音聊天等即时聊天软件中,相较于目前大多数语音识别软件需要手动打开更为主动,让用户感觉不到软件的存在,将该技能深度整合到系统或QQ服务中在通话结束后针对通话中涉及的电话号码、地点、时间等关键信息进行信息的推送,大大提高了效率,并对听力有障碍的人士有更为重要的意义。
  一、语音识别基本原理
  语音识别系统性子上是一种模式识别系统,包括特征提取、模式匹配、参考模式库等三个基本单元,未知语音经过话筒变换成电信号后加在识别系统的输入端,最初经过预处理,再根据人的语音特点建立语音模型,对输入的语音信号进行分析,并抽取所需的特征,在此基础上建立语音识别所需的模板,然后根据此模板的定义,通过查表就能够给出计算机的识别结果。 [1]
  二、通话中语音识别技能
  2.1技能原理:
  1、基本架构:Smartalk通话系统基于“云之讯”开放平台提供的语音视频通话服务和“科大讯飞”开放平台提供的语音识别服务,并加以对手机GPS位置、通信录、社交软件信息的分析,在“云”的辅助下对之进行处理和交换。Smartalk架构分为4个局部:客户端、语音视频服务、语音识别服务、云数据处理分析。利用“云之讯”开放平台提供的语音视频通话服务和“科大讯飞”开放平台提供的语音识别服务可将用户在通话中涉及的地点、人名、电话号码等关键词提取出来并加以分析对行程和下一步操作提供帮助。
  2、基本平台:本系统基于APIcloud开发,兼容云端和第三方SDK,可跨平台(Android、IOS、Windows等)使用,选取标准的c++语言实现。
  2.2功能实现:
  1、基于“云之讯”开放平台的通话系统:云之讯融合通信开放平台为企业及个人开发者提供各种通信服务,包括在线语音服务、短信服务、视频服务、会议服务等,开发者通过嵌入云通信API在应用中轻松实现各种通信功能。
  2、基于“科大讯飞”开放平台的语音识别系统:。讯飞开放平台使用户可通过互联网、移动互联网,使用任何设备方便的介入讯飞开放平台提供的“听、说、读、写”等全方位的人工智能服务。目前开放平台向开发者提供语音合成、语音识别、语音唤醒、语义理解、移动应用分析等多项服务。
  3、语音识别与云端大数据联合分析:。利用基于“云之讯”通话系统和“科大讯飞”语音识别系统实现了实时的语音识别,加以云端大数据的联合,和实时的分析用户当前的需求和问题,准时的跟用户产生交流反馈,并根据用户长期的使用时间分析智能提前推送相关信息。
  2.3未来展望:
  基于大数据和互联网+技能的日益发展与完善,并随着通讯传输速度的逐步提高,可在实时的条件下分析与推送更多丰富的内容,加以与即时聊天软件的联合,将该技能深度整合到系统或QQ服务中在通话结束后针对通话中涉及的电话号码、地点、时间等关键信息进行信息的推送,并对听力有障碍的人士有更为重要的意义,未来的市场前景辽阔。
  三、语音识别技能应用
  3.1 语音指令抑制在汽车上的应用:
  语音抑制人员只需要用嘴说出下令抑制字,就能够实现对系统的抑制。在汽车上,可用于汽车导航、抑制车载设备。如车灯、音响、天窗、座椅、雨刮器等。
  3.2语音识别技能在医疗系统中的应用:
  医疗语音识别技能,已有厂商开发了基于云平台的语音识别系统,可直接内嵌到医院电子病历系统中,让医生通过语音输入病人信息,填写医疗记录,下达医嘱信息。
  四、相关市场调研
  1、国内外市场分析:2015年全球智能语音家当规模达到61.2亿美元,较2014年增长34.2%。其中,中国智能语音家当规模达到40.3亿元,较2014年增长增长41.0%,远高于全球语音家当增长速度预计到2016年,中国语音家当规模预计达到59亿元。[2]
  2、相关应用发展:拉斯维加斯消费电子展(CES)上展示的MindMeld。在通话中,如果参与者点击应用的一个按钮,那么MindMeld将利用Nuance的语音识别技能,分析此前15至30秒对话。随后,MindMeld将确定对话中的关键词,以及其他多个信息来源,查找具有相关性的信息,并在屏幕上向用户提供图片和链接地址。[3]
  参 考 文 献
  [1] 吴坚.基于web的salt语音识别技能应用研讨[D].湖北工业大学, 2006
  [2] 武勤.2015中国智能语音家当发展白皮书.计算机与网络2016,42(8)
  [3] 能监听语音通话的智能语音助理MindMeld 新浪科技 2013,1
转载请注明来源。原文地址:https://www.7428.cn/page/2018/1129/48676/
 与本篇相关的热门内容: