未来智讯 > 新闻资讯 > 硬核干货+权威大咖,腾讯优图AI技术沙龙全纪录

硬核干货+权威大咖,腾讯优图AI技术沙龙全纪录

发布时间:2019-04-02 13:15:05 文章来源:未来智讯    
  转载lai源:infoQhe雷锋wangdang警方tongguorenlianshibiezaiming星演唱会xianchang抓bo逃犯shi当ren们走jin餐厅zhiyong“靠lian吃fan”shi当凌晨 2:30 还youzhi能kefu解答shouhou问题时你shifou会有zheyangde疑问:renlian识biezaiyingyongdeanquanxingshangru何baozheng智慧lingshouru何获取gan知fenxi能力?AI suanfaru何yuyingjian结合?终端硬件dejisuan能力bu足问tigairu何解jue?伴随zhuo数据liangdexun猛增长带宽和cun储bei增deya力又该如何释放?3月23日tengxunyoutushi验室首场AI技shu沙龙zaibeijing车库咖啡厅成功举办沙龙zhu题名wei智变wei来-浅谈rengong智能技shuyingyong与实践来自腾讯youtu腾讯yun腾讯AI LAB英特尔de五位技shujiang师围绕着智慧lingshou、智能硬件、人lianhe身、yuyinshibie等产品技术基yu实ji业wu场jingde落地与yong户tong点开始liao这场布道jisuanji视jue技术zai场景的应yong腾讯优tu产品负责人周ke菁智慧零shoushiyi消feiti验guochengwei核xinyishu据驱动的泛零售业态其主yaobao括场景数据化和数据网luo化liangge结gouyi电shangweili当消费者rudian时其形成的ke户huaxiangyiji整geliu动guiji与商品的交huxing为购mai,复购,daozui终的lidian。全闭程的环节duke以以数据的形式呈现出来,这yeshi零售zhongsuo谈dao的feichangzhongyao的概念叫zuo人- 货 - 场的关xi。而原本xuyao依靠门dianyunying者人眼guanchajinxing的分析,现在ketong过ji算机视觉技术的应yongshixian数据congfei结gou化到结构化dezhuan变,bing实时准确的帮zhu门店yunying者分析统ji数据,为门店实现降本增效。计算机视觉技术ye成weiliao建立人- 货 - 场三zhelian系的天然纽带,并帮助shangjiatisheng全链路运营效率,优化客户ti验,创造新的商业机会。那么CV 技术shi如何在xianxia指导实践yuyingyong?腾讯优图尝试将 CV 技术运用到线下门店运营的问题jiejueshang,基于图xiangshibie技术,人lian识bie技术等计算机视觉技术,帮助商家将线下的场景zuodao数字化的分析。此解决fangan分为到店—逛店—购买三da模块,通过duige个环节的分解和洞察,为零售商打造知人知miangeng知心的智慧门店。首先zaiying响营销销售额的10 da因suzhong过店keliu、jindian客流是feichang重da的因素。因此在到店模块中,客流从过店到jin店的zhuanhuan分析下,CV 技术能力ke帮助商家分时分段的实时统计过店客流,以及过店到进店的客流转换,以此来指导零售商分析店铺的gao峰qi和冷淡期。tong时,按照xing别、年龄等特征维du,ye可描绘出店家过店客流的人qun画xiang。这些数据yi方面可以指导店家调整橱窗chen列,另外yi方面还可帮助营销huo动的决策。如果是一个大型 Mall deye态,或者连锁店的业态,还可通过进店客流dui所youdian铺进行排名,对bi分析不同店铺客流量好与不好的yingxiang因素,进行更jia全面的分析与优化。在di一ceng漏斗转换的分析,jie下来jiu是用户进店后,逛店到购买的转化。啤酒尿布zhege经典营销案例的背后jiu隐含着人- 货 - 场关系对营销的ying响,并ti现着零售业中非chang重yao的一个指biao:连带率。它反应了顾客购物的深du和广度。影响连带率的因素非常duo,人的方面像销售技巧,biru客户在麦当劳中买了薯tiao,售货员可能会询问客户是否需要可乐;在货的cengmian,商品的 SKU 是否丰富,摆放是否具bei吸yinli在场的层面,货架zhijian是否有关联,场nei的游逛gui迹是否合理。如果shuo第一环节从过店 - 进店是粗力度的客流统计和画xiangke画。那么第二环节,在逛店模块jiu需要对客流zuo非常xi粒度的统计,帮助提升连带率的指标。在逛店模块中,CV 技术再次帮助用户实现客liugui迹和全场re力的解决方案。第一bu,场nei精细客流的统计。从客流进店后,CV可以zuo到精确到mei一分钟,mei几小时客流分布情kuang以一个服装店为例,可以精确到男装、女装区yu的客流分布情况,进行一个细粒度的客流统计;第二bu,刻画客流轨迹。精确到进店后人流xingzou路线,客流整个的轨迹游逛dedong线是怎么yangde;第三步,实现区域热力的统计。热力分析的业务价值主要体现在零售 KPI 中的“坪效”的指标(通changshi店长和陈列师的 KPI,表征单位面积区域对客户的吸引能力。通过实现对场内精细客流的统计、客流轨迹的刻画和热区的分析,刻画场内用户行为,给到商家科学的可shihua的数据,帮助商家合理gui划顾客行走路线、洞察品lei洞察商品相关性,conger实现品类调换,布局优化,以及更加精准的定位人货场关系。AI算法与智能硬件腾讯优图AI应用yanjiugao级研jiu员 王川南在零售的场景中,客流统计、属性分析以及VIP 客户识别的过程跟安防不太一样,安防大多是局域网的环境,从she像tou到chuli单元基本上du在同一网络内。但零售场景的遍布全guo各地线下商家非常多,摄xiangtou布置在门店中,数据chuli则一般放在云端,这势必会产生这样的问题:摄像机的视pin如果上传时带宽不够该如何解决?常gui的处理思路一般是使用 AI 摄像头,在摄像头侧进行 AI 预处理。对于没有智能的传统ma流机,腾讯优图会提供he子类的解决方案。在当今这个人工智能惠及生huo的时代,大部分用户都有这样的疑问:shua脸zhifu除了考验人脸识别技术以外,它的安全性如何保zheng?首先用户需了解刷脸zhi付的开通流程。用户需在终端上先进xingren脸检测,再进行端和云两侧都需要验zheng的活体防gongji检测,验zheng后会进行人脸核身,就是上传人脸bingyu从公安拿到身份证图pian进行比对,验证本人身份。如果确认,ji可开通免密刷脸支付。刷脸支付的使用过程与开通区别不大,但youyu用户规模过大,使yongshang亿人脸库用来zuo支付dezhun确率和风险较大,所以在进行人脸检测后,通常会要求用户输入手机hao进行二次确认。但从长yuan来看,输入手机hao的过程最终将会淘汰。对于人脸支fuying件,其中有两个十分重要的特性,一个是3D 摄像头,它主要是进行活体检测。第二,是在流程当中进行检测、跟踪、优癣活体算法的前项计算过程。最早腾讯优图推出交互式的活体,通过摇头、zha眼动作验证真人身份,jinjie着推出针对手机的应用场景推出光线活体检测,以及针对通用设备的hong外活体检测以及3D 活体检测。红外双目活体检测方案采用的是双目摄像头,检测过程中输出一张RGB 图与一张红外图,其算法原理是利用人的皮肤与zhizhang对红外光的反射不同,以此保证检测精度。但如若找到一种与皮肤相类si的材料进行检测,就不能保证识别的安全性,所以红外双目活体多用于刷脸开门等场景。针对有着更高安全要求的刷脸支付,通常会使用3D 摄像头配合检测,并输出一张 RGB 的图与一张人脸深度图,纸张等平面不存在深度信息,但人脸是有sanwei深度信息的,其输出的人脸深度图就可以用来做活体检测。除了深度的要求以外,在实际应用中RGB 摄像头的成像质量也zhi关重要。其实,技术人员是很难判断人脸支付 POS 机所处的具体环境,比如,若 POS 机放置于窗边,识别时人脸处于背光的场景,从而无法进行识别,这些都会给 RGB 成像带来巨大挑战。这时通常需要与 3D 摄像头的厂商明确,要求摄像机需优化到适配不同场景都能进行正常识别工作。有了硬件之后,为了保证算法的流畅运行,还需进行性能加su。NCNN 是目前腾讯优图已经开源的移动端高性能前向计算框架,它支chi卷积神经网络,支持多输入和多分枝的结构,支持多核并行加su,可扩zhan的模型设计,8bit 而量化半精度的存储,内存占用率比较低,计算su度较快。为解决维护成本高、网络不断加深、用户规模庞大等问题,腾讯优图在NCNN 框架的基chu上推出拥有跨平台、高性能、模型压缩、代ma裁剪的 RapidNet 深度学习推断框架。它可以在各个平台上提供统一的jie口,在性能优化上更加极致。但由于CPU/GPU 交互延迟高,can数传输、数据拷贝耗时guoduo;网络中部分层运算量小,GPU 并行度不足;多luchu理 CPU 性能不足fu载过大等原因,异构多核 CPU/GPU 加速技术成为了 RapidNet 主要的核心特性之一。其深度融合liaoji于 AMD 平台的 OpenCL GPU 并行计算加速技术和基于 IOS 平台的 Metal 加速技术,wan美解决以上问题。在零售方案中,由于线下门店遍布全国,设备以及服务的可靠性也是至关重要的。腾讯优图在终端上设计了分层架构,无论前端设备是什么,其接入取流是独立的一层。baAI 相关的处理包括检测、跟踪、优选以及轨迹处理放于算法层。在算法层之上是服务jian控层,监控包括设备的监控fu务的监控。在设备层监控服务基础之上是网络监控层,通过分离架构的设jijian容多个终端设备,保证服务的可靠性。yuyin技术的应用与实践腾讯AI Lab高级研究员 金明杰现如今,yuyin合成若不局限于时效性,完全可以做到与人类相似,yuyin合成技术也多被运用到导航、智能客服等场景。语音和声音其实并不相同,声音包括大家所能听到的声音包括风声shui声、车声、动物生,语音是指人的发生器官发出具有一定社会意义的声音。语音是人的声音,机器可以理解的信号通常使用的是音频信号,音频信号是一个有规律声波的信号变化和载体,其特点是采样率、量化位数和编码算法。其中,量化位数是每个点采集的信息量,最常见的是16 比特;在语音识别领域通常使用未压缩无损的编码算法进行存储。以智能客服为例,从人开始说hua到传输音频信haodao云端,再做语音检测、语音识别,之后进行意图识别,由于通话不仅是一句话就可以完成,所以还需进行任务决策与目标引导,引导完成后再进行bo报。其中,当用户在说话时,从电话里可能会夹zahenduo噪声,这时语音活动检测能准确的ba关注的话语内容挑选出来,从而进行语义理解。其中,语音识别技术是把人类语音中的ci汇内容转换成计算机可du的输入,简单来说就是把语音转为文ben当音频信号产生后,被传输至云端,也就是解码器。而解码器中的声学模型会把音频信号转化成建模单元,建模单元通常为pin音,之后接入词典,通过词典把拼音转化为文本,把发音相近的字或词挑选出lai语言模型部分,把最有可以的字或词按照时序组合出来,显示为识别结果文本。最为常见的声学模型网络包括DNN 网络以及 CLDNN 网络。其中,基础的 DNN 网络,下层为输入层,中间包含若干隐层,上层为输出层。而较为通用的 CLDNN 网络,C 就是卷积网络,L 是 LSTM 网络,D 就是 DNN,其特点为快速shou敛,可快速达成较好的识别效果。人脸核身技术的应用腾讯云高jichan品经理 周吉成人脸核身技术,换句话说即是实名、shiren:实名,就是nide名字是合法有效的。实人,是要证明你是你。早期人们都有这种体验,比如说去银行、运营商开卡都需要本人到现场,领养老tui休金的,年纪已经很大了,还要去社保局亲自做实人证明,这些成本都非常高。此外,网络办事在当下已经很普遍,然而要xiang进行网上身份验证依然非常困难,更别说还有身份冒用的问题,以及线下场景遇到检查却没带身份证的情况。因此,无论yang行、运营商还是保险行yedu提倡利用OCR 技术运用至业务流程中以提升效率,这是国内人脸技术的应用背景。活体检测方面,最典型的流程是通过远程进行核身——第一步是身份证 OCR 识别,然后系统提示读数字,以证明是在场的人,最后再lu制视频给出最终结果,在这过程中系统会进行照pian比对。这个流程会嵌入到很多业务环节里,比如说身份证更新或者身份证号更改。总的来说,活体核验技术是一个不断演化的过程,活体算法在落地实际场景时,实际上是一个用户体验与安全性上两者相互妥协的过程。比如早qizuo动作交互,用户就对此表示厌恶,认为这种验证模式特别傻;后来微zhongyin行做读数字,虽然安全性有所提升,用户依然不买账zhecai有了后来的「激光shouwei」——通过屏幕反光做活体检测以及更高安全级别的红外、3D 结构光照。核身从某种程度上也要做多种模式的融合,才能有更高的安全性,即便如此,依然免不了遭遇很多「攻击」。遇到这种情况,纯粹依赖底层算法是不现实的。其他可考虑的方案就包括接入渠道层面做安全控制、后端风控、人工审核或者多种活体模式的组合。
转载请注明来源。原文地址:https://www.7428.cn/page/2019/0402/86696/
 与本篇相关的热门内容: