ABOUT US
文安智能杨帆:易复制性和高可用性,是产品落地的关键
本文转自亿欧网
[ 亿欧导读 ] 5月23-24日,由亿欧主办的GIIS2019中国智慧城市峰会在北京举办。文安智能副总经理杨帆在会议上,发表了主题演讲。
杨帆曾主导参与了:国内首个基于人体建模客流技术系统的智能一体机、国内最大规模的公交客流系统、业内首款商业人脸客流相机等多款产品研发。可以说对于如何将人工智能技术落地,有着自己独特的见解。
杨帆认为:“落地有很多的可能性,但我觉得最简单的一点就是,以双方能承受的合理成本来解决用户最迫切的问题。”
以下是杨帆的演讲全文,亿欧智慧城市在不改变嘉宾原意的基础上,进行了编辑。
大家好,非常高兴有机会和大家分享我们的方案和理念,也非常感谢亿欧提供这样的一个机会。这个题目让我觉得非常贴切,说明亿欧真的很了解我们公司。
因为最开始这个题目是“赋能”,这让我觉得诚惶诚恐,我觉得目前人工智能还只能“加持”商业而不是“赋能”商业,商业是个上千年的行当。在这个领域来说,人工智能行业的从业者还仅仅是一个学生。
我用这个图表来为大家进行展示,实际上现阶段人工智能或者说基于智能视频这个事情,在整个智慧商业方案当中只占一个比较小的部分,所以我觉得“加持”这个词是非常合适的。
一开始的时候亿欧和我沟通,建议我多说一些案例而不是算法。当时我觉得很委屈,为什么我不能说算法。刚刚所有的人都说算法了,但是后来我发现大家说得也差不多了,到我这里的确应该为大家讲一下案例。
不过当我把这个表列出来的时候,我发现大部分内容讲得还是算法?这也很正常,因为算法的确是整个行业当中非常核心的部分。我最开始把算法应用于我们的社会是2003年,当时我在清华的图像组学习。有一次师兄说奥运会要开始了,我们收到了一个任务。当时国家跳水队在清华训练,能不能用我们的智能算法分析他们的姿势是不是标准?
当时我们用了经典的图像分割算法来做,我就跟我师兄开始认真地看田亮和郭晶晶练习。我当时天真地说我们算法真不怎样,又是分割又是什么形态学算子之类的乱七八糟,能不能图来了之后直接把每一个姿态给识别出来?
当时我师兄非常同情地看着我说,你这小子真是能胡思乱想啊,不知道图像学这行的水有多深。结果过了几年之后雅典奥运会都结束了,我师兄也毕业了。轮到北京奥运会开始了,田亮都退役了,我们又开始做这件事情,我就发现算法进步得非常慢,至少离我的梦想还非常远,我还是不能通过一张图就把人的姿态直接识别出来。
没想到最近基于深度学习的骨架识别算法非常火,我当年的梦想也可以完美实现了。现在想起这个历史,如果我能穿越回那个时代,这个算法可以吊打我们若干年的辛苦积累。可以说人工智能的发展,可以认为是前深度学习时代和后深度学习时代的结合。感谢深度学习使得我们可以做更多事,但是今天我不能提太多的算法,我要提的事情是落地的案例。
智能算法如何落地?落地当然很重要,因为这样能为客户提供价值,也让我们企业发展得更好。落地有很多的可能性,我不能一一展开,但我觉得最简单的一点就是这样——“以双方能承受的合理成本来解决用户最迫切的问题”。说得更清楚一些,落地的关键点就在于“高可用性和易复制性”。
做到这两点,这个产品才能更好地为万千用户服务。这是我们的方案框架,这边是我们的智能硬件,中间则是平台,最后是一些客户的方案。我想特别说明下,和很多同行相比,我们罕见的把智能硬件放在比较重要的位置。
刚刚我说了易复制性和高可用性,而要做好易复制性,智能硬件就非常重要。我们的方案中把大部分的基础算法都放在前端,也就是刚刚伍总说的感知层要在前端硬件来完成。而相应业务相关的实现,也就是高可用性要在平台上完成。这样分工是因为很多时候,前端的东西包括人的识别抓拍都差不多。但是到应用层就千差万别了,既使是对于我们智慧商业这样一个不算庞大的独立系统来说也很难标准化。
我们的方案中有三个基本硬件,第一个是客流智能一体机,它的应用已经非常广泛,无论是国内外都有很多的应用。这可能是世界上最早使用深度学习算法来做的智能相机,最早的时候我们应用于公交车的智能客流系统,但是因为场景太复杂,所以如果不使用深度学习算法连精度都无法保证。
第二个硬件的功能非常多,包括人的统计,人脸的抓拍去重,性别年龄表情的识别,人的轨迹分析,热力图输出等等。它的造型比较Q,我们叫它“汉堡”。
第三个把鱼眼相机和深度学习的算法结合在一起,做一些很大场景的应用,比如热力图分析和进店率的统计。
我来借助“汉堡”这个产品介绍我们的产品理念,我认为好产品有这么几个特点:好看、好用、好评,至于好做不好做实际上并不是客户关心的事情。关于好看这个例子,这是我们在争取一个项目的时候的照片,上面是我们看到的一些相机,这些相机通常应用于智能安防领域,但我觉得这些相机放到商业场景当中对于用户来说,不是一种特别好的体验。
现在很多明星店面,例如盒马生鲜、小米之家都把用户的体验看得非常重。在这个场景下,我觉得我们用来提高客户体验的“汉堡”,最基本的一点是不能吓唬人,不能让顾客觉得你在监视他。基于这个理念,我们设计了“汉堡”的外观,下面那个小小的相机就是它实际项目中的样子。
最左侧的视频都是“汉堡”生成的东西,我们的行人轨迹分析、人脸的抓拍识别性别年龄表情等等,都是从这样一个硬件出来的。这样我们后台可以只做业务相关的分析。
这样有两个好处,第一个好处是系统非常的清晰,项目完成效率非常高。第二个好处实际上是很现实的事情,因为很多的客户非常注重隐私,中台或者后台的东西更愿意自己去做。而我们在和客户合作的时候这个协议是开放的,只要客户愿意,可以自己来接收和运营数据。
现在我来总结一下我们系统的几个特点,这些特点有几个地方要特别说一下。第一个易用性,“汉堡”和“一体机”在国外都有比较好的销售,我们甚至把“汉堡”应用于中东地区并且效果还不错。
由于我们并没有一个很多人的现场工程师团队,所以我们希望在做海外项目的时候,和我们合作的集成商可以很短时间学会应用,比如最近在泰国的某个客户在谈,他们的工程师只在我们公司呆了一下午就觉得可以实施了。我说海外的例子,是因为能够在海外落地的产品,是产品易用性的一个重要佐证。
还有一个是性价比200元每平米,这个话听起来非常的外行。因为我们这个行业的产品,从来不是按平米算,而是要按照点位去算。那为什么我要这么说呢?最开始在我们接触一个全国有好几千家店的客户谈的时候,我说你的预算是多少?他说200块钱每平米,我当时看着他说一看就不懂行的,后来发现我才是不懂行的。
因为预算的人才不会把我们系统,放在那么重要的位置专门地去做预算,我们的智能系统是包含在他们的软装之中的。后来我仔细地调查了一下,发现200平米在业内是很合理的一个价格,好像无论什么业态都是围绕这个价格去波动。有钱的就多一些,比较不想花钱的少一些,所以我们在设计系统时,就总想着200元每平米这个数,这就是我跟客户学来的思考方式。
接下来我分享几个案例,第一个案例是一个很有格调的手机厂商,他们全国开了几千家店,开一家店就装一个系统。因为是加盟店,大家知道加盟店是总部对下面管控能力最弱的店,所以他的诉求非常的简洁,要易维护,要廉价,要易施工,周期最好一天。所以我们给他们的方案是,单一的智能一体机,满足了这样一个需求,从我们的后台可以看到他们在全国装了很多家的店。
在整个施工的过程当中,我就发现有时候他们的开店周期真短,我们还没等怎么分析他们的数据,这家店就不做了,这个周期甚至短到了就两周。而往往他们的经营情况和客流量有着很强的相关,我们去分析它的经营情况,可以提前一周告诉你这家店快开不下去了,于是我又尝试了几家店去做进店率,因为我的鱼眼相机可以用非常标准的方式去看店外的客流情况。
如果有这种系统,我可以更加快速地告诉你接下来的经营情况,可能在你刚开店的时候,我通过分析店外的客流就知道你可能快开不下去了。虽然我们和用户谈的时候不要说,我有一个系统可以告诉你哪一家店开不下去了,但是我们的确可以通过一种比较好,且容易落地的方式,告诉用户我们的系统是有价值的。
最边上就是很多店的经营情况,假如我是投资者的话,我是可以通过那些数据来告诉自己这个公司做的还不错。而这个公司做的也的确挺不错的,曾经在一个体验店里面我关注到它的店内一二百平的店,周末一天1万多人。
这原本是卖手机的公司现在建立起了自己的生态圈,我们发现这一万多人中女士和小孩很多,这就是他们做生态要吸引的目标群体,所以我觉得这是非常成功的案例。我还看过进店率的情况,发现最高峰时40%经过的人陆陆续续要进这家店,这些数据就是通过我们的角度为客户提供的价值。
第二个是一家商业地产客户,在中国有好几十家商业广场,我们正在实施全国广场中人脸分析最大的一个应用,在广场每一个入口我们都安装了“汉堡”,这个方案经过我们一年多的探讨。
第一,它一定要好落地。第二,对于商业来说他们的顾客和安防领域不太一样,他们关注的是顾客的群体,而不是每一个人的身份。所以一个基本需求是不应该因为这个人低头或者是背影就不去分析,抓拍率要很高。
最开始我们做了一个测试,开业一天,一个门口就进了5万人,我们的抓拍率大概可以做到97%。所以经过了诸多的考虑后,现在这个项目才得以正式的实施。这样一个客户,他这么多年来理念是是比较前卫的,愿意尝试一些新技术应用,所以我们不断地去开发报表,去为他们提供分析数据支持。
我左手边是一个例子,这个简明的报表表示了,周末和非周末的客流对比情况,并且类似的表格还有很多。这几年随着整个技术的发展,我们客户不太满足于我们提供的报表,而希望我们能够提供分析报告。于是我们提供了半人工半自动的分析报告,这些分析报告就是我们用统计的方法,发现有一些数据是异常的,至于为什么是异常的我们不一定知道。我们可以猜测一些原因,比如人少了10%,为什么少10%,可能可以通过人脸特征、动线分析、门店分析等分析具体原因,而无论如何我们的系统还是会发出警告。
第三个案例是很了不起的公司,最近正在跟美国打架,我们用他们公司的芯片做出产品来服务他们的公司。我们被这样一家公司认可是很值得骄傲的事情,我们也愿意继续为他们公司做服务。这个是他们的体验店,体验店做的东西非常复杂,希望做各种各样的功能,于是我们把所有的产品都用上了,尽管所有的产品都用上了,可是在施工的时候还是非常的方便,因为他们要做的也只是安装一些相机。
这是他们店的动线,其实动线用了很多很复杂的技术,而不仅仅是人脸识别。因为人脸是经常捕捉不到的,所以还使用了人体识别的相关技术,当然步态分析是用不到的,因为在这家店很难看到客户的脚,这就是算法向项目转化时候遇到的问题。
这个是我们呈现给用户的数据,用户希望用我们的东西可能更加的有效一些。比如他们关心的实际上是他们店的人货互动,我们通过一整天的热力图变化来量化这个问题,第二个是进店率情况,而客户关心的可能是店面的选址。第三个是路径规划,它关乎到坪效以及租金转化率的问题。最后一个是任何一个顾客的行踪,这是最细的粒度下客户数据的呈现,可以说大部分的智慧商业数据都可以从这样无数条客户轨迹中得出。
当然现在有一些变化,大家越来越注重隐私,我想这可能是我们做智能相机的一个先天优势。因为我们甚至可以不输出人的图片来获取相应的人的特征,当然隐私问题这是社会和法制要讨论的范畴了,今天我们不做讨论。
这个图是项目中发生的一件很有意思的事情,客户对我们说能不能帮我们猜猜未来一周的客流量,但是可以看出来这个店的流量和股票一样毫无规律。我说这个怎么猜,他说你们试试,后来我用了一些数据和变量去回归这个值。我们能用的数据并不多,能用的也就是历史客流、天气、所在城市、节假日和突发事件,还有舆情分析等等这些,结果出来以后比想象的好得多。
蓝色的是实际的,红色是我们分析出来的,这个精度大概能够到80%—90%,我预知你未来一周的客户量还是比较靠谱的,这有助于让我们的用户做经营分析和智能排班。我拿这个事情来举例,是说用户的想法是很有意思的,从纯业务角度的思考,往往要突破我们从纯技术角度思考出来的窠臼,多和客户沟通交流非常有助于产品的落地。
我简单说一下线上数据洞察,这个事情不是我们能做的事情,是BAT他们做的事情。不过从用户角度来说,我们其实是有互补的关系,他们提供的数据更全面,而我们提供的更精准。所以有的时候,我们给用户提供包括这样精确的信息,这是我们帮助用户提供价值的事情。
我们再看一下其他案例,从我2006年加入到文安智能,经历了很多的客户,我们跟他们一起发展。非常感谢这些客户,他们能够既当我们的客户也当我们的老师,让我们的产品更加的符合他们的需求,谢谢大家。