清华大学博士生导师、杉数科技科学家李建
4月26日,2018 GMIC全球移动互联网大会在北京国家会议中心如期举行。今年大会主题为「AI 生万物」,聚焦AI技术带给我们生活的巨大改变,体会高新技术的人文温度,挖掘更深层次更多元化的创新思潮。
会上,商机盒子举办的「新餐饮·智未来」2018 年餐饮新连锁趋势峰会将关注点放在了与生活息息相关的“吃”文化上,现场清华大学博士生导师、杉数科技科学家李建发表主题演讲,探讨了面对行业内外普遍关注的AI与餐饮行业如何进行深度、创新结合的问题
李建给出了两个明确的方向,智能选址和运输优化。通过海量数据分析、机器学习、运筹优化,在全局多业务目标最优的基础上,帮助餐饮企业准确、自动地实现成熟经验的高效复制。同时为企业所面临的供应链运输管理问题提供了科学合理的“最优解”。
以下为李建演讲内容,由创业邦整理:
这两年跟杉数科技合作,在人工智能赋能新餐饮方面做了一些事情,在这里,我想分享两个具体的结合方向,一个是智能选址,一个是运输优化,我们利用人工智能和运筹学对餐饮行业的选址和运输进行了优化。
我的研究方向是人工智能、算法分析和机器学习,这两年人工智能非常热,逐步走向各行各业。它的一个突破点是用深度学习取得的,从而被学术界广泛地认识。在阿尔法狗出现之后,开始被大众所认识,全面进入各行各业。在某些领域人工智能已经应用地非常广泛了,某些领域才刚刚接触,人工智能正在跟新餐饮,新零售进行越来越紧密地结合。
除了人工智能这个热点以外,我更想提的是运筹学。
运筹学实际上是研究决策和优化的这门科学,我们如何在非确定的情况下做出最优的决策,如何在决策上面进行更近一步的优化,如何降低我们的成本,如何优化我们的利润。人工智能板块中,运筹学对商业决策非常重要。
我今天主要想讲两件事情,一个是智能选址,一个是运输和装箱优化。
我之前做时空大数据分析与优化,时空大数据是指我们数据里面既有时间属性也有空间属性,比如GPS数据和交通数据,还有商店、电商中的各种数据都有时空大数据的属性。针对这方面进行预测是目前机器学习和深度学习所面临的一个挑战,我们正在或即将应对这些挑战。
首先讲一下数据驱动下的餐饮智能选址。
谈起新餐饮和新零售,都是颇具规模化的,不再像传统零售,一家夫妻店开在楼下,就是一家小店。现在随着无人店、连锁店的出现,每个大型零售商都有非常多的网点,比如说一家餐饮可以有很多的网点。如何对这些网点选址对企业来说是一件非常重要的事情,比如有几百个网点,如何选址,在不同的城市不同的位置都有不同的属性。
传统零售选址肯定是通过人为挑选,依靠人的一些经验。这里会出现很多问题,每个人的认知范围有限,很难对整个城市有一个宏观的认识。
而我们的智能选址是基于海量数据推出了一个利用大数据+AI算法的智能选址平台,可以使得整个选址过程更加智能化,更加自动化。
下面讲一个智能选址平台的例子。
智能选址平台的数据输入是需要海量数据支持的,数据输入需要一个城市的宏观信息和微观信息,需要人口信息,需要相关店铺信息,需要竞争对手的信息,需要商圈的一些信息。然后,要对城市进行网格化,将城市分成不同的网格,然后基于商圈功能和整个地理区块情况进行更细致地划分。再细分每个划分的区间,考虑区间里的限制,比如业务的限制或交通的限制或人口的限制,建立评估商圈潜力的重要指标体系,得出每个商圈的综合分数。
我们的系统有三个功能,其一是对某个商圈进行洞察评分,了解这个商圈有多大的潜力。其二是能对企业期望的选址地点进行营收预测,预测未来这个店铺能够赚多少钱。最后,能为企业规划整个城市的网点,比如企业可能想在这个城市建几百个店,先建多少个店,再建多少个店,这样的规划怎么做?这都是我们系统的功能。
智能选址平台的数据部分,整个城市的大数据部分,里面需要包含交通信息,比如客流,这部分信息我们可以从城市的交通部门获得。另外,我们需要整个商业圈的生态数据,比如这个地方的人口分布情况、人均收入情况等。还有就是我们需要对这些用户进行消费者画像,比如30岁左右的男性和15岁左右的小孩,分别占多大的比例。最后,我们对竞争对手进行标签,整个城市有多少跟企业相似的竞争对手,了解竞争对手的客户情况。
在获得了整个城市海量的数据之后,我们就开始做刚才提到的城市区域的细分。通过区域细分我们可以评价每个区域商圈的潜力。
首先评价这个商圈的生态和竞争的指数,我们给出若干指数进行参考。我们会告诉企业,某个指数如果比较大意味着什么,某个指数比较小意味着什么。这些指数主要包含交通电力指数、客流指数、消费指数。这些指数相当于是对人工智能算法的输入,利用人工智能的模型比如说回归模型,机器迭代或者深度神经网络模型,可以预测这个商圈的潜力是怎么样的。
对城市进行网格化后,进行全局的规划,想布几百个点,怎么布?
现在需要应用运筹学的办法进行全局的优化。那么多的网格,企业应该在哪些网格上布零售店或者布餐馆。我们一般的目标是利润最大化,同时为了全局考虑,目标也可能定为覆盖人口尽量多。当然,每个区域都有一个成本,我们可以预估这个区域的成本、收入和利润,再同时考虑覆盖更大的范围,这两者很多时候是比较一致,但有时候也不是完全一致的目标。这在学术界叫做多目标优化问题,我们有一整套算法告诉企业在这些网格上怎样进行布局。
比如假设企业是连锁店,已经有100家店。第一阶段企业想再开100家店,我们在企业现有的基础上进行数据搜集,搭建一个模型。然后告诉企业第一阶段100个新店应该布在哪儿,我们会预估新店的情况,以及企业竞争对手的发展情况。第二阶段告诉企业第100到200新店布在哪儿。一般情况下建议企业在城市比较密集的圈进行加密,越来越密,郊区则重点考虑覆盖尽量多的人口,我们的决策过程是多层次的,其中需要运用到运筹学规划的理论。
系统的第二个功能事能够预测企业在某个较小区域开店的营收。
这是一个比较微观的问题,比如当考虑门店具体的位置时,需要将门口有个花坛这样的细节考虑进来。考虑这个区域的公交站离店铺有多远、这个区域的人流量有多大等一系列问题,利用非常微观的数据预测这个区域店铺的营收情况,我们通过深度学习和预测分析模型来做,能够预测非常具体的数据,目前来说,我们的准确率是非常高的,某些例子测试前后误差可控制在5%左右。
我们推出的大数据+AI算法选址平台,是建立在机器学习和运筹学基础上的,平台能够做到多维度覆盖,有了这个系统企业能够非常容易地在多个城市进行推广,一个城市成功之后我们搜集足够多的数据可以帮助企业进行多城市的高效复制推广,省时省力。
接下来是运输和装箱优化。
运输里面包含以下若干问题,首先是非常细节的装箱问题,比如一辆大卡车很多货物怎么往里面装,这是三维的装箱问题。第二是运输资源调配是否合理的问题,一般做运输调度的人会比较清楚,这是一件非常难以调度的事情,里面有诸多的约束,比如有些地方收货时间有限制,有些地方路段有变化,有些时候需要送货,司机下班了,需要临时调配离家近的司机,这里面的变动因素非常多。
如何处理这些问题,对整个城市进行运输优化也是杉数科技非常擅长的事情。
对整体进行运输优化需要关注各种各样的细节,比如输入与交通运输相关的数据,有了海量数据支持之后,可以细化到每辆车如何进行调度,第一站去哪儿,第二站去哪儿,按照什么路线返回,我们会给出一个非常具体细节的运输调度指示。
这其中有三个具体的技术问题,第一是VRP问题,第二是三维装箱问题,第三是地址纠错问题。
首先是VRP问题,控制选择每辆车的访问点。这其中涉及到诸多优化问题,它是运筹学里面一个被广泛研究的问题,包含很多细节,难度很大。
下图是一个具体案例,经过优化后,实际用车和预期用车占比最大。实际用车大于预期用车和实际用车小于预期用车的情况比较少,行驶里程和行驶时间都得到了大幅度的节省。
第二个问题是装箱问题,解决装箱问题的难度很大,基本上把所有计算资源都花完,也基本解决不了这个问题。
最后一个问题是企业在进行配送的时候,经常会发现地址被填写错误,由于每个人书写习惯不一样,在书写过程中不经意地就给企业造成了很多的麻烦。
我们有一套系统可以自动进行地址纠错,把写错的地址纠正成标准地址,这个系统已经开发完成了,还是比较实用的。我讲的两个方向是杉数科技真正在做的,也是人工智能与新餐饮、新零售相结合的具体表现。