大数据的采集和应用,离不开业务的参与和支持。
Mall先生
01
我的老朋友们知道,我做自媒体的初心,是觉得这个流量时代有太多人云亦云的不实消息,希望能以一点绵薄之力,做些去伪存真的事情。所以每次看到那些可笑的数据、报道被制造出来,甚至还煞有介事地越传越广时,总会激起我的反击欲望。
最近令我愤怒的,便是下面这张图。
某大数据客流图表 | 来源:网络
这张图源于5月19日,腾讯房产联合腾讯地图位置大数据发布的《2021年一季度中国重点城市商业吸引力报告》。出品方的大牌背景,让这张图以及相关各种解读持续扩散。
但从第一行开始,这就是一张经不起推敲的图啊!
刚刚荣膺2020全球店王的北京SKP,一季度的客流量是……9万人???折算一下,一季度共90天,包括元旦(3天)和春节(7天)两个假期,按照图中说法,算上假期及周末,北京SKP平均日客流量是1,000人次???
如果读者们对于这个数据没有概念的话,我来做个对比。根据北京SKP披露的数据,2020全年共迎来1,500万人次客流,实现了177亿元销售额。也就是说,哪怕考虑疫情影响,其日均客流也有4.1万人次,怎么转过了年,瞬间客流就缩水了97.5%呢?这是客流呢,还是比特币呢?
翻开1~3月的大众点评,我们可以看到北京SKP每月都少不了“人多”“排队”“停车难”的评价,显然与这张图表想表达的意思大相径庭。
就算这张表格显示的不是季度客流,而是月度,那月均3,000人的水平也不合常理。如果是日均客流,那北京SKP一天9万客流的数量级倒是对了,可下面几行广州天河城日均客流385万又是什么概念???
要知道,2021年春运期间,广州白云机场40天内才总共接送旅客371.98万人次。这么说来,天河城1天的顾客数=白云机场的40天春运量!!!
广州白云机场2021春运照片 | 来源:广州日报
第一行就离谱如斯,后面的其它数据(成都万象城客流是成都ifs的3倍……),以及基于此的分析等等,我已经无力吐槽。
02
谨慎起见,我还是找业内朋友确认了一下,大家也都啼笑皆非。不仅SKP,图中北京其它几个项目的月度实际客流都在200万以上,远不是图中这个样子。
这张图本身的问题就说到这里,下面我想探讨的是:
1、为什么会出现这样的错误?
2、该如何看待大数据在商业地产的应用?
在对外正式发布的报告中出现这样不可思议的错误,起因可能是技术原因,比如调用的数据源覆盖样本量太有限,选取POI的时候搞错了,在数据去重的时候删多了,甚至是做表的时候笔误了……
但最终原因,我认为还是过于迷信技术,而缺少对专业的敬畏与尊重。以至于当产出如此令人震惊的数据时,第一反应不是校验数据,而是自以为是地搞个大新闻、大报告。实际上,但凡能花时间去趟现场、问几个行业朋友,甚至只是像我一样去翻几张照片,也不会搞出这么大的乌龙。
北京SKP | 来源:SKP
当然,我本身并不反对,甚至是大力支持和提倡新技术、大数据等工具在商业地产领域的实践,甚至还会开一个相关领域的专栏。但我认为,当下阶段,谈起大数据在商业地产的应用,至少有如下三点是需要了解的:
一、用大数据反映绝对数量时,必须经过人工校验。
目前大数据调研中常用的运营商数据和APP数据,基本都无法做到对调研总体的100%覆盖,本质上都是抽样调研,而且是不知道抽样比例的抽样调查。这种机制产出的结果,只能反映出不同总体间的相对数量,更多是定性而非定量。
比如,我们可以根据联通运营商数据,了解到某商场春节期间顾客的男女比例为111:122,但由于不知道联通在该区域人群中的覆盖比例,我们无法准确地告诉你,该时段内总共有多少个男性顾客、女性顾客光顾了商场。
只有在经过人工处理,通过已知数据和抽样数据结果的校验比对,确认其抽样比例(往往也只能精确到一个区间)之后,才能反推出相对接近的绝对数量。
二、非智能化手段获得的数据,也是大数据的一部分。
现代技术手段的应用降低了数据的获取难度,也提高了获取效率,再加上“大数据”一词多应用在互联网领域,导致人们往往将大数据等同于用智能化硬件、软件工具采集的数据。
而事实上,至少在商业地产领域,很多非智能化采集的信息也是非常核心的数据资产。比如一个商场的建筑面积、品牌更替情况、品牌销售额等等。举个例子,光知道客流,但不对比商场体量,就无法评价哪个商场人气更火;我们很容易知道北京SKP和北京蓝色港湾销售额的区别,但如果是朝阳大悦城和长楹天街其中的餐饮店铺,谁的生意会更好呢?
因此,这些目前还不能第一时间被技术手段捕获,需要大量繁琐的人力劳动的信息,恰恰是构建起商业地产数据库的重要壁垒。
三、大数据的采集和应用,离不开业务的参与和支持。
尽管大家越来越重视数据,但数据的价值不仅是被了解和观察,更重要的是被解读与应用,从而对业务产生指导和支持。
譬如说,当大数据显示商场里的女性顾客数量高于男性顾客时,这或许是个有价值的信息,但它无法孤立地反馈该购物中心主打女性客群的策略是否成功。只有再进一步研究这一比例与周边既有人群的性别比例是否一致、和不同定位的购物中心是否存在显著差异、调研期间是否有活动干扰、女性客群的消费需求是否与内部品牌级次匹配、店铺内对应品牌以及其它客群业态的销售业绩、可匹配新品牌的开店计划等等一系列问题,才能判断出下一步如何进行调整,实现从数据到决策的转变。
而这个过程,无论是增补数据的设定、还是外部信息的获取,都需要数据团队与业务团队的共同合作。如果单靠数据就想实现对业务的反馈或监督,那就永远只能停留在“纸上谈兵”,最终像这份报告一样,成为披着专业外衣的笑话。
转载请注明出处。