系列前言
海鼎科技·专家课程
在接触对接了行业千余家客户的数字化需求之后,我们发现,商业地产企业中不乏具有热血与冲劲的专业型人才。他们或为了商业集团、项目的发展贡献着宝贵智慧,或在学术领域沉淀着极具价值的架构体系。
今天,我们将他们请到海鼎科技专家课程系列的现场,为更广大行业的受众“曝光”他们的所学、所识、所感,将私藏的干货展现给行业大众,造福行业加速发展。
本期专家介绍
刘烜超先生
2010年进入零售业工作,历任多家商业项目的IT部门负责人。经历7个项目(3个筹开)的发展与成熟,其中包括百货、购物中心、商街、超市、综合体等多业态,专长于商业地产数字化板块工作。
在数据分析专业领域中,其于15年深入研究统计学,19年初通过法国ESSEC商学院数据分析专业认证,2021年获得联合国下属机构TRL Alliance 授予的 Independent Scientist 认证 以及 TRL 志愿翻译者资格。同时作为Unity、Unreal虚拟现实独立开发者,参与某高校艺术与科学专业的数据可视化艺术作品的研讨和作品制作。
写在前面·作者序:
商业数据分析(简称BA),结合头几年 Big data、AI 的风口,被甲乙方炒得火的不能再火。一时间,IoT、新BI、新零售等等新概念层出不穷。
本人在商业的IT部门工作了11年,在这些年的项目经验中,发现商业公司开始越来越重视数据了。然而在实际运作中,要投入的不仅是资金这么简单,专业素质、理论基础以及上层领导的理解和支持,方方面面缺一不可。有时候不同项目间千差万别,报表又很单一,分析手段也是20年前的标准, BA&BI 的推进如此缓慢也是情理之中的事情。
在过去的实际分析经验中,我发现传统商业分析的结构是相当单一的,同比环比分析、漏斗下钻、分类汇总,配合多种维度:例如销售、坪效、租决等等,得到的分析往往不能理解数据之中本身蕴含的意义。针对这个问题,我通过结合国内外大量文献和资料,以及借鉴其他行业的分析方法,将用以下4个章节粗略描绘一下这些年的分析手段和经验:
第一章:商业数据处理以及描述性分析
第二章:相关性分析、数学模型应用
第三章:无监督学习下的客群统计和店铺统计
第四章:数据可视化
接下来,让我们进入本期课程的第一章学习内容:“商业数据处理以及描述性分析”。
分析中用到的软件和语言仅供参考
商业数据的特点和缺失值处理
Shopping mall 的存在本质是合理控制租赁方经营成本,在与承租方的履约过程正常的情况下,租赁方不会造成因人员、促销等费用产生的巨大投入(相比百货和超市)。
但国内外的购物中心都有一个核心问题,销售无法及时获取,这也是造成数据收集和分析困难的巨大问题。往往我们看到一个店铺的销售数据表现是这样的:
某商场在定义区间范围内的品牌交易数据,其中缺失值用黄色表示。如图所示,该品牌的销售数据缺失方式为不规则不定期缺失,因此需要考虑使用插值补全的方式尝试补全数据。但同时要注意,补全销售后,可能直接影响现有销售的表现。因此插值之后还需要进行检验,最快捷的方式可以用ANOVA检验方差,如果方差不大于一个阀值则表明插值结果可用,或采用直观的图形可视化观察数据走势从而判断数据的可读性。
在做这一步前必须要明确一点:插值处理就是在原始数据没有的情况下,根据该品牌销售实际存在的数据进行数学模拟,并填补进空缺位置。这个方式用于找到数据的趋势,而不是具体的单日对比、环比。
插值补全有多种办法,本人习惯使用KNN、简单插值和贝叶斯插值法进行比较,以下图中列出了三种不同插值的结果。在插值范围内需要观察数据的一致性和周期性,从而最终确定插值的方式。当然由于不同品牌经营方式也不同,插值不可能是统一算法,否则有可能产生基于随机数的数学规律,导致不应出现的噪声。