原文地址:http://mp.weixin.qq.com/s/5ytHdraekfIHRDVCUmX4Ew
作者:数据取经团-吕洞宾
前言
情人节到了,数据分析师小明准备给和他相恋7年的女朋友买一束玫瑰花,以表示自己对女票的爱意。
他从淘宝上选了玫瑰花之后,发现系统下面有一个玫瑰花和成人用品联合销售的礼包,小明动了歪主意,于是他购买了联合礼包,和女朋友度过了一个美丽的情人节。
之后,小明在思考一个问题,捆绑销售确实可以带来很好的利益点,无论是对于顾客、对于店铺都是一个很不错的选择。于是,数据分析师小明对三级品类—“成人用品”展开了自己的分析,挖掘出潜在的价值。
关联分析背景
流量的时代已经过去,如何在有限的资源中获取更大的收益,是网店一直关注的热点。在这样的一个环境下,精准营销、用户画像、捆绑销售等一系列商业新玩法应运而生,在这一过程中,关联分析的价值可以提现,关联分析是发现交易数据库中不同商品(项)之间的联系。
关联分析的应用场景和价值
应用场景
啤酒和尿布的故事大家都很清楚,关联分析在市场购物篮分析中占有很重要的作用;当然,关联分析对发现不同数据之间的模式也有很大的帮助。
应用价值
小明站在不同人群的角度出发,思考各个人群的需求,挖掘关联分析的应用价值。
对于用户,思考的是购买“成人用品”的时候,有一些其他需求可以一起购买,并且可以有所优惠,比如成人用品和鲜花。
对于品牌商,思考的是不同品类之间的捆绑销售,跨品类的联合营销,投入较少的成本获得较大的产出。
对于分析师,思考的是通过指标的重构敲定购物篮的时长,结合关联分析的支持度、置信度和提升度,来获得“成人用品”的高关联品类,为商家提供决策。
关联产品的界定和指标选择
关联品类的界定:
假如有A、B两组用户,成人用品、鲜花、牛奶三种物品,A买了成人用品、鲜花、牛奶,B买了牛奶,找成人用品物品的高关联品类,是鲜花和牛奶吗?肯定是错误的。首先应该找到购买成人用品物品和不购买成人用品物品的两类用户A和B,看一下有哪些其他物品是A购买但是B没有购买的,是鲜花物品,因此成人用品的高关联品类是鲜花。
关联分析购物篮时间:
以最近购买的时间为基准,用户最近的消费行为才可以更好地反应用户的消费特征
复购周期:指连续购买两次产品之间的时间差,结合品类的经验购买周期,透过具体的复购周期,来确定关联分析的购物篮时长;
犹豫期: 最近一次购买的时间往前推半个月或者一个月作为一个时间节点,与这期间首次浏览时间的时间差作为犹豫时间(购买时间为2017-07-30,往前推一个月2017-06-30,假如在期间的首次浏览时间为2017-07-05,则犹豫时间为25天);
经验:根据客单价来判断物品的购买周期,如果客单价较高,但是复购周期较短(例如数码相机的复购周期为一个月),那就要考虑可能是一些附带的SKU的影响了,在实际情况中,复购周期只能作为参考,因此我们更多的选用犹豫期来作为关联分析的购物篮时间。
关联分析指标:
识别在较小支持度和置信度下,所有满足最小支持度阈值的项集,用满足最小置信度阈值的项集来创建规则(not be worried,下面用“鲜花礼品和成人用品”来阐述三大指标)
假如共有1000人购买了商品(事物集W), 其中购买了鲜花的共有100人,购买了成人用品的共有150人,同时购买鲜花和成人用品的有80人
支持度:交易集同时包含X和Y的交易数与事务集W之比
置信度:包含X和Y的交易数和包含X的数目之比
提升度:在购买X物品的前提下购买Y物品的可能性与没有购买X物品的情况 下购买Y物品的可能性
具体结果如下:
成人用品的高关联品类:
至此,小明终于找到成人用品的高关联品类,鲜花、内衣服饰、休闲食品、手机充值,下面,就是提交方案和业务方讨论营销策略喽!
关联分析的R语言相关函数
关联分析的code相对较简单,主要利用arules包里面的一些函数就可以搞定,下面小明将关联分析的一些重要函数和参数列给大家,大家可以基于Groceries来进行操练。
联系作者:
当你对文章有任何疑问和建议可以在公众号直接发消息,我们看到都会回复哒,一起交流数据~