资源简介
(共25张PPT)第六章 商品关联营销前言Qianyan日常生活中,人们经常会同时购买多种商品,并且这些商品之间往往存在一定关联。为此,商家通常将关联性强的商品摆放在一起,一方面可以提高商品销售量,另一方面也方便顾客购买。在大数据时代,可使用Apriori算法对商品之间的关系进行科学分析并生成关联规则,为商家进行商品关联营销提供指导性建议。主目录0201商品关联营销概述关联规则商品关联营销是企业获得更大利润的手段之一,也是企业重点关注的问题之一。01商品关联营销概述6.1.1 关联营销简介关联营销也称绑缚营销,是指在一个产品页上放置其他同类、同品牌或互补型可搭配的关联产品,是一种建立在双方互赢互利基础上的营销。1.在一家企业的自有网站或者其他平台上有另一家企业所售产品的描述、评价等信息2.同一家企业对多个产品的引导销售,即一款产品销售页面上除了该产品的信息之外,还有同类型或者与该产品有关联的产品信息6.1.2 关联营销中商品的关联方式关联营销中,商品的关联方式主要有3种,如图所示。互补关联强调搭配的商品和主推商品之间有直接的关联性,如商家主推商品为粉底液,则可以搭配卸妆水、洗面奶等同场景产品。替代关联是指所关联的商品能够替代主推商品。例如,下雨天可以使用雨衣代替雨伞。潜在关联重点强调潜在互补关系6.1.3 商品关联问题分析关联分析是数据挖掘中基础且重要的技术,用于挖掘隐藏在数据间的相互关系,其应用场景有很多,最典型的就是购物篮分析。购物篮分析是通过挖掘购物篮中不同商品之间的联系,分析顾客的购买行为,并了解顾客同时购买哪些商品的概率更大,以帮助零售企业制定合理的营销策略,从而提升转化率,提高客单价,提高店内商品曝光率。一种是简单的关联分析,即顾客在一次购买行为中放入购物篮中的不同商品之间的关联关系另一种是序列模式,即顾客在购买某种商品后,下一次购买的商品与这次购买商品之间存在关联关系,如购买了自行车的顾客可能过段时间会购买后车座。02关联规则对关联关系进行分析得出的结果就是关联规则。关联规则的研究有助于发现数据集中不同商品(项目)之间的联系,找出顾客购买行为模式,如购买某一商品对购买其他商品的影响。6.2.1 关联规则的基本概念为了更好地了解关联规则,下面介绍关联规则的一些基本概念。1.事务事务是关联分析的分析对象,可以理解为一种行为。2.项目项目是事务中涉及的对象,如面包、牛奶等。一个事务通常包含0个或多个项目,0个或多个项目的集合称为项目集,简称“项集”。6.2.1 关联规则的基本概念关联规则是两个项集之间的蕴涵表达式,其表达形式如下:也就是说,如果有两个不相交的项集X和Y,可以有以下关联规则:其中,前项X可以只有一个项目,也可以是包含多个项目的项集;后项Y一般包含一个项目,表示某种结论或事实;S s%表示规则的支持度为s%;C c%表示规则的置信度为c%。例如,有如下规则:3.关联规则的表达形式这条规则的前项和后项均包含一个项目,分别为啤酒和尿布,该规则的含义是,购买了啤酒的顾客,有60%的概率同时购买尿布,且可信度为85%。6.2.1 关联规则的基本概念4.支持度支持度(Support)表示同时出现项集A和项集B的事务在所有事务中所占的比例,其计算方法如公式所示。6.2.1 关联规则的基本概念5.置信度置信度(Confidence)表示同时出现项集A和项集B的事务在所有出现项集A的事务中所占的比例,其计算方法如公式所示。置信度揭示了项集A出现的条件下,项集B出现的概率,即这条规则有多大程度上是可信的,如果置信度为100%,则项集A和项集B(商品)可以关联销售;如果置信度太低,则说明项集B的出现与否与项集A关系不大。6.2.1 关联规则的基本概念了解了什么是支持度和置信度后,就可以通过设定支持度阈值和置信度阈值找出具有较高支持度和置信度的强关联规则,如图所示。6.频繁项集和候选项集若项集的支持度大于等于预先设定的最小阈值,则称此项集为频繁项集。包含k个项目的频繁项集称为频繁k-项集,记作 。候选项集是有可能成为频繁项集的项目集合,一般将候选项集中满足频繁项集条件的项集保留,不满足条件的则舍弃。6.2.2 关联规则分析关联规则分析须经过准备数据集、生成频繁项集和生成强关联规则3步,如图所示。1.准备数据集建立事务数据集对象,如表所示。TID 项 集1 1、2、52 2、33 1、2、4、54 1、3、56.2.2 关联规则分析2.生成频繁项集关联规则算法Apriori是最常用也是最经典的挖掘频繁项集的算法,其核心思想是通过连接产生候选项集并计算支持度,然后通过剪枝生成频繁项集。Apriori算法遵循以下两个核心原则。(1)如果一个项集是频繁项集,则它的所有子集都是频繁项集。(2)如果一个项集不是频繁项集,则它的所有父集(超集)都不是频繁项集。在图中,如果 是频繁项集,那么它的所有子集也是频繁项集。如果 不是频繁项集,则它的所有父集(超集)也不是频繁项集。6.2.2 关联规则分析Apriori算法采用迭代的方法。首先,扫描候选1-项集并计算对应的支持度,剪枝去掉小于支持度的候选1-项集,得到频繁1-项集。然后对频繁1-项集进行连接,得到候选2-项集,剪枝去掉小于支持度的候选2-项集,得到频繁2-项集,以此类推进行迭代,直到无法找到频繁(k+1)-项集为止,对应的频繁k-项集的集合即为算法的输出结果。为便于理解,下面以表6-2为例,演示使用Apriori算法生成频繁项集的过程。步骤1: 生成候选1-项集C1,并计算5个数据的支持度,如图所示。6.2.2 关联规则分析步骤2:剪枝得到频繁1-项集L1,如图所示。6.2.2 关联规则分析步骤3:L1自身连接,产生候选2-项集C2,并计算支持度,如左图所示。步骤4:剪枝得到频繁2-项集L2,如右图所示。6.2.2 关联规则分析步骤5:L2和L1进行连接,产生候选3-项集C3,并计算支持度,如图所示。步骤6:最终得到频繁3-项集为{1,2,5},如图所示。6.2.2 关联规则分析3.生成强关联规则使用Apriori算法生成频繁项集后,就可以判断关联规则是否满足设定的置信度阈值,如果满足,就可以生成强关联规则。对于上述实例来讲,频繁项集包含3项,所以有以下3条关联规则,下面分别计算这3条关联规则的置信度。由以上计算结果可知,(2)的置信度66.7%<75%(设定的置信度阈值),(1)和(3)的置信度100%>75%(设定的置信度阈值)。6.2.2 关联规则分析所以,对于上述实例生成的频繁3-项集,可生成如下强关联规则:综上所示,顾客购买商品1和商品2的同时,再购买商品5的概率是50%,且该规则100%可靠;顾客购买商品2和商品5的同时,再购买商品1的概率是50%,且该规则也是100%可靠。基于该分析结果,可以将商品1、2和5摆放得近一点,这样不仅可以增加销量,还能给顾客带很好的购物体验。6.2.2 关联规则分析6.2.3 关联规则的实用性评价使用Apriori算法生成的强关联规则并不都具有实际意义或指导意义,须使用另外一个指标,即提升度(Lift)判断其实用性。提升度表示“项集A发生的条件下,项集B发生的概率”与“项集B总体发生的概率”的比值,也就是规则置信度与后项支持度的比值,其计算方法如公式所示。提升度反映了项集A的出现对项集B的影响程度,也就是关联规则中项集A与项集B的相关性,具体情况如下。(1)若提升度>1且越高,表明正相关性越高,即项集A的出现对项集B的出现有促进作用,这样的关联规则有实用价值。(2)若提升度<1且越低,表明负相关性越高,即项集A的出现与项集B的出现具有相互排斥的作用。(3)若提升度=1,表明没有相关性,即项集A的出现对项集B是否出现没有影响。6.2.2 关联规则分析为便于理解,下面通过一个实例从两方面介绍如何通过提升度判断强关联规则的实用性。假设有这样的交易记录,如表所示。TID 项 集1 牛奶、酸奶、苹果、可乐2 牛奶、酸奶、苹果3 牛奶、鱼4 牛奶、啤酒5 啤酒、酸奶6 啤酒、鱼6.2.2 关联规则分析根据支持度和置信度的计算方法,得出规则“牛奶→酸奶”的支持度和置信度分别是33%和50%,在最小支持度和置信度均为30%时,该规则为强关联规则。接着计算提升度,即规则的置信度与酸奶的支持度之比,结果为1。这是因为前项(牛奶)和后项(酸奶)的支持度都很高,所以它们之间的关联可能只是巧合,即购买牛奶和购买酸奶这两个行为之间并不存在关联。因此,这样的关联规则不具有实际意义。另外一种情况是,对于关联规则“酸奶→啤酒”来讲,在无任何条件下购买啤酒的支持度为50%,而购买酸奶时购买啤酒的概率(置信度)为33%,也就是说设置了购买酸奶这个条件,购买啤酒的概率反而降低了,这就意味着购买酸奶和购买啤酒是相互排斥的。也就是说,尽管该规则为强关联规则,但是可能没有指导意义,甚至具有误导性。这个结果可通过提升度得到验证,因为该规则的提升度为66%。综上所述,强关联规则并不一定都具有实用性。不具有实用性的强关联规则是不可取的。案例对廊坊师范学院的60位在校女大学生在廊坊市沃尔玛超市的购物信息进行搜集和整理,并用数据挖掘软件Clementine,结合Apriori算法对购物篮商品关联性进行分析。鉴于篇幅有限,此处仅选择牛奶、方便面、坚果、水果、火腿肠、果汁、果酱、面包及薯片这九大类商品的购买情况进行分析。
展开更多......
收起↑