联合分析设计陷阱漫谈(二)

作者 刘强

陷阱2:什么样的产品特征可以作为联合分析中的属性?属性水平应该如何定义?
先讲一个大的原则,只有那些容易被消费者理解和正确感知到的产品特征,才能作为联合分析中的属性。例如:品牌:Dell,HP,Lenovo,Apple,Asus,…

颜色:红色,银色,黑色,…

打印速度:5页/分钟,8页/分钟,10页/分钟,…

重量:1.25kg, 1.75kg, 2.25kg,…

价格:2500元,2750元,3000元,…

从上面可以看到,一个产品特征(属性)需要找到正确描述其变化状况的参数,我们通常把这些参数称为水平。如果一个产品特征的参数描述难以让人理解和感知,或容易导致误解,那么这样的属性就不宜放在联合分析中,或者必须修改到让消费者容易理解的状态。
我们来看看下面一些属性水平设计时的陷阱:
1. 关于豆奶产品,属性和水平设计如下
这样的属性水平设计有什么问题?如果消费者看到这样的概念产品描述会有什么困惑?

很明显,这里每个产品口味属性的描述都无法让消费者产生“统一”的感知。什么程度的豆味叫做“不浓”?什么样的甜度叫做“微甜”?什么样的涩度叫做“中等涩度”?每个消费者对这些属性水平的感知是差异很大的,有些人对甜味很敏感,有些人则对甜味不敏感。同样程度的甜度会在不同消费者产生截然不同的感知。
除了上面这个问题,这种水平描述能否让消费者感知到“交互效用”? 有些属性,特别是和感官相关联的属性,往往会产生“1+1>2”或“1+1<2”的效果。
假如消费者看到的联合分析的概念产品描述是下面这个样子,消费者如何“脑补”这里每一种产品喝下去后味蕾所感受到的真实滋味?
即便消费者能够做出选择,我相信也主要是依据其中少数属性的感知做出的,我们很难探测到诸如“豆味+涩度”之间的交互效用,尽管这种交互效用是真实存在的。这样一来,其实我们并不能最大化的利用联合分析的潜力。 

或者,我们可以把这里的三种产品属性水平进行量化,例如:每个产品的属性特征量化为具体的原料重量或比重。然后通过实验设计,产生一些真实的概念产品让消费者实实在在地品尝和评估,然后对这样的数据进行建模和分析。这样应该比上面这种方法更科学,而且最终的结果可以反映不同属性量化单位下的偏好度,这对于产品的研发来说不是更具指导意义么?

2. 关于啤酒的价格属性设置
价格:4.5,4.6,4.7,4.8,4.9,5.0,5.1,5.2,5.3,5.4,5.5在这里,假设啤酒产品的市售均价为5元,啤酒的价格属性被设计为11个水平,每个水平之间相差0.1元。这么做有什么问题?

我们试想一下,假设消费者看到的联合分析概念产品展示很可能是下面这样的,他/她会如何选择呢?

很明显,消费者很大程度上会根据他/她对品牌的偏好做出选择,因为价格差异很小,小到他/她完全可以忽略不计,小到他/她完全愿意用更青睐的品牌去交换这1-2角的价格差异。这样一来,价格属性的变化对消费者选择的影响就不容易凸显出来。尽管实验设计能保证上面这样的概念产品组合较少情况出现,但不可否认的是,如果价格这个属相上不同价格点间的差异无法激发消费者的权衡取舍,那么以定价为主要调研目的联合分析就会陷入“消费者对价格不敏感”的尴尬境地。因此,以定价为目的联合分析一定要注意拉开价格点之间的差距。
另外一个更容易被忽视的问题在于,当某个属性(特别是价格)的水平数量过多时,每个水平对应出现的概念产品总数就会下降。这样会导致对每个价格点的效用值估算基于的样本过少,从而导致价格属性水平的估算充斥着噪音。
假设我们有200位受访者参与了这项调研,每个人会看到8个这样的概念产品卡片,每张卡片上出示3个不同的概念产品让消费者选择。如果实验设计是均衡的,那么每个价格点对应的概念产品约为436(=8×3/11×200)个。如果我们把价格点设为4.5/5.0/5.5这3个价格点呢?那么每个价格点对应的概念产品约为1600(=8×3/3×200)个。我们通过模拟数据做过相关的测试,结果如下:
这里看到,当设置为11个价格点时,随着价格上升,产品被选择的概率大体上是下降的(不是严格意义上的下降),更糟糕的是每个价格点被选择概率的波动程度很高,好比坐过山车一样上上下下。而当只有3个价格点时,价格升高时产品被选择概率的下降趋势非常明显,且每个价格点对应的概念产品被选中概率的波动程度很小。对此,有的从业者和客户曾经有质疑。他们的质疑主要体现在两个方面:
质疑一
他们认为之所以把价格点设得这么细是为了更好的测量消费者对微小价格变化的反应。但是,我们到底是希望获得大量充斥着“噪音”,非常不稳定的价格点效用值,还是希望获得少量但是更为稳定和精准的效用值好呢?
质疑二
他们认为如果只设少数几个价格点,那么在价格范围内其他的价格点的效用值就无法获得了。这其实是无需担心的。我们可以通过插值(interpolation)的方法获得这些价格点的效用值。最简单的线性插值如下所示,尽管我们只在联合分析中测试了3个价格点(4.5/5.0/5.5),但是通过插值,我们可以计算4.8元及5.4元的效用值分别为4.9和2.9。
在这里我们需要强调下,联合分析是基于实验设计的一门技术。而实验设计的总的思想是用更小的成本和精力去获得理想的精度。
3. 用相对值描述轮胎的价格属性水平
这样设置的价格属性水平,看上去貌似合理。价格点数量不多,价格段涵盖范围也合理。但是,消费者能正确理解下面的联合分析问题么?
这里的价格属性设计有两个问题:首先,当前使用的轮胎价格是多少?消费者无法形成一个一致的认知。有些人当前使用的轮胎价格是400元/条,有些人是800元/条。对于那些使用400元/条轮胎的消费者,比当前价格高15%意味着贵60元钱,而对那些使用800元/条轮胎的消费者,比市场均价高15%意味着贵120元。尽管在属性水平描述上是相同的,但是这种绝对价格的差异对消费者的感知和对购买的影响力是很不一致的。

其次,用相对值来表示属性水平的变化是否合理?消费者在考虑诸如速度/价格/重量/油耗等产品特征时容易从绝对数量上去理解。即便在联合分析中使用了相对值的描述,但他们大多数情形下还是会在脑海中先转换为绝对值,然后再加以考虑。但是这种转换无疑加重了消费者的负担,因为消费者要针对每个概念产品都在脑海里进行如此的转换,如果题目很多,消费者无疑会觉得非常繁琐和费力,进而影响其做出正确判断的能力。
笔者认为,正确的做法应该先了解消费者目前轮胎的型号和价格,在联合分析中,这个受访者看到的轮胎价格水平应该是基于他当前轮胎价格经过相对值转换后的绝对价格。
例如,如果消费者A平常使用的汽车轮胎价格为500元/条,那么他在回答联合分析问题时,不同概念产品轮胎的价格水平应该为425/463/500/538/575这5个绝对价格水平。现在的商用联合分析软件及问卷编辑程序都可以做到把消费者之前回答的答案和信息“传递”到后续的问题中,从而使得联合分析的概念产品展示更加智能化。
多说一点,在这个例子里,在后续分析建模时,对价格可以有不同的处理方法。可以使用相对价格水平,也可以使用绝对价格水平。可以使用价格的离散形式编码(part-worth coding),也可以采取连续形式编码(linear-coding, log-linear coding),抑或是分段形式编码(piece-wise coding)。具体哪种方式更好,可能要参考许多其他方面的信息及调研的目的,这里就不展开了。
4.关于手机的联合分析,手机的运行内存和机身内存属性水平设计如下,一般将其视为两个属性,一个有5个水平,一个有4个水平:
这样的情形往往是我们经常碰到的,而且很多项目里也的的确确是这么设计的,从纯实验设计的观点看,这样的属性水平设计没有任何缺点。但是,这样的设计里,其实隐藏着一些不容易察觉的陷阱。
我们如果按照这样的设计来产生联合分析的问题,消费者看到的概念产品有可能是这样的。
看上去概念产品描述清楚,价格合理,一切都似乎没有问题。但是,稍加推敲每个概念产品,我们会发现第一个和第二个概念产品的运行内存/机身内存的搭配似乎很“别扭”。
第一个产品的的运行内存和机身内存的搭配让人感觉是“小马拉大车“,而第二个产品的运行内存和机身内存的搭配让人感觉是”大马拉小车“。如果消费者看到这样的产品组合,很大可能是不会选择的,因为这种组合过于离谱。
之所以会出现这种让人感觉”别扭“的概念产品,是因为这些概念产品是按照我们的属性和水平经过实验设计随机组合产生的。而实验设计主要是从属性水平的平衡性角度去进行随机搭配,但并不会帮你判断这些概念产品组合的”现实合理性“。这样一来,尽管这个题目中展示了4个概念产品,但消费者实际只会考虑其中两个,这无疑是一种巨大的”数据浪费“。
如果我们把运行内存和机身内存的所有组合情形列出来,并标记出“搭配不合理“(安卓系统)的情况,那么应该是下面这个样子:
不难看出,尽管这两个属性的所有组合有20种(4X5=20)可能的情况,但是,其中有8个都属于“搭配不合理“的情形,即接近一半的组合是”不合理“的。
这时候,可以有两种方法来进行优化;
第一种方法:在实验设计时,禁止这些“不合理“的情况出现,即在实验设计时添加上述表格的禁例(prohibitons)。
这种禁例设置是否可行?还需要查看添加禁例后实验设计的有效性系数(D-efficiency)。通过Sawtooth Software软件,我们可以计算出其实验设计有效性系数(假设样本量为500)为1137。而原始的,不加上述禁例的实验设计有效性系数为1256。可以看到,添加了以上对“不合理“组合的禁例后,实验设计的有效性有所下降,但是下降幅度不大(下降9.5%=1-1137/1256)。且各个属性水平的平衡性仍然较好:

但是,如果细看运行内存和机身内存水平两两组合时出现的频数,则仍存在一些平衡性问题:
例如,6G/64G的组合出现非常少(222)。而6G(8G)/256G的组合出现次数又太高(1095/1194)。
第二种方法:将所有运行内存+机身内存组合合并起来,并且排除掉所有“不合理“的组合,从而形成一个单独的属性。合并后的属性是这个样子:

这样,我们无需在实验设计时添加任何禁例,因为这个合并后的属性里已经不包含“不合理“的产品组合了。同样的,我们用这种属性水平设计思路产生相应的实验设计,并计算其实验设计有效性为1103。相比最原始(不加禁例设置)和第一种方法(直接添加禁例)都要低,但是仍然属于不错的设计方案。其单一维度的属性水平出现频次为:
这里尽管单一维度的平衡性较差,但是这种频次规律反而更类似于市售手机相应产品的数量比例关系。如果进一步查看运行内存和机身内存水平两两组合时出现的频数,则是完全平衡的:
以上两种属性水平处置方案,各有优势和劣势,需要研究人员和客户仔细揣摩,选择一个最适合的。但是需要注意,第一种直接添加禁例的方法,不一定任何时候都适用,如果使用不当,很容易导致低效的实验设计和错误的分析结果。
说到这里,有读者可能会发现另外一个大问题。尽管对于安卓系统的手机而言,例如2G+128G的组合是不合理的,但是我大苹果(iPhone)可是有的哦。如果联合分析中的品牌包括iPhone,岂不是上面这些方法就都不适用了?加禁例不合适,因为iPhone的内存普遍比安卓系统小,2G/3G+128G还是主流产品;不加禁例也不合适。如果合并属性,又存在同样的问题,iPhone的组合就那么几种,而且还是安卓系统中较少出现的。
恭喜你,你已经开始接触到真实商业世界中使用联合分析所面临的挑战了。究其原因,这是因为产品的某些属性之间是有关联性和排斥性的,并不是数学意义上“独立“的,也不是总能任意地“随机”组合和搭配的。我会在本系列的下一篇中详细谈谈这种复杂的,属性间存在关联/排他性时的属性/水平设计陷阱和应对之道。
注:以上文章欢迎分享,转载请注明出处;版权为上海大正市场研究公司所有,未经许可不得用于任何商业用途。
分享到:更多 ()

抢沙发

评论前必须登录!