1背景
随着经济发展以及人民生活水平的提高,国内消费者对香水产品的消费需求快速增长,曾经作为奢侈品的香水,逐渐成为人们的日常生活用品。我国的香水行业较欧美国家起步晚,所占市场份额小,目前尚处于成长期。这同时也说明了我国的香水市场有巨大的潜力。许多国际大牌香水制造商正在努力提升它们在中国市场的份额,竞争未来的巨大市场前景。全球范围内,香水市场是一个市值438.9亿美元的产业,每年至少有300种新品种上市。
根据中国产业信息网的统计,2015年我国香水市场规模为185亿元,环比增长15. 6%。我国香水市场的快速发展也带来了不同香水产品的大量涌现,那么到底什么样的香水产品销量更好,更受消费者欢迎呢?这些香水产品又有什么样的特点呢?本作品以从某电商网站上抓取到的香水产品销量数据分析香水销售的影响因素,为香水销售商判定采购计划以及用户选择香水提供依据。
2分析思路
根据市场情况,对市场、数据进行分析,再对数据进一步的分析给出营销策略的分析。
3数据来源
数据获取手段及原始数据说明
从电商网站抓取了1009条香水产品销售数据,包含了香水产品的商品名称、产品毛重、商品产地、包装、香调、净含量、分类、适用性别、适用场所、价格以及评价数。
原始数据清洗过程说明
“评价”字段的数据包含混合的中文和数字,末尾有一个“+”号。“+”号很容易通过Excel替换成“ ”(空字符串)的方法除去,但是将“万”转换成准确的数值结果,采用Excel或者其他现成的工具,并不容易实现。因此,采用Python编程处理“评价”和“适用场合”字段,将评价数量转换成数值。
“适用场所”字段包含多个场所如果要拆分成多个字段,首先要算出所有记录的场所合集,这个步骤也不容易通过现有工具实现。
这两个预处理步骤,最终采用Python编程实现。通过Python脚本生成了新的字段将商品产地中的“中国大陆”、“广东”、“浙江义乌”等统一替换成“中国”。“适用场所”字段分解成“旅行”、“其他”、“约会”、“情趣”等8个字段,其类型是0、1类型,若该香水产品有对应的适用场所,则设置为1,否则设置为0。例如,第一条冰希黎的香水数据,使用场所为旅行、约会、情趣、商务,party聚会。将类似“1.9万+”格式的“评价”字段的值转换为“19000”,其类型是数值类型。
Python程序没有替换原有字段,而是生成一个新字段。其优点是,不会丢失原始数据,而且可以通过肉眼复查,检查是否有预处理出错的情况。经过人工审查,经过Python程序预处理的数据符合原数据。
最终使用数据说明
原始数据源(三张表):香水.xlsx、香水关联规则.xlsx、预测变量重要性.xlsx
4复现过程
作品排版布局示意图
图表生成详细过程描述
(1)不同品牌香水的评价数量
将商品名称-评价(左值轴)条形图和商品名称-价格(右值轴)折线图以纵轴指标聚合的形式进行双轴展示,并对横轴商品名称以价格(平均)的降序排列。可以直观地看出,在香水价格的降序排列下对应香水品牌总销售量的分布情况。
(2)不同商品价格影响销售量变化对比图
选择图表类型为气泡图,将指标中的价格拖入横轴,评价拖入纵轴,它们均设置为平均;将商品名称拖入图形属性的颜色选项中,用不同的颜色表示不同的商品;将评价对数值拖入图形属性的大小选项中,并设置为求和,用气泡的大小直观表示销量的好坏。
(3)高销量香水受欢迎程度示意图
选择图表类型为树图,根据评价值之和来划分矩形块的大小,根据平均价格的高低决定相应模块的颜色深浅,并以标签的形式显示了商品的品牌名称和价格。可以直观看出高销量香水品牌的分布情况及其平均售价。
(4)各香水国销售总量对比图
选择图表类型为扇形图,将商品产地维度拖入图形属性中的颜色选项,用颜色代表不同产地;把评价对数值指标拖入图形属性中的角度选项,并点击评价对数值上的小三角,设置其为总和,用扇形圆弧的大小表示总的评价对数值;将商品产地,评价拖入图形属性的标签选项中,设置评价为总和,使图上显示出产地和销量的数值。
(5)不同国家香调对香水销量影响对比图
选择图表类型为扇形图,点击维度中的商品产地上的小三角,选择地理角色(国家地区),之后选择国家地区点确定即可。维度中会产生商品产地(经度)和商品产地(纬度),将商品产地(经度)拖到横轴,商品产地(纬度)拖到纵轴;将香调拖到图形属性中的颜色选项中,用不同颜色表示不同的香调;评价拖入角度选项中,并设置为求和,扇形角度的大小表示不同香调的占比;把香调拖入标签选项中,以便在图上注释出香调的名称。
(6)大牌香水高评价香调分布图
选择图表类型为折线雷达图,横轴为商品名称,纵轴为价格(平均),通过筛选出评价等级最高几类大牌香水,用不同颜色区分其香调,以直观表示出大牌香水受欢迎程度最高的香调以及该香调下对应的产品价格(平均)高低情况。
(7)不同香调香水整体受欢迎度对比图
选择图表类型为漏斗图,过滤商品产地为中国,从而进行国内市场分析;将评价(求和)拖入大小标记卡;将香调拖入颜色标记卡,并以标签的形式显示在图标中;由此我们可以直观地看出,国内市场最受欢迎香调的分布图。
(8)各包装类型各分类香水受欢迎度对比图
选择图表类型为分区柱形图,将包装和分类拖入横轴;评价对数值拖入纵轴并设置为平均;将分类拖入图形属性中的颜色选项中,用不同的颜色表示不同类型的香水;将评价对数值拖入图形属性中的细粒度选项并选择求和。
(9)香水分类销售情况对比图
选择图表类型为折线图,将评价(求和)拖至纵轴;将分类拖至横轴,并以评价的降序排列重新组织横轴元素的顺序;可直观地看出,在国内市场上,各分类香水受欢迎程度的分布情况。
(10)不同净含量香水受欢迎程度、适用场合数对比图
选择图表类型为玫瑰图,将净含量拖入图形属性颜色选项中,用不同的颜色表示不同的净含量;将适用场所拖入半径选项中,选择相同值为一组;将评价拖入角度中并求和,评价越高,玫瑰的花瓣越宽;将净含量,适用场合数量,价格拖入标签选项,以便在图中显示,并点击价格选择平均;将净含量拖入结果过滤器中,点击净含量,选择过滤,勾选101ml~200ml,16ml~30ml,1ml~15ml,200ml以上,31ml~100ml,点击确定即可。
(11)各国高评价等级香水品牌分布情况
选择图表类型为树图;用颜色区分商品产地,过滤出几个主要的香水销售国;用大小区分评价等级,过滤出评价等级分别为较高、高、非常高的商品,选择大小选项卡内的多层饼图;用标签显示商品名称。可直观看出不同国家、不同评价等级所对应的香水品牌分别哪些。
(12)香水适用场合关联规则
基于SPSS Modeler数据挖掘技术,使用香水适用场合数据对香水适用场合关联规则进行研究,将关联结果导入新的Excel表,在Fine BI中用多系列柱形图进行结果展示。将增益(求和)、部署能力(求和)拖至横轴,前项、后项拖至纵轴,使用颜色区分不同适用场合的增益和部署能力。
(13)变量重要性预测
基于SPSS Modeler数据挖掘技术,使用香水评价等级数据对影响香水销售情况的各变量进行重要性预测,将预测结果导入新的Excel表,在Fine BI中用条形图进行结果展示。横轴为预测变量重要性(平均),纵轴为变量名称,用颜色对不同变量进行区分,用标签标明重要性的大小关系。可直观看出,影响香水销售情况的最主要因素是商品产地,最次要因素是净含量。
5作品展示
6总结
结合上述分析,对于希望提升销量的商家来说,在销售的香水产品选择上,需要选择消费者欢迎、总体销量好的产品。
(1)制定价格方面。商家可以将产品价格定位在大众消费品的水平上,并保持正常利润空间,更多考虑运用价格策略扩大产品销路,吸引更多的消费者。结合香水产品的分类来看,淡香水EDT的销量与价格呈负相关;而浓香水EDP的销量与价格呈正相关。说明浓香水EDP的买家比较注重品质,对价格不敏感,而淡香水EDT的买家对价格敏感。制定价格时,对于淡香水EDT类的产品,可以根据消费者的心理价格,在不亏损的前提下,适当降低产品的价格,从而获取更多客户,达到利润最大化;对于浓香水EDP类产品,消费者追求奢侈品牌,价格越高越能刺激其需求,在调整空间内,提高浓香水EDP产品的价格,刺激这类追求品质的消费者购买,可以获取更多客户,从而增加收入。
(2)产品分类方面。香水产品的产地、香调、净含量都会对销售产生很大的影响,因此选择正确类别的香水产品进行销售是提升销量非常重要的方面。法国、意大利是世界上重要的香水奢侈品产地,法国、意大利的香水产品在世界范围内有着巨大的影响力;国产香水在价格上有着更大的优势,口味也更符合我国消费者的喜好。在香调方面,我国消费者喜好清淡的口味,因此花果香调之类的清新口味有更大的市场。在净含量方面,便携性好的小包装香水产品更受消费者青睐。商家选择销售的产品时,需要综合考虑产地、香调、净含量,选择更受消费者欢迎的产品才能获得更多收入。
(3)销售策略方面。由于消费者在购买香水产品时体现出了明显的价格敏感性,价格低的香水产品销量更好。组合装的香水销量好于其他包装。另外,目前我国香水消费者中很大一部分还是购买香水作为礼品。因此,商家为了吸引更多消费者,可以制定一个短期促销策略,降低香水产品的价格,通过价格优势吸引消费者的注意力,并且推出更多的香水组合以及礼品装香水,结合不同适用场合的消费需求,满足不同消费者群体,刺激特定消费者群体消费。
最后,感谢帆软给我们提供了如此良好的实践契机,让我们有幸通过Fine BI在数据可视化运用上多一份成长历练,在数据的处理、挖掘与展示上更多一份动手操作之后的深入理解,今后我们还要将此次作品制作中所获得的数据可视化技能运用到工作和生活上,以此来提升我们的数据表达效果。 |