【2022BI数据分析大赛】电商平台广告投放效果分析

我是社区第1113969位番薯,欢迎点我头像关注我哦~

制作:Mildred,Eve

软件支持:FineBI 5.1.1

电商平台广告投放效果分析

电商平台广告投放效果分析

一、 选手简介

1、 选手介绍

团队名称:电商广告分析组

团队组成:

  1. 队长:Mildred,帆软社区用户id:1113969,管理科学与工程研究生。
  2. 成员:Eve,帆软社区用户id:1136136,信息管理留学生。

 

2、 参赛初衷

半路出家,尽管团队两人有过很多数据分析基础知识的学习,但从未独立接触和实现完整的BI数据分析项目,正值人生的分岔路口,需要完善自己的能力,从理论中走出来,从零到一独立实践项目,增强对BI软件的应用熟练度,提高自己实操能力,锻炼数据分析能力和逻辑思考能力,培养对数据分析业务的理解和创新能力。

 

二、 数据分析

1、 数据来源

自选数据:阿里云天池公开数据集“Ad Display/Click Data on Taobao.com”(https://tianchi.aliyun.com/dataset/dataDetail?dataId=56),原始数据集包含4个数据表:

● 广告展示/点击日志表raw_sample

● 广告基本信息表ad_feature

● 用户基本信息表user_profile

● 用户行为日志表behavior_log

由于数据都是脱敏后的数据,不存在直接的商业价值。同时因为一些标准并不明确,部分数据并不能很好地进行解读和利用,同时维度也并不完整,纵使有上述的许多局限性,这个数据集仍有一些BI分析的价值,故选择了此数据集。

 

2、 业务背景/需求痛点
  1. 电商平台为提高商品销量并获取收益,通常利用广告推送投放的形式,提高用户对商品的认知度,增强用户购买意愿。但在实际投放过程中,很难对效果进行评估。点击率是了解广告绩效的有效方式。通过将广告点击率与广告baseline点击率进行对比,可以量化广告绩效。
  2. 从广告主的角度来说,点击率可用于比较不同广告渠道或形式的绩效。通过比较比如横幅广告和视频广告的点击率,帮助确定广告效果,深入了解广告市场实时变化趋势,并据此决定应对哪些主要的广告渠道或形式绩效进一步投资,加强对未来广告投放的布局。
  3. 在广告投放的过程中,如何将广告更精准投放给更具价值的用户,或针对反馈不足的用户推出一系列业务方案,对电商平台来说至关重要。通过将广告效果与平台内其他行为相结合,以确认高点击率与用户价值的增加之间的联系和相关性,提高广告主对不同广告渠道或形式的应用效果和适用性的认知,调整广告投资布局。
  4. 在浏览广告的用户中,产生点击行为的用户表现出更强烈的购买意愿,对这部分用户的类型和特征进行分析并设计对应策略,对广告效益的提升具有重要作用。

因此,需要对平台收集到的广告数据和用户数据进行分析,使用BI可以更合理地整合数据,再通过可视化的方式更清晰地展示出数据,便于针对不同类型用户或维度提出合适的业务策略。

 

3、 分析思路

在团队分析的流程中,首先需要寻找合适的数据集,并独立提出需求和分析方法,其中需要同时考虑业务需要和数据集记录的局限性。团队分析思路如下:

  1. 目的:分析电商平台广告投放效果,根据分析结果提出管理建议。
  2. 主要思路如下:https://shimo.im/mindmaps/dPkpKvex4LSo0vqO
    1. 用户画像:根据用户自身属性进行分析,并结合其行为特征对用户整体特征画像。对产生点击行为的用户进行单独分析,利用RFM客户价值分析,提取并针对不同类型用户实施相应的投放策略。
    2. 广告分析:分析广告投放后的曝光量、点击量和点击率在不同时间单位内的变化趋势,考虑广告商品价值投放群体的特征及资源位等影响因素,调整投放策略,提高投放效率。分析不同品牌、不同品类、不同广告计划商品的价格,了解其实际广告投放效果。

图片

  1. 整合实际需要分析的模块:

图片

 

4、 数据处理

a) 数据加工及清洗

  1. 数据集选取:本次分析主要针对广告投放效果,主表为raw_sample,而behavior_log表中用户购物相关行为日期与raw_sample表广告相关行为日期差异较大,无法结合购物和广告相关的行为进行分析,且behavior_log表中未涉及广告相关字段,无法获取更多有价值的信息。因此,选取raw_sample/ad_feature/user_profile表进行最终分析。
  2. 字段名修改:user_profile表中“new_user_class_level ”字段名较长且存在格式错误(末尾有空格),修改为“city_level”。raw_sample表中“time_stamp”字段名修改为“date”。
  3. 缺失值处理:user_profile表中pvalue_level(消费档次)和city_level(城市层级)2个字段存在部分缺失,ad_feature表中brand(品牌id)字段存在部分缺失,删除存在缺失值的数据记录。
  4. 去重处理:raw_sample表中,noclk字段中,1表示未点击,0表示点击,clk字段中,1表示点击,0表示未点击,字段意义重复,删去noclk列数据。
  5. 时间戳转换:raw_sample表中利用时间戳存储时间类型,为便于分析,转换为date类型格式"%Y-%m-%d %H:%M:%S"。
  6. 字段筛选:原数据集中user_profile表中cms_group_id、cms_segid的意义与作用均不明,删去。筛选raw_sample表中“20170506”-“20170513”期间的数据进一步分析。

b) 整理数据表间关联

图片

c) 建立自助数据集

导入FineBI,建立宽表如下:

  1. ad_union表:主表为raw_sample表,通过adgroup_id字段(广告id)左连接ad_feature表,获取广告特征信息,通过user字段(用户id)左连接user_profile表,获取用户特征信息,以分析广告投放效果。
    1. 新增列:品牌平均价格(按brand汇总组内price平均值)、品牌曝光量(按brand汇总组内clk记录个数)、品牌点击量(按brand汇总组内clk求和);
    2. 目的:按品牌获取其平均价格,便于分析价格分布。获取曝光量、点击量等数据,为后续分析广告投放效果做准备;
    3. 同理分别新增品类、广告计划的平均价格、曝光量、点击量数据。
  2. rfm_union表:首先利用raw_sample表左连接user_profile表,通过广告点击行为进行RFM客户价值分析,得到ad_rfm表,并通过user字段(用户id)内连接ad_union表,获取最终分析的产生点击行为的用户记录。
    1. ad_rfm表:
      1. 过滤clk=1的记录;
      2. 按user字段分组汇总得到最近一次点击时间(R)、点击频次(F)、点击商品平均价格(M);
      3. 新增列,获取最近一次点击时间距最后一天(即20170513,假设为今天)的天数;
      4. 新增列,获取所有用户最后一次点击平均距今天数、平均点击频次,点击商品平均价格;
      5. 新增列,利用if条件语句,对每个用户,当其R、F、M指标大于所有用户对应平均指标时,为1,否则为0
      6. 新增列,根据三个指标评价,对用户分类,获得最终客户类型。

 

5、 可视化报告
  1. 报告总体
    1. 整体风格:为使数据更清晰准确,采用灰白布局,凸显数据本身内容。
    2. 日期筛选:添加日期过滤组件,筛选获取精准到天的数据用以对比。(由于原始数据集记录限制,仅包含20170506-20170513共8天的数据)

图片

    1. 联动设置:由于分析基于两张宽表,为更清晰展示不同类别维度的数据,针对关联性较强组件,利用相关字段实现组件联动。
  1. 用户画像

主要分为属性分布、行为特征分布、广告点击RFM分析三部分。

    1. 属性分布:使用ad_union的数据,包含性别分布,年龄分布,就业状况分布和城市分布,对具有相同值的用户进行分组,通过饼图展现不同分组用户的实际占比。
      1. 性别分布:女性占比约为64%,表明平台用户中女性用户占比相对较高。
      2. 年龄分布:年龄段2/3/4/5的用户占比较高,总共约占95%,由于原始数据集中未说明各年龄段具体对应年龄,仅能推测可能为20岁至60岁的中青年用户群体。
      3. 就业状态分布:大部分电商平台用户为已工作人群(约93%),该部分人群具有较高的可支配收入,且学生群体在整个社会年龄层面划分占比也相对较低。
      4. 城市分布:二线城市使用电商平台购物的用户占比最高(约45%),可能因为二线城市常住人口相对可支配收入较高,且可支配上网时间相对较多。

图片图片

图片图片

    1. 行为特征分布:针对消费档次和购物深度两个影响因素,将用户利用性别和年龄段分类,并加入城市级别筛选,得到不同性别、年龄段人群在不同层级的城市的消费档次/购物深度的占比分布。
      1. 消费档次:女性消费档次主要集中在中低档,其中年龄段4/5占据较高比例,男性更多为中档,且其中关键消费人群为年龄段5。由于一线城市用户使用电商平台比例较低,除一线城市外,高档消费者随着城市级别的降低而减少。

图片

      1. 购物深度:收集数据大多为深度用户,相对其他用户,深度用户对广告投放的敏感度更高,花费更多时间浏览电商平台。女性群体年龄段相对男性更年轻。

图片

    1. 广告点击RFM分析:通过三个关键指标对客户点击广告行为进行观察,针对不同客户类型,对比每个客户三项指标与所有客户的平均水平,获得指标评价值,并据此分类,并对不同类型客户实行相应的不同投放策略。
      1. 指标:
        • 最近一次点击时间(R):客户距离最近一次点击广告时间的间隔,考察客户点击的沉默期
        • 最近点击频次(F):客户在限定的时间内所点击广告的次数,考察客户的忠诚度
        • 最近点击商品价格(M):客户在限定的时间内单次平均点击的广告商品价格,考察客户的意向消费能力

客户类型

最近一次点击距今天数(R)评价

点击次数(F)评价

点击商品平均价格(M)评价

策略方向

挽留客户

一般

0

0

0

采取挽留措施

重要

0

0

1

保持客户

一般

0

1

0

重点保持,提高用户活跃度

重要

0

1

1

发展客户

一般

1

0

0

重点发展,培养用户粘性

重要

1

0

1

价值客户

一般

1

1

0

提供更高质量和使用体验

重要

1

1

1

      1. 分析:
        • 类型分析:利用表格和条形图展示不同类型客户的指标值和人数、占比,大部分产生点击行为的用户点击商品价格低于平均值,占约85%,其中价值客户数量最少,而发展客户相对最多,可能是因为收集到的统计用户大多数为深度用户,产生点击行为的概率较高。

图片

图片

  1. 广告投放效果分析

主要分为概况统计、时间维度的广告投放效果变化趋势、广告商品价格分析、广告投放效果分析四部分。

    1. 概况统计:总曝光量,投放商品数等的基本数据,展示已有数据的各项记录整体规模;加入平均点击率的指标图,显示点击率的表现情况;加入不同资源位的广告数饼图,表明不同广告位承载广告数量的差异。

图片

    1. 时间维度的广告投放效果变化趋势:通过堆积柱状图和折线图组合,可视化曝光量、点击量、点击率这三个指标分别随着不同日期和不同时段的变化趋势。数据中clk列0表示未点击,1表示点击,曝光量为clk列记录个数,点击量为clk列数值求和,点击率为点击量/点击率,并用百分比保留三位小数表示。曝光量和点击量通过堆积柱状图形式展现,点击率为折线,并设置平均点击率警戒线,更清晰展现不同日期、时段的点击率变化。
      1. 日期:由网络资料可知,2017年5月初淘宝活动如下,其中,5月8日-11日为服装品类大促,服装相对其他品类需要更多时间和精力浏览、对比、挑选,商家投放广告数量也相对较多(用户曝光量有一定提高),而11日已为活动末期,消费者活跃度相对预热期和活动前期有所降低,点击率下降。

图片

图片

      1. 时段:北京时间比世界标准时间(UTC)早8小时,需要在原有小时数据基础上+8。在0时到6时,大部分人进入睡眠状态,不再浏览电商平台,曝光量、点击量下降,进入白天后,曝光量和点击量均出现大幅提升,并且19点开始,提升幅度更高,于21点达到峰值,通常19时后用户结束工作和学习,得到更多时间浏览电商平台。夜间3时-4时点击率较高,深夜人类大脑边缘系统活动增强,意志力相对薄弱,更容易产生点击行为。而在白天的点击率峰值出现在中午13时,通常为午间休息时段,用户状态较为松弛,与夜晚相似。

图片

    1. 广告商品价格分析
      1. 商品价格分布:通过散点图,将商品价格和对应商品个数联系起来,获得商品价格分布情况。其中商品大多集中在下方,即价格相对较低,价格越高,商品个数越少。

图片

      1. 用户属性与商品价格关系分析:同样利用散点图,从性别、年龄、就业状态、城市级别四个维度观测,可以通过图例选中某个群体,进行单独观测。
        • 整体来看,男性浏览的广告商品平均价格相对较高,可能因为女性承担更多家庭日常购物任务,且普遍购物深度更高,感兴趣的商品价格更低。由于已工作群体可支配收入更高,相应感兴趣的商品价格较高。对于不同年龄段人群,中青年群体关注的商品价格更高,而少年、老年人相对较低。从城市级别来看,城市越繁华,广告展示的商品价格越高,这与实际可支配收入也都是息息相关的。

图片

      1. 消费档次、购物深度与商品价格关系分析:利用折线图 ,对于不同消费档次、购物深度的用户,从其感兴趣的商品平均价格和价格标准差分别分析。
        • 可以看出深度购物者关注的商品价格变动范围较大,兴趣较广,且由于深度购物者购买商品更多,其关注商品的均值也较高。除此,随着消费档次的提高,商品平均价格也同步提高,与普遍认知一致。

图片

      1. 品牌、品类、广告计划价格分布:分别计算按这三个维度汇总的商品平均价格,并对价格区间分类,用饼图表示,其中,大部分商品平均价格在500元以下。

图片图片

图片

    1. 广告投放效果分析
      1. 资源位投放效果:广告集中在两个资源位上, 其中,430539_1007展示广告数占比为44.65%,尽管点击率较高,然而其曝光量占比却只有41.34%,点击量占比为43.06%,虽然该资源位从曝光到点击的转化率较高,但位置可能相对另一个资源位较差,曝光量稍低。广告主可以对该资源位广告形式或内容进行深入分析,了解其高点击率的内在逻辑,并充分理解应用到后续广告投放中。电商平台则可以考虑调整UI界面布局,调整资源位入口位置,提高效益。

图片

      1. 品牌、品类、广告计划投放效果分析:针对品牌/品类/广告计划的曝光量、点击量、点击率的分组区间钻取表。分别按照曝光量、点击量区间分类,展示点击率,并对该部分品牌/品类/广告计划占总品牌/品类/广告计划数的比例进行说明,并通过联动设置可以得到选定曝光量区间的所有品牌/品类/广告计划商品的点击情况,并按点击量降序排列,获得点击量排名靠前的品牌/品类/广告计划id。
        • 可以看出,大部分广告仅能获得500以下的曝光量,且点击率低于平均值4.784%。针对曝光量和点击量较高的品牌/品类/广告计划,可以拆解分析其营销方案和广告模式,并给予效果较差的品牌/品类/广告计划一些报告、建议,取长补短,不断改进以增加整体效益。

图片

图片

图片

        • 钻取示意如图,按点击量降序排列:

图片

图片

图片

      1. 点击客户类型广告投放效果分析:通过堆积柱状图和面积图组合,根据前述RFM分析,对产生点击行为的不同类型客户进一步分析广告投放效果,同时加入仪表盘标明各类型客户(产生点击行为)在总客户人数中占比。
        • 可以看出,产生点击行为的客户中,平均点击率为20%左右,该部分用户在整体用户中虽然占比非常少,但可以给广告主和电商平台带来更多收益,应针对不同客户类型进行细致的分析,采取不同的策略,以提高高价值用户的数量与占比,增强广告效益。

图片

  1. 最终效果

图片

 

三、 参赛总结

尽管队长和成员两个人都没有系统地学习过BI数据分析或者在相关领域工作过,但是通过学校或网络教程的学习都对BI有了一个初步的了解和实践,并产生了浓厚的兴趣。

在制作的过程中也发现了许多问题,尤其是在做的过程中发现选取数据集本身存在的很多局限性,也是因为经验不足,在选择数据的时候就没有考虑到很多潜在的问题,重新找合适的数据集也为时已晚。例如,最开始想做曝光-点击-转化的漏斗分析,再仔细观察数据关联和内容后发现难以实现。但最终还是尝试着发挥这个数据集的最大效果,引入了一些模型完善了我们的作品,比如将通常用于分析购物行为的RFM分析移植到广告点击的场景中,对产生点击行为的用户进一步分类、分析。

很感谢帆软提供的工具、资料支持和比赛机会,通过这一次独立从零开始实践数据分析项目的经历,团队成员受益匪浅,对数据分析的流程和可能存在的问题有了更实际的体会和理解,在未来遇到数据分析需求时,会以更全面的视角去思考和应对。

发表于 2022-5-9 17:14:13
案例打卡:本队伍基础很好,但是感觉色调选的颜色很多,用了rfm模型,数据有了深度,然后分析结果也明确了。总体数据报告是ok的,但是感觉图表的选用和整体布局还可以美化一些,比如去掉网格线,谢谢分享
参与人数 +1 F币 +1 理由
帆软苏茜 + 1 有效打卡奖励

查看全部评分

发表于 2022-5-12 20:22:34
案例打卡:整体的颜色搭配不错,就是感觉有点紧凑,可以考虑TAB组件,释放空间
参与人数 +1 F币 +1 理由
帆软苏茜 + 1 有效打卡奖励

查看全部评分

发表于 2022-5-29 22:46:23
案例打卡:在制作仪表盘的过程中发现数据存在的问题非常正常,因为毕竟不是企业专门数据库,想要什么数据取一下就好了。作者目前分析的非常不错了,两个角度的RFM非常有启发性。感觉在整体布局、组件适应性方面,以及图例设置还有进一步美化的空间
参与人数 +1 F币 +6 理由
帆软苏茜 + 6 有效打卡奖励

查看全部评分

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

3回帖数 1关注人数 9994浏览人数
最后回复于:2022-5-29 22:46

返回顶部 返回列表