请上传宽度大于 1200px,高度大于 164px 的封面图片
    调整图片尺寸与位置
    滚轮可以放大缩小图片尺寸,按住图片拖动可调整位置,多余的会自动被裁剪掉
取消
sternenzelt(uid:1113969)
职业资格认证:尚未取得认证
【2022BI数据分析大赛】电商平台广告投放效果分析
制作:Mildred,Eve 软件支持:FineBI 5.1.1 电商平台广告投放效果分析 电商平台广告投放效果分析 一、 选手简介 1、 选手介绍 团队名称:电商广告分析组 团队组成: 队长:Mildred,帆软社区用户id:1113969,管理科学与工程研究生。 成员:Eve,帆软社区用户id:1136136,信息管理留学生。   2、 参赛初衷 半路出家,尽管团队两人有过很多数据分析基础知识的学习,但从未独立接触和实现完整的BI数据分析项目,正值人生的分岔路口,需要完善自己的能力,从理论中走出来,从零到一独立实践项目,增强对BI软件的应用熟练度,提高自己实操能力,锻炼数据分析能力和逻辑思考能力,培养对数据分析业务的理解和创新能力。   二、 数据分析 1、 数据来源 自选数据:阿里云天池公开数据集“Ad Display/Click Data on Taobao.com”(https://tianchi.aliyun.com/dataset/dataDetail?dataId=56),原始数据集包含4个数据表: ● 广告展示/点击日志表raw_sample ● 广告基本信息表ad_feature ● 用户基本信息表user_profile ● 用户行为日志表behavior_log 由于数据都是脱敏后的数据,不存在直接的商业价值。同时因为一些标准并不明确,部分数据并不能很好地进行解读和利用,同时维度也并不完整,纵使有上述的许多局限性,这个数据集仍有一些BI分析的价值,故选择了此数据集。   2、 业务背景/需求痛点 电商平台为提高商品销量并获取收益,通常利用广告推送投放的形式,提高用户对商品的认知度,增强用户购买意愿。但在实际投放过程中,很难对效果进行评估。点击率是了解广告绩效的有效方式。通过将广告点击率与广告baseline点击率进行对比,可以量化广告绩效。 从广告主的角度来说,点击率可用于比较不同广告渠道或形式的绩效。通过比较比如横幅广告和视频广告的点击率,帮助确定广告效果,深入了解广告市场实时变化趋势,并据此决定应对哪些主要的广告渠道或形式绩效进一步投资,加强对未来广告投放的布局。 在广告投放的过程中,如何将广告更精准投放给更具价值的用户,或针对反馈不足的用户推出一系列业务方案,对电商平台来说至关重要。通过将广告效果与平台内其他行为相结合,以确认高点击率与用户价值的增加之间的联系和相关性,提高广告主对不同广告渠道或形式的应用效果和适用性的认知,调整广告投资布局。 在浏览广告的用户中,产生点击行为的用户表现出更强烈的购买意愿,对这部分用户的类型和特征进行分析并设计对应策略,对广告效益的提升具有重要作用。 因此,需要对平台收集到的广告数据和用户数据进行分析,使用BI可以更合理地整合数据,再通过可视化的方式更清晰地展示出数据,便于针对不同类型用户或维度提出合适的业务策略。   3、 分析思路 在团队分析的流程中,首先需要寻找合适的数据集,并独立提出需求和分析方法,其中需要同时考虑业务需要和数据集记录的局限性。团队分析思路如下: 目的:分析电商平台广告投放效果,根据分析结果提出管理建议。 主要思路如下:https://shimo.im/mindmaps/dPkpKvex4LSo0vqO 用户画像:根据用户自身属性进行分析,并结合其行为特征对用户整体特征画像。对产生点击行为的用户进行单独分析,利用RFM客户价值分析,提取并针对不同类型用户实施相应的投放策略。 广告分析:分析广告投放后的曝光量、点击量和点击率在不同时间单位内的变化趋势,考虑广告商品价值投放群体的特征及资源位等影响因素,调整投放策略,提高投放效率。分析不同品牌、不同品类、不同广告计划商品的价格,了解其实际广告投放效果。 整合实际需要分析的模块:   4、 数据处理 a) 数据加工及清洗 数据集选取:本次分析主要针对广告投放效果,主表为raw_sample,而behavior_log表中用户购物相关行为日期与raw_sample表广告相关行为日期差异较大,无法结合购物和广告相关的行为进行分析,且behavior_log表中未涉及广告相关字段,无法获取更多有价值的信息。因此,选取raw_sample/ad_feature/user_profile表进行最终分析。 字段名修改:user_profile表中“new_user_class_level ”字段名较长且存在格式错误(末尾有空格),修改为“city_level”。raw_sample表中“time_stamp”字段名修改为“date”。 缺失值处理:user_profile表中pvalue_level(消费档次)和city_level(城市层级)2个字段存在部分缺失,ad_feature表中brand(品牌id)字段存在部分缺失,删除存在缺失值的数据记录。 去重处理:raw_sample表中,noclk字段中,1表示未点击,0表示点击,clk字段中,1表示点击,0表示未点击,字段意义重复,删去noclk列数据。 时间戳转换:raw_sample表中利用时间戳存储时间类型,为便于分析,转换为date类型格式"%Y-%m-%d %H:%M:%S"。 字段筛选:原数据集中user_profile表中cms_group_id、cms_segid的意义与作用均不明,删去。筛选raw_sample表中“20170506”-“20170513”期间的数据进一步分析。 b) 整理数据表间关联 c) 建立自助数据集 导入FineBI,建立宽表如下: ad_union表:主表为raw_sample表,通过adgroup_id字段(广告id)左连接ad_feature表,获取广告特征信息,通过user字段(用户id)左连接user_profile表,获取用户特征信息,以分析广告投放效果。 新增列:品牌平均价格(按brand汇总组内price平均值)、品牌曝光量(按brand汇总组内clk记录个数)、品牌点击量(按brand汇总组内clk求和); 目的:按品牌获取其平均价格,便于分析价格分布。获取曝光量、点击量等数据,为后续分析广告投放效果做准备; 同理分别新增品类、广告计划的平均价格、曝光量、点击量数据。 rfm_union表:首先利用raw_sample表左连接user_profile表,通过广告点击行为进行RFM客户价值分析,得到ad_rfm表,并通过user字段(用户id)内连接ad_union表,获取最终分析的产生点击行为的用户记录。 ad_rfm表: 过滤clk=1的记录; 按user字段分组汇总得到最近一次点击时间(R)、点击频次(F)、点击商品平均价格(M); 新增列,获取最近一次点击时间距最后一天(即20170513,假设为今天)的天数; 新增列,获取所有用户最后一次点击平均距今天数、平均点击频次,点击商品平均价格; 新增列,利用if条件语句,对每个用户,当其R、F、M指标大于所有用户对应平均指标时,为1,否则为0 新增列,根据三个指标评价,对用户分类,获得最终客户类型。   5、 可视化报告 报告总体 整体风格:为使数据更清晰准确,采用灰白布局,凸显数据本身内容。 日期筛选:添加日期过滤组件,筛选获取精准到天的数据用以对比。(由于原始数据集记录限制,仅包含20170506-20170513共8天的数据) 联动设置:由于分析基于两张宽表,为更清晰展示不同类别维度的数据,针对关联性较强组件,利用相关字段实现组件联动。 用户画像 主要分为属性分布、行为特征分布、广告点击RFM分析三部分。 属性分布:使用ad_union的数据,包含性别分布,年龄分布,就业状况分布和城市分布,对具有相同值的用户进行分组,通过饼图展现不同分组用户的实际占比。 性别分布:女性占比约为64%,表明平台用户中女性用户占比相对较高。 年龄分布:年龄段2/3/4/5的用户占比较高,总共约占95%,由于原始数据集中未说明各年龄段具体对应年龄,仅能推测可能为20岁至60岁的中青年用户群体。 就业状态分布:大部分电商平台用户为已工作人群(约93%),该部分人群具有较高的可支配收入,且学生群体在整个社会年龄层面划分占比也相对较低。 城市分布:二线城市使用电商平台购物的用户占比最高(约45%),可能因为二线城市常住人口相对可支配收入较高,且可支配上网时间相对较多。 行为特征分布:针对消费档次和购物深度两个影响因素,将用户利用性别和年龄段分类,并加入城市级别筛选,得到不同性别、年龄段人群在不同层级的城市的消费档次/购物深度的占比分布。 消费档次:女性消费档次主要集中在中低档,其中年龄段4/5占据较高比例,男性更多为中档,且其中关键消费人群为年龄段5。由于一线城市用户使用电商平台比例较低,除一线城市外,高档消费者随着城市级别的降低而减少。 购物深度:收集数据大多为深度用户,相对其他用户,深度用户对广告投放的敏感度更高,花费更多时间浏览电商平台。女性群体年龄段相对男性更年轻。 广告点击RFM分析:通过三个关键指标对客户点击广告行为进行观察,针对不同客户类型,对比每个客户三项指标与所有客户的平均水平,获得指标评价值,并据此分类,并对不同类型客户实行相应的不同投放策略。 指标: 最近一次点击时间(R):客户距离最近一次点击广告时间的间隔,考察客户点击的沉默期 最近点击频次(F):客户在限定的时间内所点击广告的次数,考察客户的忠诚度 最近点击商品价格(M):客户在限定的时间内单次平均点击的广告商品价格,考察客户的意向消费能力 客户类型 最近一次点击距今天数(R)评价 点击次数(F)评价 点击商品平均价格(M)评价 策略方向 挽留客户 一般 0 0 0 采取挽留措施 重要 0 0 1 保持客户 一般 0 1 0 重点保持,提高用户活跃度 重要 0 1 1 发展客户 一般 1 0 0 重点发展,培养用户粘性 重要 1 0 1 价值客户 一般 1 1 0 提供更高质量和使用体验 重要 1 1 1 分析: 类型分析:利用表格和条形图展示不同类型客户的指标值和人数、占比,大部分产生点击行为的用户点击商品价格低于平均值,占约85%,其中价值客户数量最少,而发展客户相对最多,可能是因为收集到的统计用户大多数为深度用户,产生点击行为的概率较高。 广告投放效果分析 主要分为概况统计、时间维度的广告投放效果变化趋势、广告商品价格分析、广告投放效果分析四部分。 概况统计:总曝光量,投放商品数等的基本数据,展示已有数据的各项记录整体规模;加入平均点击率的指标图,显示点击率的表现情况;加入不同资源位的广告数饼图,表明不同广告位承载广告数量的差异。 时间维度的广告投放效果变化趋势:通过堆积柱状图和折线图组合,可视化曝光量、点击量、点击率这三个指标分别随着不同日期和不同时段的变化趋势。数据中clk列0表示未点击,1表示点击,曝光量为clk列记录个数,点击量为clk列数值求和,点击率为点击量/点击率,并用百分比保留三位小数表示。曝光量和点击量通过堆积柱状图形式展现,点击率为折线,并设置平均点击率警戒线,更清晰展现不同日期、时段的点击率变化。 日期:由网络资料可知,2017年5月初淘宝活动如下,其中,5月8日-11日为服装品类大促,服装相对其他品类需要更多时间和精力浏览、对比、挑选,商家投放广告数量也相对较多(用户曝光量有一定提高),而11日已为活动末期,消费者活跃度相对预热期和活动前期有所降低,点击率下降。 时段:北京时间比世界标准时间(UTC)早8小时,需要在原有小时数据基础上+8。在0时到6时,大部分人进入睡眠状态,不再浏览电商平台,曝光量、点击量下降,进入白天后,曝光量和点击量均出现大幅提升,并且19点开始,提升幅度更高,于21点达到峰值,通常19时后用户结束工作和学习,得到更多时间浏览电商平台。夜间3时-4时点击率较高,深夜人类大脑边缘系统活动增强,意志力相对薄弱,更容易产生点击行为。而在白天的点击率峰值出现在中午13时,通常为午间休息时段,用户状态较为松弛,与夜晚相似。 广告商品价格分析 商品价格分布:通过散点图,将商品价格和对应商品个数联系起来,获得商品价格分布情况。其中商品大多集中在下方,即价格相对较低,价格越高,商品个数越少。 用户属性与商品价格关系分析:同样利用散点图,从性别、年龄、就业状态、城市级别四个维度观测,可以通过图例选中某个群体,进行单独观测。 整体来看,男性浏览的广告商品平均价格相对较高,可能因为女性承担更多家庭日常购物任务,且普遍购物深度更高,感兴趣的商品价格更低。由于已工作群体可支配收入更高,相应感兴趣的商品价格较高。对于不同年龄段人群,中青年群体关注的商品价格更高,而少年、老年人相对较低。从城市级别来看,城市越繁华,广告展示的商品价格越高,这与实际可支配收入也都是息息相关的。 消费档次、购物深度与商品价格关系分析:利用折线图 ,对于不同消费档次、购物深度的用户,从其感兴趣的商品平均价格和价格标准差分别分析。 可以看出深度购物者关注的商品价格变动范围较大,兴趣较广,且由于深度购物者购买商品更多,其关注商品的均值也较高。除此,随着消费档次的提高,商品平均价格也同步提高,与普遍认知一致。 品牌、品类、广告计划价格分布:分别计算按这三个维度汇总的商品平均价格,并对价格区间分类,用饼图表示,其中,大部分商品平均价格在500元以下。 广告投放效果分析 资源位投放效果:广告集中在两个资源位上, 其中,430539_1007展示广告数占比为44.65%,尽管点击率较高,然而其曝光量占比却只有41.34%,点击量占比为43.06%,虽然该资源位从曝光到点击的转化率较高,但位置可能相对另一个资源位较差,曝光量稍低。广告主可以对该资源位广告形式或内容进行深入分析,了解其高点击率的内在逻辑,并充分理解应用到后续广告投放中。电商平台则可以考虑调整UI界面布局,调整资源位入口位置,提高效益。 品牌、品类、广告计划投放效果分析:针对品牌/品类/广告计划的曝光量、点击量、点击率的分组区间钻取表。分别按照曝光量、点击量区间分类,展示点击率,并对该部分品牌/品类/广告计划占总品牌/品类/广告计划数的比例进行说明,并通过联动设置可以得到选定曝光量区间的所有品牌/品类/广告计划商品的点击情况,并按点击量降序排列,获得点击量排名靠前的品牌/品类/广告计划id。 可以看出,大部分广告仅能获得500以下的曝光量,且点击率低于平均值4.784%。针对曝光量和点击量较高的品牌/品类/广告计划,可以拆解分析其营销方案和广告模式,并给予效果较差的品牌/品类/广告计划一些报告、建议,取长补短,不断改进以增加整体效益。 钻取示意如图,按点击量降序排列: 点击客户类型广告投放效果分析:通过堆积柱状图和面积图组合,根据前述RFM分析,对产生点击行为的不同类型客户进一步分析广告投放效果,同时加入仪表盘标明各类型客户(产生点击行为)在总客户人数中占比。 可以看出,产生点击行为的客户中,平均点击率为20%左右,该部分用户在整体用户中虽然占比非常少,但可以给广告主和电商平台带来更多收益,应针对不同客户类型进行细致的分析,采取不同的策略,以提高高价值用户的数量与占比,增强广告效益。 最终效果   三、 参赛总结 尽管队长和成员两个人都没有系统地学习过BI数据分析或者在相关领域工作过,但是通过学校或网络教程的学习都对BI有了一个初步的了解和实践,并产生了浓厚的兴趣。 在制作的过程中也发现了许多问题,尤其是在做的过程中发现选取数据集本身存在的很多局限性,也是因为经验不足,在选择数据的时候就没有考虑到很多潜在的问题,重新找合适的数据集也为时已晚。例如,最开始想做曝光-点击-转化的漏斗分析,再仔细观察数据关联和内容后发现难以实现。但最终还是尝试着发挥这个数据集的最大效果,引入了一些模型完善了我们的作品,比如将通常用于分析购物行为的RFM分析移植到广告点击的场景中,对产生点击行为的用户进一步分类、分析。 很感谢帆软提供的工具、资料支持和比赛机会,通过这一次独立从零开始实践数据分析项目的经历,团队成员受益匪浅,对数据分析的流程和可能存在的问题有了更实际的体会和理解,在未来遇到数据分析需求时,会以更全面的视角去思考和应对。
个人成就
内容被浏览19,053
加入社区2年294天
返回顶部