请上传宽度大于 1200px,高度大于 164px 的封面图片
    调整图片尺寸与位置
    滚轮可以放大缩小图片尺寸,按住图片拖动可调整位置,多余的会自动被裁剪掉
取消
奋斗的小青年(uid:680497)
你好,我叫戈理秀 职业资格认证:FCA-FineBI | FCA-业务分析理论
【2022BI数据分析大赛】3A公司春季新品广告投入产出分析
一、选手简介 1、选手介绍 团队名称:菜鸟向前冲队 团队介绍:不同行业的数据从业人员,有数据挖掘工程师、数据分析、信息安全分析师、数据专员等不同的岗位,聚集在一起共同完成作品 团队组成:因对数据可视化的兴趣和零售行业的工作背景而相识、相知,并组成了一个团队,共同学习、共同做项目、共同成长   2、参赛初衷 工作中我们大多是螺丝钉的角色,承担整个项目的一个模块,参赛可以让我们跳出工作的局限性,参与项目的整个流程,提升个人分析思维和可视化工具的操作技能。希望和更多的大神交流学习,一起合作来完成一份好的作品,对自身能力的检验,以项目去验证能力的短板,从而去有针对性的提升。想给自己的经历增加一些亮点,也想得到行业里的专业人员的指点,汲取他人所长。   二、作品介绍 1、业务背景/需求痛点 背景:3A公司新品广告投放前期针对市场调研小组提供的几个渠道进行新品投放,项目负责人要根据投放至今近20天的广告数据进行一轮回顾,根据当前数据的实际情况重点解决以下几个问题: a.各渠道的广告花费和目标达成情况,该渠道是否合适追加广告预算投入; b.各渠道的实际转化情况,哪些渠道可以继续投放,哪些渠道应该终止广告投放; c.各渠道产生的新用户数及产品的客单价情况; d.各品类的流量转化情况,找出当前能打爆的重点品类/商品进行打爆;   2、数据来源 数据清洗确实是整个过程中较为耗时耗力的地方,本次比赛中,我们主要使用python对广告投放的数据进行清洗工作,来来回回搞了好几次。最终数据清洗后抽象出3张表(广告行为数据、广告投放数据、用户成交数据)并写入到csv文件中。在整个数据清洗过程中,我们主要做了下如下操作: a.数据脱敏:将真实个人数据信息做脱敏操作,方法比较简单,编码类数值使用星号隐去关键内容,汉字部分随机组合做替换 b.异常数据剔除:在这次清洗中主要表现为关键字段为空,比如:商品编号及名称存在空值的、广告点击量大于浏览量的,时间日期超过本次活动的等; c.数据修正:在这个过程中,当然也存在一些数据虽然异常,但不影响最终使用的,如果成交量为空的,这些会被修改成0,类别内容有错别字; d.脏数据清洗:在数据处理过程中,比较常见的就是一些特数据字符,或者一些无效内容数据,对这类数据主要是通过正则表达式做数据过滤。 在数据清洗过程中,主要感受就是需要对数据有全面的了解,在第一次数据清洗操作后,由于了解还是不够充分,有些数据内容错别字问题没有修正全,导致最后报表呈现的数据不达预期,后面逐渐修复掉,报表数据效果呈现的还算符合预期。   3、分析思路 针对5个投放渠道按以下关键指标分析各渠道的广告花费和目标达成情况,判断该渠道是否合适追加广告预算投入;分析各渠道的实际转化情况,分析哪些渠道可以继续投放,哪些渠道应该终止广告投放;分析各渠道产生的新用户数及产品的客单价情况,判断哪些渠道投放带来了较高的流量;分析各品类的流量转化情况,找出当前能打爆的重点品类/商品进行打爆;   4、数据处理 1)根据ad_act明细表取出投放渠道,类别,sku等明细数据作为产品信息表; 2)基于ad_data与产品信息表进行关联获得各广告明细表数据; 3)为进一步检验各渠道的产品转化数据,搭建渠道漏斗模型;具体实现方式如下: a.基于广告明细数据,计算出广告-浏览量,广告-曝光量,广告-点击量,广告-加购量,广告-支付量五个自助数据集的数据; b.将5个自助数据集上下合并成一个自助数据集   5、可视化报告 1)制作面板组件【各渠道流量数据转化】 从图形上可以看出: a.微信朋友圈、抖音整体的转化率都偏低;其中抖音的浏览量和曝光量体量较大,但是转化的数据都较小,可针对视觉图片、视频、文案描述重点进行下研究,考虑是否可有针对性的进行调整; b.腾讯和百度的整体转化数据较为客观,可重点关注是否进行相关产品广告预算的追加; c.小红书的支付率居首位,但是整体的浏览量和曝光量并不是特别明显,可针对渠道和商品进行重点分析; 2)根据广告日明细表可搭建广告各渠道销售趋势,可以看出整体的趋势,其中除微信以外的渠道的销售体量占比较大,微信朋友圈几乎没有产出太大的贡献值; 3)根据广告预算、广告花费、销售额、目标等指标基于子弹图,搭建广告花费进度和目标完成情况;从子弹图上可以看出抖音、百度、腾讯整体得广告花费都接近100%,指标得达成情况达到55%以上;小红书的广告花费接近预算的75%,指标达成度达66.23%;重点需要关注微信朋友圈,花费近一半的预算,但整体的目标达成率仅有2.84%。 4)根据整体的支付率和产出比搭建四象限图,可看出各渠道在四象限图上的位置其中微信朋友圈位于第三象限,需重点关注;另下钻页面可看出各广告活动对应的四象限位置,根据散点分布情况可看出各活动的整体分布趋势; 5)利用tab键搭建各产品的产出比和支付率情况,其中绿色表示产出比(支付率)高于整体平均值,可根据实际的情况调整广告的投入情况; 6)基于用户维度表,可看出各渠道获取用户数的情况,从数据上可以看出整体的客单价查不多,但是用户数差异就比较明显,腾讯高达95万的新客户数,而微信朋友圈仅有2.5万; 7)根据产品的品类和产出比可看出品类在此次广告推广中整体产出比差异不大,其中半身裙的产出比最大(370.66),可考虑适当的降低相应的折扣,提高整体的产出比 8)根据广告流量数据,可看出各品类的曝光率、点击率、加购率、支付率的一个整体情况;适时调整各品类的活动情况,可优先针对支付率较高的商品加大广告投放量,同时适当减少优惠绿都,提升利润; 9)最终结果呈现的页面布局 作品公共链接:https://bisolutions.fanruan.com/webroot/decision/link/vGvb 针对以上分析可以得出以下结论: a.整体的广告的产出比仅有335.25,未达到预期产出比500;主要原因为前期广告投入,整体产生的效率不是特别大,同时整体前期的优惠力度较大;相关较为稳定的广告活动,建议降低优惠力度,适当减少广告投入,整体提升产出比; b.微信朋友圈这个渠道的广告活动,除部分产出比较高的商品可少量投入意外,其他商品建议直接取消这个渠道的广告投放; c.上衣、休闲裤、半身裙这三个品类在这次的整体支付率和产出比都较为不错,可针对此三类下的商品元素、面料、风格进行商品分析,在下阶段的商品开发中提取爆款元素、风格、面料等; d.腾讯虽拓展了95万的新用户,产出比仅有380.59,广告花费高达47万,目标达成率仅有69.44%;而小红书广告花费近30万,产出比高达449.22,目标达成率66.23%;可加大小红书的投放,腾讯建议适量投放,同时提高客单价;   三、参赛总结 关于此次比赛中,由于报名时间比较晚,整体报表实现比较仓促,但仍有以下几点问题可提供建议: 图表大小的调整建议可以增加以数值大小调整表格大小的方式 行转列功能和列转行功能,很多时候做漏斗分析不太方便,建议这一块可以加入更人性化的设计 Tab组件的样式不太好看,tab组件可不可以多点样式的呈现形式,比如可以调整大小,tab组件标题可以加入图片 文本框字体格式没法调整上下,有时候会偏移
【2021夏季挑战赛】XX零售企业年度分析报告
一、选手简介 1、选手介绍 团队名称:菜鸟向前冲队 队长介绍:网名奋斗的小青年,目前就职于莱绅通灵,我司是珠宝行业的零售公司;目前从事数据分析岗位,个人感兴趣的领域是数据可视化,数据像一门语言,构图像一门艺术,以艺术去展现语言的美,让读者以欣赏美的心境去获取你想传达的数据信息。   成员介绍: 成员1:网名老刘,现就职某互联网公司,从事数据分析多年,对数据挖掘,数据可视化,数据产品这几块颇有兴趣。 成员2:网名Andrew,一直在制造业做质量管理工作,     业余时间学习python,SQL,热爱数据分析,喜欢用数据分析问题 成员3:网名Ivan,目前就职于一家茶业零售公司,从事数据分析岗位,希望通过本次大赛提升自己。 成员4:网名云中鹤,就职于北京某科技公司,我司是科技研发行业的公司,目前从事编程、ETL与项目实施岗位,个人感兴趣的领域是数据分析与可视化。 团队组成:因对数据可视化的兴趣和零售行业的工作背景而相识、相知,并组成了一个团队,共同学习、共同做项目、共同成长  145923 2、参赛初衷 工作中我们大多是螺丝钉的角色,承担整个项目的一个模块,参赛可以让我们跳出工作的局限性,参与项目的整个流程,提升个人分析思维和可视化工具的操作技能。希望和更多的大神交流学习,一起合作来完成一份好的作品,对自身能力的检验,以项目去验证能力的短板,从而去有针对性的提升。想给自己的经历增加一些亮点,也想得到行业里的专业人员的指点,汲取他人所长。 二、作品介绍 1、业务背景/需求痛点 1)业务背景:经历了十几年的信息化高度发展,企业积攒了大量的宝贵数据。如今,中国零售业所面临的最大挑战就是顾客和市场需求复杂多变,比起人的经验主义来做决策,只有实时的数据分析和反馈才能适应更快的变化。零售的本质离不开人、货、场这三个核心,并围绕这三个核心提升运营的效率,也就是线上线下的成功融合,对数据进行收集、整理、分析,最终实现数据驱动业务决策的目的。 2)需求痛点:某零售企业往年未意识到数据分析的重要性,经常以人的经验主义来做决策,导致目标制定不合理、策略不符合业务实际场景。现在领导希望数据分析师可以给出一份完整的年度分析报告,为领导决策提供数据支撑,以便于更科学合理的制定年度目标和策略。 2、数据来源 自选数据:https://www.heywhale.com/mw/dataset/60d9e1df94c44a0017dc5f4e/file      3、分析思路 经过团队的内部讨论,基于现有的数据进行思维导图搭建,针对各个分析模块点确认对应的可视化图表;整份报告分为整体复盘、用户分析、产品分析、门店分析、总结及建议5个模块。每个模块的分析思路如下: 1)针对企业2020年的整体情况进行复盘,先从整体的营收、利润去了解20年的业绩,再结合地域去看业务覆盖范围,结合用户生命周期看当前用户的健康状态,通过周度销售、利润趋势分析全年的旺季、淡季,最后列示用户、品牌、供应商、门店top榜,后期向优质用户、品牌等给予更多资源倾斜。 2)用户分析,对用户的性别,年龄进行分析,精准了解客户群体和消费能力。对新客户及客户流失分析,了解客户拉新状况,对公司的后续发展前景做深度评估。 3)产品分析,对产品维度进行分析,对各品牌销售情况和不同产品类别销售利润的分析,了解平台畅销品牌、畅销产品等,结合不同的门店对比优化产品线。对产品关联度分析,优化平台促销,捆绑销售方式。 4)门店分析,针对各门店的产品销售情况进行分析,确认各个门店各个产品的经营状况;建立RFM模型,确认各门店的用户价值分类,根据门店的客户分类情况,做好精准营销; 5)就以上结论和现象进行相关改善建议 整体分析思维导图如下所示: 145924 4、数据处理 数据内容:基础数据表主要为以下9张,其中生命周期表通过Excel PQ/PP对客户表和订单表处理联合处理得来,主要是对每个员工的首单和末单时间计算,购买次数,购买总金额计算。 表名 中文名 主要内容 类型 电商分析数据2_Store   门店表 门店信息 基础表 电商分析数据2_region_info 地区表 地区编码信息 基础表 电商分析数据2_product_supplier_info 供应商表 产品供应商信息 基础表 电商分析数据2_product_brand_info 品牌表 产品品牌信息 基础表 电商分析数据2_product_info 产品表 产品信息表 基础表 电商分析数据2_pay_method 支付方式表 客户支付方式信息表 基础表 电商分析数据2_order   订单表 订单信息 基础表 电商分析数据2_date   日期 日期信息 基础表 电商分析数据2_customer_inf 客户表 客户信息 基础表 主要用到自助数据集宽表为:订单核心各维度聚合宽表,RFM模型表 整理过程: 第一步:获取:登录和鲸社区,下载数据集 第二步:清洗,为保证数据的准确性,通过EXCEL配合相应函数完成,对数据进行简单去重、异常数据等清洗,这边不做过多叙述。 第三步:导入传入到帆软BI,并为了方便操作,将每张EXCEL表单独创建一张宽表,作为维度表。(方便单表添加字段或维护),为后续制作大宽表打下数据基础。 第四步:主要宽表制作 1) 订单核心各维度聚合宽表 a.以电商分析数据2_order为核心表,链接各维度表,创建订单核心各维度聚合宽表。 b.选取订单核心表,通过左右合并依次和各维度表进行合并。 145925 c.新增列计算利润金额 145926 d.新增列对年龄段进行分组 145927 e.订单核心各维度聚合宽表创建完毕 2) RFM模型表 a.首先复制订单核心各维度聚合宽表 145928 b.新增列客户总体消费金额平均值 145929 c.分组汇总得出客户总体消费金额、消费频次、最晚消费时间 145930 d.新增列最近一次消费距离时间 145931 同理新增列可得客户总体消费频次平均值、客户总体最近一次消费距离时间平均值。 a.利用if函数判断可得消费金额向量化、消费频次向量化、最近消费距离时间向量化 145932 b.利用CONCATENATE建立RFM 145933 c.分组汇总,并对RFM进行定义 145934 至此相关数据处理完毕,数据整理告一段落。 5、可视化报告 1)整体框架:依据逻辑思维导图进行整体框架搭建,按背景、复盘分析、用户分析、产品分析、门店分析、总结及建议几个模块进行搭建; 2)图表选择:图表选择可以看这张图,了解下每种图偏向的分析内容。 145935 3)分析思路和对应结论 ①整体复盘分析:企业关键指标展示,通过周销售趋势图及环比,还有各省金额分布分析了解平台销售走势和销售分布,企业当前用户的生命状态,了解平台销售状态整体了解及门店、产品品牌、客户、供应商的销售状况。 145936 结论: a.发现2020年的销售金额和利润金额整体比较平稳,但在45(11月)周之后连续四周,有一个突然上升的过程,趋向平稳。之后趋向正常。 b.了解销售额最多在广东,销售额占24.59%,其次为江苏(11.45%)和重庆(10.48%)。 c.对客户生命状态进行分析,平台老客户占绝大多数,占71.24%,说明客户的忠诚度较高,新客户6.95%,说明客户拉新不足,需要进行改善。 ②用户分析:通过对客户性别,年龄结构以及帕累托分析品类销售情况,了解客户的群体划分,有利于了解平台产品的消费人群,更好的精准销售,对新客户流入随时间进行分析,了解平台拉新状况。 145937 结论: a.发现客户64%为男性,70%客户群体在25-30之间,25-30岁的男性为平台主要消费客户,对以后的拉新目标提供依据。 b.客户支付方式70%以上为支付宝,信用卡和微信。 c.通过对客户年龄矩阵分析,发现25-30岁为主要消费贡献,但其客单价位列最末,仅为11423,有很大的提升空间。而35岁以上只有44人,但利润率最高,说明其消费潜力巨大,可能需要为这类人群提供更适合的产品。 d.新客户增长趋势图,能看出优惠促销活动能很好的促进拉新,销售,对销售额的提升有重大影响,以后需要研究讨论定期开展此类活动。 ③产品分析:对产品按品牌,不同种类进行分析,以得到销售额,利润额最好的产品。结合不同门店不同产品的热力图,可知畅销款有哪些。通过产品关联分析,有利于相关产品做捆绑销售,采取更有效的营销手段。 145938 其中【产品类别一销售情况】通过跳转,可定该类别底下,各门店,各用户,各品类的销售情况,可实际了解产品在其他维度的销售情况; 145939 下面是品牌热心图和产品关联支持度图: 145940 145941 结论: a.从品牌来看,骆驼牌销量最好,但利润率最低;Jack Wolfskin利润率最高,但销量居中;17个品牌中11个品牌的利润率超过12.68%;   b.按产品一级分类看,女士的销售额占比48.9%,而利润率仅有11.61%;户外产品利润率达18.12%,但其销售金额占比仅有19.2%;   c.按产品二级分类看,女士上装、男士上装、女士下装销售居前三;但女士上装和男士上装的利润率均不超过10%;利润率最高的为男士下装和户外装备,达到18.39%;   d.按产品三级分类看,毛衣、风衣、夹克、外套、雪纺衫五类为企业的主要销售产品,但五类商品的利润率均低于10%,可适时减少五类商品的优惠力度;   e.按品牌在各门店的销售热力图看,骆驼、Lee、李宁三个品牌为各门店的主要热销品牌;   f.按产品品关联分析来看,购买风衣的用户加购休闲裤的概率达86.93%;购买衬衫的用户加购休闲裤的概率达85.06%;企业可对产品与产品之间关联度高的做套装进行捆绑销售。   ④门店分析:对平台不同门店的销售额、客户数量、客单价,利润额分析,找出绩效最好的店铺;通过表格与图形之间的联动关系,可了解各门店、产品等维度在各个月份的实际销售情况,定位具体问题。 门店销售情况设置了下钻功能,从一个门店可以下钻到产品类别一、从产品类别一可以下钻到产品类别二、从产品类别二可以下钻到产品类别三,并设置了与门店月份销售数据表的联动,详细的可以看视频介绍的演示。 145942   针对门店用户,建立RFM模型,通过筛选框可具体定位各个门店的用户分类情况、门店用户金额和客单,具体客户的用户分类,流失可能及门店各月份新用户变化情况,针对用户的具体类型进行精准营销。 145943 结论: a.平台门店年度销售额大于1500万有永旺店、岁宝店、天虹店、崇光店,其中永旺店销售额达2042.87万元,客户数2187人,位居榜首。 b.从折扣力度上看,平均折扣在75%~76%之间,但门店折扣几乎相同的情况下,用户数量销售额有很大差异,以麦德龙店和海雅店位居末席,仅为500人,需要做出改善。 c.从利润率来看,各门店利润率差异不大,平均在9000到9600之间,最高的为茂业店。 d.从客单价来看,各门店差异不大,平均在平均在9000到9600之间,而重要价值客户也凭借着自己的高客单,高销量为销售额提供了主要贡献。 最高为沃尔玛。 e.针对各门店的用户分类、用户消费情况、门店每月新客户变化情况,可采购有针对性的销售政策,提升用户留存率、拉新率等。 ⑤总结和建议: a.企业整个年度的销售情况呈稳定增长趋势,其中11月份达到本年度最高销售额,但因促销力度的增加,整体的利润率也仅有9.84%; b.11月份虽然达到了本年度最高销售额,但是整体的增加新用户数仅有346人,用户增加的效果并不明显;11月份销售额主要的销售收入仍来自于老用户;可结合双十一的复盘报告综合分析,为何新用户数增加的数量没有质的飞跃;c.企业的销售群体主要针对的是40岁以下的用户群体,尤其是25岁左右的年轻群体,可结合当下流行的时尚趋势,增加一些潮牌产品;d.男性用户企业占64.65%,但是男装带来的销售额仅占31.91%,可针对当下男装产品进行定位性分析,优化整体男装产品的架构;e.户外用品为企业的主要盈利点,且其年度平均折扣力度仅有85.36%,但其带来的利润率有18.12%;户外产品数占产品总数37.19%,销售用户男女比例约为2:1,9456人产生了2299.95万元的销售额;f.各门店可根据客户的采购分类和采购行为采购有策略的销售,例如针对新用户可推送相关优惠券信息,针对高价值用户可推送新产品信息等。   3)最终结果呈现的页面布局 145944 作品视频:Your browser does not support video tags. 三、参赛总结 1、FineBI工具 1)仪表盘不同用户不同电脑打开,整体布局就会错乱 2)悬浮功能与组件能否绑定,可以不用调整组件位置,悬浮功能也得调整 3)提供绘制的图形偏少,较为复杂图形无法实现 2、参赛总结 在这次比赛中,我们为了共同完成一份报告而聚在一起,每个人对数据分析都有自己的见解。从最初的的分析主题确定,到用哪份数据,先定数据还是先定主题都有过较深层的讨论,每个人在完成作品的过程中都积极的参与、配合。也因为两个人对一个分析思路意见不一有过面红耳赤的激烈讨论,但每个人都是为了做出一份更好的报告。我们的文档最后一天匆匆忙忙写的,格式、内容都没有整理好,有点遗憾。    
个人成就
内容被浏览28,505
加入社区3年276天
返回顶部