一、选手简介
1、选手介绍
(1)团队选手版
- 团队名称:1010
- 队长介绍:Shan,刚从国外回来,原本在S&P50的公司担任供应链数据分析师的工作,个人对供应链方便的数据分析很感兴趣。
- 成员介绍:饕餮,在互联网金融行业从事数据分析工作多年,是个文静可爱的妹子
- 成员介绍:加特,之前在体系内工作后来通过自学转行到数据分析,是个爱享受美食的帅哥。
2、参赛初衷
疫情被困在家中,想着不如就此机会学习,通过其他的数分的公众号了解帆软的比赛,又通过微信群集结了这一群来自天南地北的小伙伴。大家都各自在不同的行业里面做出数据分析的工作,有在互联网金融行业的,也有在传统行业的,也有刚从国外回来的小伙伴。大家一拍即合都对这个比赛非常感兴趣,想着能够利用自己的业余时间多学习和了解咱们国产的可视化分析工具。既能够认识新的小伙伴,也能够学习新的分析工具,精进自己的分析技能,最后还能获得相应的奖励就更好啦!虽然大家原本都不认识,但是在短短的几周之内能够从0开始一起完成一个作品,真的是非常不容易呢。
二、作品介绍
1、业务背景/需求痛点
简述业务背景:某国的互联网电商于2016年底开始上线,2017年开始客户量激增,于2018年网站进入平稳阶段,之前为了占领市场,公司不惜物流成本,但如今公司进入平稳阶段需要控制成本,所以需要做分析来确定物流战略。
2、数据来源
数据源说明:用的是企业数据,该司是某国的网络电商
- 数据已经做过脱敏处理
- 为方便大家理解,已经将客户以及卖家的地址转换成国内地址
- 由于原本的数据集太大,所以截取了部分数据进行分析。
3、分析思路
- 我们拿到数据之后先做了一些初步的分析,对数据结构,字段有了了解之后决定选取物流这个方向为主分析方向,然后从时效性(履约率),成本以及和客户评价三个方向进行分析,每一个分析方向我们又讨论和采取了不同的维度进行进一步的分析。
探索分析
|
|
图表
|
|
|
|
1 总趋势
|
1.1 总订单量
|
KPI
|
|
1.2 订单平均时效 vs promised
|
|
|
1.3 准时送达率 over time
|
|
|
|
|
2 成本
|
2.1 物流成本 vs sales
|
气泡图
|
|
2.2 物流成本 vs 准时送达率
|
|
|
2.3 配送距离
|
flow 地图
|
|
2.4 商品的dimension
|
|
|
|
|
3 客户评价
|
3.1 准时送达率和客户评价关系
|
|
|
3.2 客户评价 over time
|
|
|
3.3 客户评价和销售关系
|
|
|
3.4 review
|
词云
|
4、数据处理
- 数据的加工以及清洗
原本的数据集是很庞大的,基于本次比赛的目的我们团队特意挑选了部分的数据来进行分析。其次原本的数据集当中含有异常数据以及空值和零值,我们团队也采取了相应的方法来对这些数据进行了处理,异常数据占比低于5%所以不会影响后续分析的结果。
数据脱敏
将顾客以及卖家的邮编号码进行了脱敏处理
- 整理以及建立表与表之间的管理
- 建立自助数据集
将整理过后的关系以及Excel文档导入到FineBI当中并且建立好数据集
表说明
表名
|
表内容
|
表类型
|
olist_customers
|
客户信息
|
维度表
|
olist_order_items_dataset
|
订单金额
|
事实表
|
olist_order_payments_dataset
|
付款
|
事实表
|
olist_order_reviews_dataset
|
客户评价
|
事实表
|
olist_orders_dataset
|
订单时效
|
事实表
|
olist_products_dataset
|
商品信息
|
维度表
|
olist_sellers_dataset
|
卖家信息
|
维度表
|
product_category_name_trans
|
中英文转换
|
维度表
|
巴西-中国转换
|
地理位置转换
|
维度表
|
表结构
自助数据集建立
添加所需的字段,比如是否准时达到,承诺交付时间和实际交付时间
5、可视化报告
(1)数据含义表达和图表排版布局:
- 报告的第一页采用总分总的方式来展示,在一般的仪表板当中第一页都是放一些最重要的指标以及分析结论,我们采取的也是这个方式,将该电商的重要指标放在仪表板的左侧,右上方放的是筛选器,用来控制整个仪表板的数据显示。 中间放的是我们最关心的物流成本和销售金额的占比趋势图。最后对第一页的发现设置了总结
- 报告的第二页我们是对物流成本,销售金额,客户评价进行了进一步的分析,选取的就是最直接易懂的四象限布局,采取定制化图标来显示关系,并且在左下角放置这一页的分析结论
- 报告的最后一页我们探讨的是未履约订单的详细分析,依旧采取四象限的布局,分别采用了地图,气泡图,以及条形图来进一步展示和分析未履约率的情况。
- 总体色调我们选择了深色以及深色的背景图,颜色以黑色,蓝色以及绿色为主。并且对每个表格都添加了配色一致的表格边框。
(2)通过分析得出的结论
- 通过分析我们得出以下一些结论,顾客对于该电商的满意度蛮高的满分5分,顾客给到4分
- 其次顾客评分和履约率成正相关关系,而物流成本和履约率也成正相关关系。
- 通过分析未履约率产品分布发现,床,浴室,电脑等产品未履约率较高,推测和产品的运输难易程度相关。
- 建议是:针对不同的产品我们可以用不同的物流方式以及物流承运商来降低物流成本。
(3)最终结果呈现的页面布局
https://bisolutions.fanruan.com/webroot/decision/link/huxK
三、参赛总结
1、FineBI工具
在使用帆软BI做可视化报告等方面,我们总结了以下几点感受和想法:
- 帆软作为我们国产的可视化工具结合了市面上其他产品的一些优点,比如容易上手和学习,我们大家都是利用自己的业余时间参加了几次培训之后就能迅速地上手使用了。
- 其次在自建数据集方面也是非常容易操作,有好几种数据链接以及数据来源方式,无论是直接链接公司数据亦或是上传自己的数据集都是非常简单好操作。
- 通过FVD网站我们下载以及用了不少边框来美化我们的仪表板
- 帮助文档不仅提供了很多的分析方法而且也对于图表选择等提供了很多的帮助。
2、参赛总结
- 我们一零一零团队是在机缘巧合之下成立的,大家虽然都是在数据分析工作的,但是都是不同行业,并且之前并不认识。是通过这一次参加比赛认识的,大家利用了自己的业余时间通过网上的会议选题,确定分析主题,找数据,讨论以及确定分析方向,然后大家各自认领了任务回去,通过一次又一次的讨论以及辛苦劳作才最后完成了这个作品。虽然他不完美,但是却是大家这一个月以来努力的成果,不仅仅是增加了自己的技能,认识了新的朋友并且还拓宽了自己的眼界,很开心我们也有了自己的国产分析工具,也很荣幸能参加帆软这次的比赛。
|