请上传宽度大于 1200px,高度大于 164px 的封面图片
    调整图片尺寸与位置
    滚轮可以放大缩小图片尺寸,按住图片拖动可调整位置,多余的会自动被裁剪掉
取消
蔡办事员(uid:203460)
HALLO 职业资格认证:FCA-FineBI
FINE BI ,FINE REPOPT ,CPDA 同时上了这3个培训后,终于知道数据分析这条路要怎么走
1.学习初衷 (1)个人背景: 141948 帆软社区用户名: 蔡办事员 职业简介: 在国外菲律宾佳达集团担任信息部主管,主持了多个系统的实施和运维(进销存,OA,HR),用BI产品构建了企业里多个不同业态的报表体系。 因为疫情原因和在数据分析这条路上遇到瓶颈,20年10月份回国,决定从系统实施转向数据分析~~ (2)获奖后得到培训机会 非常幸运的参加了【2020帆软BI可视化冬季挑战赛】并获得了【最接业务应用奖】,奠定了楼主可以成为数据分析师的信心,决定往这条路走下去。 更重要的是,比赛奖励的助学基金和CPDA的数据分析认证培训,让楼主得到了进入数据分析的钥匙。 【2020冬季挑战赛】某药企销售年报 141954141949 楼主很给力的同时报了3个课程: CPDA,帆软BI线上学习班,帆软报表线上学习班。哈哈哈,非常的充实。不过也正因为上了这3个课程,让楼主前往数据分析的这条道路豁然开朗,真正的知道了、了成为一个数据分析师所必须掌握的知识框架,下面会和大家分享下.. 这里附上楼主临时学习的办公桌~要有一个不错的办公桌才能更好的学习!! 141952 2.数据分析师所要掌握的东西 2.1分析思维(重中之重) 重中之重一定是分析思维,楼主自认为逻辑和发散思维都还不错,但是所有数据分析的方法真的是盲打莽撞,当然经常也有取得不错的效果,但是不管在时间花费和提升能力上都有一定的问题。 楼主也有自己总结出一套数据分析的流程,但始终局限于楼主所遇到过的案例,一遇到新的就不行,容错率太低了。 FINE BI的课程有培训数据分析的思维,CPDA更是将这个作为重中之重,两者其实差不多,楼主也相对综合了一下,出了一套比较适合目前自己用的。 现在楼主每次分析都规范自己要用这个模板进行分析,考虑的全面性更强了,习惯了这个分析思维,速度也能越变越快(相信大家也经历过,一边分析做图表,图标做了删,删了做,不知道自己到底要干嘛,经常导致时间不够用。) 楼主自己分析流程: 拿到的数据进行表自身一致性和不同表间一致性的检查-----进行数据清洗----分析表间隐藏的信息---总体数据分析----明细维度分析 FINE BI的分析流程: 141951 CPDA的分析流程: 141953 楼主自己目前在用的分析模板: 文档:分析数据的模板(7步法) 141955 明确目标和以此为基础进行分析是重点!!目标定下来就只朝着这个目标前进,等这这些做完后,还有时间再发散思维去补充协议新的想法。可分析的太多了,不明确目标的话时间永远不够用,每次都是要开会前还在赶着做,楼主经常经历。 2.2分析方法,分析模型 描述性分析方法,预测性分析方法,规范性分析方法 我们实际业务一般也就用到描述性的分析方法,也就是描述总结过往的一个数据,然后依照自己的经验来预测未来的发展,以此来制定策略。这一块在大部分的实际业务中就非常够用了。 FINE BI主要教学的也就是这一块: 数理统计的一般方法,漏斗模型,RFM模型,ABC分析法,购物篮分析 这些都有教学到,但是不得不说重点在教怎么用,而没有把原理讲述的很清楚。比如 RFM模型,购物篮分析 如果能了解一定的原理,才不会产生用了后无法解释或没信心解释的尴尬局面。 如果是普通的业务分析,FINE BI所教学的其实够用了,当然,要用这些分析方法多分析些案例,不然都是纸上谈兵。 CPDA更会重点的讲述预测性的分析,这块原来楼主有去打 KAGGLE和和鲸的比赛,就一脸懵逼,因为楼主妄图用描述性分析和自己自认为的预测去完成,自然是落花流水,想要努力,连学习的方向都不知道。如果大家有兴趣这一块,报个CPDA真的可以,让你知道从何学习。 2.3工具 工具够用就可以了 EXCEL:这个肯定是会的,而且要精通。 一个BI产品:FINE BI最好的地方就在于在国内的教学很多,里面穿插了很多数据分析的思维和方法,上手也容易,国内大多公司用的也是它,所有推荐。但是在数据处理上会差一些些,需要精通EXCEL来互补。 SQL: 这目前也是必备了,至少取数要会,现在大大小小的公司都上系统了,有数据库。不然公司有数据,你却有的用不了,非常尴尬 SPSS,PYTON: 预测性分析肯定要用到,但是在学之前楼主认为先学会预测分析的方法吧,之前楼主为了打KAGGLE比赛,就硬学PYTHON, 决策树什么的一通乱用,但是根本不知道为什么要用,根本没有意义。 3.成果: 这里分享我的一个帖子,看看我学后数据分析的能力明显提升~ 20冬赛获奖后,短短1个月的培训,分析能力翻天覆地,通过分析一个案例来说明(有视频) 编辑于 2021-2-7 02:21 编辑于 2021-2-7 02:24 编辑于 2021-2-7 02:25
20冬赛获奖后,短短1个月的培训,分析能力翻天覆地,通过分析一个案例来说明(有视频)
楼主有把分析的详细讲解做成视频,大家可以看一下哦: 百度视频链接: https://pan.baidu.com/s/1OssbM_e_0OUON6VvgObkwQ 提取码:z53k 优酷的视频链接好一些:优酷链接. 楼主的分析逻辑还可以,在【2020帆软BI可视化冬季挑战赛】获得了【最接业务应用奖】,得到了3个培训:"CPDA数据分析师认证","帆软BI线上学习班","帆软报表线上学习班",经过这些班短短1个多月的培训后,数据分析能力真的上了一层楼,特别是数据分析的思维方面,这就跟大家分享下楼主最新的分析案例。 之前获奖的链接:【2020冬季挑战赛】某药企销售年报 逻辑思维还可以,但跟现在有定的差距,大家有兴趣可以先去看一下,和现在楼主的最新分析做一个对比~ 141920 这次展示的案例是"帆软BI线上学习班"作业8的一个作业,因为楼主刚好脑抽筋做得有点太认真了,也这才有机会刚好可以跟大家分享下。 分析思维(重中之重)----分析方法/分析模型-----工具. 这次楼主要分享的是分析思维,也是分析中最重要的,这边要强调“数据分析的基本工作流程” 下图是楼主在CPDA和FINE BI课程 学到的 分析流程的一个模板,楼主目前就一直采用这个模板进行分析. 有道文档:分析数据的模板(7步法) 141921 零.题目介绍 141922 141923 这道题的素材非常简单,就一个简单的表,字段只有9个,老师的参考答案也非常简单(下图),就是一个那么简单的素材,楼主在没有加素材的情况下分析出挺多的东西~这能显示楼主学到的东西真的好~(实际情况一定要再找些素材,实际分析中只局限于手上的素材是很傻的行为) 141924 一.洞察业务背景 背景:无 目标:得出2015全球年度福布斯排行榜中的富豪数据分布情况 二.制定分析计划 需要哪些数据: 2015福布斯富豪数据 (作业提供,不局限于作业的话,其实要多去拿几年的福布斯富豪的数据,但是楼主就只用这个分析,才能显示最近这1个多月的进步~) 维度:国家,行业,排名,来源,姓名,性别,(资产额段),年龄段指标:人数,资产额,(年龄) 采用逻辑树法对目标进行不断拆解,这个过程特别重要,是达到目标的核心!!!!! (逻辑树图链接:2015福布斯富豪分布逻辑树) 141925 三.数据拆分建模 141926 一开始也就为了方便,添加了个列:因为资产额作为指标太常用了,直接把个位数的资产转化为“亿”的单位,省的后面一直需要设置数字格式。 其他添加的列也都是在分析过程中才发现需要的了,也没几个,不是很重要。 四.执行分析计划依据所制定的目标逻辑树进行一步一步的分析 141927 141928 0.资产额和富豪人数的分布情况 0.1富豪人数:1826,没有其他年份的数据,无法对比,要分析需要拿更多数据 0.2平均资产额:38.68,没有其他年份的数据,无法对比,要分析需要拿更多数据 0.3集中程度:可以观察到,富豪人数主要集中在10-20(亿美元)的净资产,占比上榜总人数的45%,与平均资产额38.68(亿美元),有较大的偏差。 0.4离散程度:平均值+-1个标准差之外的数值认为离散较为大,38.68+59.06=97.74,差不多是100亿美元,我们刚好可以将100亿定为划分超级富豪的标准,单独做分析 (在这一步后,我的逻辑树又继续展开,几乎是无法一开始就一次性把全部想清楚的,因为接触的信息有限,在制作过程中会不断的增加。) 141929 0.4离散值-超级富豪 0.4.1超级富豪以6.79%的人数占有了36%的财富,超级富豪的平均资产是205亿美元,是普通富豪平均资产26.54亿美元的7.7倍,在富豪中也是有贫富差距的 0.4.2超级富豪的人数突出国家:美国 。其他国家相比难以对比。 0.4.3超级富豪的人数突出行业:时尚与零售,投资,技术,能源,食品饮料等,比较百花齐放 0.4.4超级富豪在年龄上会比普通富豪偏高龄化一些 141930 0.4.5超级富豪在性别上和普通富豪相比没有太大的特征 141931 141932 1.富豪的国家分布 墨西哥:在平均资产上离群,分析发现是墨西哥有一名排名第二的富豪,771亿美元的资产拉高了墨西哥的富豪平均资产。 美国和中国:中美主要在人数上离群,中国的富豪人数和美国还是有一定差距,为此进行分析 141933 1.1墨西哥平均资产分析 因为墨西哥总富豪人数只有16人,所以可以直接在用姓名直接拿来对比,发现是由与排名第二的富豪在墨西哥,拉高了他们国家的平均净资产 141934 1.2中美富豪人数分析 1.2.1 年龄对比:中国在40-50这个年龄段远超美国,但是在60-90这个高年龄段远低于美国,这推测是中国市场起步较为晚,1978年改革开放至今才42年,所以未来中国很可能超过美国。 1.2.2 性别对比:中国在男性为美国的60%,但女性只为25%。这可能也是中国女性独立的意识起步较晚 1.2.3 行业对比:中国在美国大放异彩的 投资,食品饮料 这两个上非常匮乏 141935 1.3中美富豪平均资产分析 1.3.1分布上:中国富豪资产的人数一半以上集中在10-20亿,占比远超美国,但是在20-50亿这个资产区间人比占比落后于美国,导致中国的平均资产落后于美国 1.3.2 行业分析(去掉多元化):美国在技术,时尚与零售,媒体,投资 这几个行业的平均资产很高,而中国在制造,保健上的平均资产很低。(高于人数平均线才不算个例) 141936 1.3.3年龄上:中国在所有年龄段的平均个人资产都低于美国,80-90年龄段中,中国异常高于美国,查看明细后发现是有4个中国香港的富豪高资产拉高了这个年龄的水平,他们从事的行业主要以房地产为准。这也说明中国内地的富豪因改革开放才42年,普遍起步都比较晚,而不是这个年龄段的人不行。 141937 141938 2.行业分析2.1时尚与零售,技术,投资 这三个行业是出富豪多且平均资产高的行业,电信平均资产最高,但是出富豪的人数并不多 2.2行业在年龄上:技术行业平均年龄会偏低一些, 2.3行业在性别上,时尚与零售的女性占比比较高,而电信行业女性占比为0 141939 141940 3.富豪的年龄分析(去除了几个未知年龄) 3.1随着年龄的增长,平均资产呈现上升的状态,可以推测财富很大程度上是随着时间不断的积累的 3.2富豪人数在年龄上的呈现“正态分布”, 主要集中在60-70岁年龄段,已经属于中高年龄了 141941 3.3 从事行业分析: 技术,投资,房地产,制造,保健,游戏 这几个行业年轻富豪和老富豪分布差异较大。 年轻富豪在技术和游戏这种新型科技行业明显高于老富豪,特别是技术行业,差了13.1%。老富豪在投资,房地产,制造,保洁这些需要原始积累和传统行业明显高于年轻富豪。 3.4 食品饮料和时尚与零售这两个行业在年轻和老富豪中都是中坚力量,占比较高并且没有明显差距 141942 141943 4.富豪的性别分析----富豪主要还是男性,占比达到91%,但女性富豪的平均资产额有略高于男性富豪。由于女性富豪过少,分析下去具有很多偶然性,所以不进一步分析。 5.富豪来源-----来源这个字段比较乱,不进行分析 五.提炼业务洞察 上面的分析都松散的,这里其实主要就是总结一下,楼主这边偷懒啦,懒得总结 六.产出商业决策 上面的总结就是为了提出一些建设性的东西,但是针对这一题就比较尴尬了,比如我们发现 年轻富豪出现在科技行业,而老牌的房地产等不是年轻人的天下, 我们也不能让国家去重视,我们自己也不可能为此去从事技术行业。 所以上面的分析其实就是结果。 七.验证决策效果 哈哈,没办法验证啦。 其实也是有,比如楼主预测 中国只是因为改革开放时间还不长,导致富豪人数和美国差异比较大,特别是年龄大的,未来中国年龄大的人数一定为增加。 现在是2021年了,其实可以拿202年的福布斯数据来验证~但是楼主时间不够,找资料挺麻烦的,可能还要用爬虫 141944 还是去找福布斯了,结果榜单上没年龄~~ 不好找呀。 这种查找类型的方法不知道大家有没有推荐的方法,楼主这个能力就比较弱了,不知道有什么网站还是怎么搜索效率会比较高,希望大家可以分享下141945 楼主有把分析的详细讲解做成视频,大家可以看一下哦: 优酷的视频链接好一些:优酷链接. 然后楼主的最近的学经历有兴趣的话,大家可以看一下这篇哈, 讲述楼主最近的学习和总结成为一个数据师的总结: FINE BI ,FINE REPOPT ,CPDA 同时上了这3个培训后,终于知道数据分析这条路要怎么走https://v.youku.com/v_show/id_XNTA5OTUwODMwMA==.html 编辑于 2021-2-7 10:21 编辑于 2021-2-7 10:22 编辑于 2021-2-7 10:39 编辑于 2021-2-7 10:40 编辑于 2021-2-7 13:53 编辑于 2021-2-9 10:03
数据分析后怎么制定落地方案+一些报表展示的好方法(都有具体案例)
楼主参加了【2020冬季挑战赛】分析了官方数据 https://bbs.fanruan.com/forum.php?mod=viewthread&tid=134033&page=1&extra=#pid71966 140840 和热心网友讨论到到制定落定方案的问题,让楼主有所感悟,所以想跟大家分享下楼主所认为的,我们作为数据分析师应该怎样给出落地方案,希望能给大家一些思路,也希望大家多多指导,让我的想法和体系更为成熟。 140841 C:\Users\caihu\AppData\Local\YNote\data\weixinobU7VjvnqtZ_dUL1LU1siKQVZi_g\5788d7d0002f4009be3bed349e642330\clipboard.png 还有遇到一些咨询的问题,所以楼主想分享下一些个人的报表展示的技巧 140842 一.落地方案 1.关于落地方案 楼主所认为的落地方案,就是能去真正执行的,不能含糊,要非常具有明确性;贴合企业实际状况,在企业目前所处的现状下是可行的。 2.在信息不够的时候给出落地方案 我们大家作为数据分析的工作者,如果是分析自己所在的企业,一般对所在企业的情况都比较了解。或者是作为乙方,在深入调研甲方项目后,也能将情况掌握到一定高度。 这时候结合数据和自身经验去分析,自然能给出落地方案。 但是难免要在不够了解信息下要做出一些方案,比如乙方的售前工作,这时的客户还不是签约客户,没办法花费那么多资源去调研,但是又要去抓住客户的心,需要给一些好的落地方案来彰显我方的水平。或者是比赛,比如这次的比赛,官方数据自然没办法给我们那么多的额外信息。 这时候我们该怎么办?楼主认为有这3种办法: 方法1.给出模糊的方案(比较不推荐) 方法2.自己去猜测将信息补充上,然后给出落地方案(比较推荐,但非常关键的情况下不建议用) 方法3.根据每一种情况的可能性,给出每一种情况的落地方案(很累,哈哈哈) 3.实际案例C:\Users\caihu\AppData\Local\YNote\data\weixinobU7VjvnqtZ_dUL1LU1siKQVZi_g\d7f986d73c4649cea779210ea46669d1\clipboard.png 140843 3.1在【2020冬季挑战赛】2.5退货情况,楼主数据有分析到: 子公司2 有比较严重的退货问题 在产品感冒药1上,子公司2退货率高达2.62%,而子公司1销售量更大的情况下,退货率只有0.06%. 在产品胃药1上,子公司2退货率高达0.26%,而子公司1销售量更大的情况下,退货率只有0.06%. 3.2其实这时候难给出落地方案,因为缺少很多关键信息,想到的如下 3.2.1关于退货 退货是否是产品质量问题才产生的退货,还是客户就是想退就退,无关品质问题? 退货率2.62%对药品公司意味着什么?是否是严重问题?政府对药品质量是否有要求?客户在采购协议上是否有要求且会罚款等? 3.2.2成本问题 140844 在产品感冒药1上,子公司2成本4.88,而子公司1成本4.64 在产品胃药1上,子公司2成本5.78,而子公司1成本5.78 子公司2的单位生产成本并没有比子公司1单位生产成本低。(这个是我来不及分析的) 该公司的单位生产成本是否真的考虑了所有的费用(管理费用,租金等等)? 子公司2有没有因为地方特色有特别的补贴? 3.2.3工厂现状问题 子公司1是否是已经达到生产极限? 子公司2是否是新建厂房,投入运作时间短? 子公司2相对于子公司1的规模如何,是否已经超过负荷在生产? 3.3.给出落地建议 方法1.给出模糊的方案 子公司2 确认有比较严重的退货问题,应继续深入调查情况,看是否有品质问题或者其他,想办法降低退货率。 方法2.自己去猜测将信息补充上,然后给出落地方案 (自己猜测部分: 退货是产品品质问题;药品关乎生死,药品因品质为退货率2.62%属于严重问题;子公司2在所有的成本上没有任何的优势;子公司1还没达到生产极限;子公司2非新建厂房,生产也没负载) 子公司2有严重品控问题,该情况会导致公司品牌严重受损,建议子公司2暂时减少生产,定单先转移到其他子公司进行生产,同时派遣子公司1的相关人员去协助子公司2去整顿生产品质,在子公司2的退货率达标后再慢慢恢复正常生产。恢复正常生产后,也要每月去跟踪退货率。同时将退货率作为子公司的关键指标,严抓。 方法3.根据每一种情况的可能性,给出每一种情况的落地方案(很累,哈哈哈) 如果1:退货不是品质问题,是客户可以随意退货,那要对客户的退货有一定的约束,不能太过分。 如果2:退货是品质问题,退货率2.62%是小问题,子公司1已达到生产极限,子公司2规模比较小,超负荷生产, 那属于负载过头,导致生产品质下降。 需要扩大子公司2的规模。 如果3,如果4................. 4.总结 方法1.给出模糊的落地方案。 显得非常淡薄,只是给出了重要的数据分析结果。 当然,新手的话主要就是在做这一步。 方法2.自己去猜测将信息补充上,然后给出落地方案。很推荐,但是真的需要丰富的经验和一定的敏感度,平时喜欢猜的人会更擅长一些 方法3.根据每一种情况的可能性,给出每一种情况的落地方案。真的太累了,这些只能是思考过程,不该全部给出,这样看得人会很不耐烦,认为没有重点。 二.报表展示技巧 报表展示我认为很重要的两点就是“能看得多”和“看得懂”(直观),而表的性质就是能“看得多”,图的性质就是能“直观”。什么情况用什么类型的表或图是非常重要的,这样才能最好的去展示我们的数据分析成果。 1.展示最多的数据+非常直观=交叉表+金额字段放数据条+同比字段用颜色 如果在遇到要分析的某个维度里面的内容“太多”,而且需要的指标也不少,怎么办? 比如需要展示维度“类别”的19年销售金额,20年销售金额,20年销售同比,和当前库存这4个指标 如果用表会如下图,数据是都有了,但是没用重点,看不懂 140845 如果用图,如下图,直观是有了,但是因为“维度”的内容太多导致太长,数值都显示不出来,而“指标”有4个导致很混乱。 140846 这时就要强推交叉表+金额字段放数据条+同比字段用颜色,如下图,可以看到所有数据,而且非常直观,可以一眼看到类别“04,32,36”非常红,同比下降最多。一眼看出类别“31,34”20年贡献了很高的销售。 140847 楼主有时候当然会搭配图使用,如下图 140848 这种报表真的是楼主的偏爱,也是我所接触的业务部门非常喜欢的。 所以很推荐大家使用这种交叉表或明细表+金额字段放数据条+同比字段用颜色,表是能放最多数据的样式,但是不直观,我们在字段里面放数据条和颜色就能保证直观性。 FINE BI有这个功能(如下图),数据条都是正值 最小=0 最大=max 颜色统一 比较舒服, 有正负值 最小=MIN 最大=MAX 负红正蓝 舒服;百分比用指标-颜色,不一定增蓝负红,因为有可能下降是好事,比如新冠新增同比,建议好事蓝坏事红 比较舒服 140849 总结:当我们要分析的维度的内容“太多时”和指标太多时,比如我上面的类别维度里面足足有24个,这就不适合条形统计图这些了,图不是越多越好的,很多情况会不适用! 2.条形统计图+折线统计图的视觉效果很好 比如我们要同时展示“每个月”的“销售同比增长金额”和“销售同比增长率”, 这2个是很不同的指标,比如下图2月份虽然销售同比增长金额”下降了最多的187,143.96,但是“销售同比增长率”下降却不是最高的,3月份同比下降最高。 140850 上图这个样式让你看得懂,但是会让你看得很难受,因为“增长金额”是条形,“增长率”也是条形。我们不妨变化一下,将“增长率”变成折线。如下图,是不是顺眼很多 140851 (1)可以一眼看出“增长金额”的多少(条形图的重要作用),2月份下降得太多了,1月份上升很多 (2)可以看到“增长率”的变化 (折线的重要作用就是这个),形成一个微笑曲线哈哈,3月触底反弹 总结下:一般情况下金额用条形,率用折线。因为金额一般就是看大小,而率会更看变化。 楼主好久没用BI产品了,目前刚好参加比赛就想到这些,未来还会多多分享的~~ C:\Users\caihu\AppData\Local\YNote\data\weixinobU7VjvnqtZ_dUL1LU1siKQVZi_g\5788d7d0002f4009be3bed349e642330\clipboard.png
【数据追梦人2020】疫情让我放弃在菲律宾的3年系统实施的经验,重新开始......
我是帆软社区用户caihuanglun,三流的大学,用BI抓住很多次机会后,从业3年成为了菲律宾零售行业某公司的信息部经理,疫情让我决定放弃这一切,遵循我内心想成为一个真正的数据分析师想法,目前刚刚回国,这就来跟大家分享要去抓住哪些机会140836 9月30日,历经困难重重才成功回国~140776一.大学--嘉庚大学我17年毕业于嘉庚学院(可以称为“厦门大学嘉庚学院”,但是自知关系其实不大哈哈哈),二本的大学(老三本,福建取消了三本后,我们学校荣升成二本~~)。专业是工商管理,这个专业我来总结的话,就是关于公司经营的事情都略沾一点:人力,财务,金融,企业战略,ERP,调研.....还是挺有用的,因为在我后来工作中,上手各类不同的系统时,比如进销存系统,财务系统,人力系统等都能快速入门,因为脑中在大学已经建立起了基本体系。下图是毕业照,带着我的两个小狗子参加的,衣服领子歪了也没人说~140777不过我所学的工商管理确实都是略学皮毛,比如大学ERP一门课,一个学期只学了怎么用一个生产ERP(现在看来几天就能会,这个系统很简单)。楼主是经常逃课的哈哈,但是在小组作业上还是都主动担组长来完成作业的,主要是为了不挂科,最后都得拼一把。下图就是一学期一个小组的ERP课程成果,就是把系统用起来,简单到可怕.....但是也为自己后面一系列的机会打下了基础。140837二.第一份工作--厦门链家--信息员1.工作的内容毕业后第一份工作在厦门链家当AE,其实就是业务信息员,主要是教经纪人怎么使用链家产品,说白了也就是教学链家内部系统。也会帮助大区总监进行区域数据分析,听起来比较高大上,但当时因为没实际业务经验,拿到数据一顿分析后,给出一通建议,很不贴地,所以后来就一直告诉自己做事贴地,贴地...),分析完数据后,我帮大区总监制作每周汇报给总部的PPT(其实就是大区好看的数据怎样展示更好看,很惨的数据怎样展示比较有尊严)。下图就是帮大区总监做汇报给总部的PPT1408382.数据工作内容和第一次接触BI产品在链家工作8个月,EXCLE处理数据的能力还是学了很多的,我们的数据工作都是在链家系统里下载原数据,然后EXCLE用VLOOKUP,数据透视,排序等来进行分析。那时比较有印象的就是我们厦门分公司自己用起了BI产品,这是我第一次接触到BI产品,有趣的是因为这个BI实在太贵了,全公司用一个账号。当时也是因为每月的数据都要导出原数据用EXCEL每月做一次,浪费大量人力。这种情况BI就非常好用了,数据部做好后BI的报表后,我们直接截图就能用了,那时候真的惊为天人。下图是没BI前,下载原始数据,VLOOKUP整合,排版等处理140780下图是有BI产品后,就是咔咔咔的截图140781我也慢慢发现excel只是职场必备技能,不是什么很厉害的核心技能,有了BI产品,我们在链家的这些AE们工作内容有了巨大变动,数据处理和数据分析的工作也少了,都是信息部集中在BI里处理给我们,我离数据分析越来越远,重心就变成教产品,赋能,做PPT...这些我比较不喜欢的工作。既然不喜欢,要不试试其他的?但是自己可以做什么呢?一时迷茫不知所措。但是年轻嘛,总多试试! 三.选择去菲律宾学真东西,学用BI证明自己1.下定决心去菲律宾做企业信息化那会正好亲戚有个机会,去菲律宾的公司负责企业数字化和信息化。去了发现企业不小(1500人,13家大型百货门店,1个MALL,快递,建筑等),亲戚非常重视信息化,正准备改革,大搞信息化(那时候的理解的信息化就是要上很多系统),所以很缺年轻人,我也觉得是能从头做起一家公司的信息化是个很好锻炼的机会,就去了。下图18年3月刚到菲律宾在车里拍的海岸线140782 2.公司当时现状和没人培训很迷茫公司最核心的就是百货商超,规模都不小,3000-5000平,当时有12家,除了食品,大部分东西都卖(五金,衣服,厨具,电器等),全部自营,就是类似中国90年代的大卖场吧。下图是其中一家门店的收银台照片140783正准备进入公司好好像前辈大佬学习的时候,却发现整个公司的高层就10个华人,文化水平都是初中及以下,比较会EXCEL都算人才,信息化更是只有一个很简单的进销存ERP。当然业务都干得很好,但是对于信息化是真的都不懂,虽然我在来之前就做好了心理准备,但是真的是真没想到真的全得靠自己学信息化的东西,一度陷入了迷茫,不知道要从何如入手。 3.给进销存ERP上BI大大提升实力,也终于证明了自己能力我也明白信息化是个很大的领域,一下子肯定学不完,就先挑重点,抓住重点开始干!公司跟信息化有关的也就这个NELSOFT系统。下图这个系统NELSOFT,华人在菲律宾当地开发的,别说,界面还挺好看。140784所以刚去的第1个月就主攻进销存ERP,发现业务部门的业务报表和月报都是每次导出明细数据后用EXCEL处理(因为ERP自带的标准报表不适用),这场景似乎有点眼熟?这不就是跟在链家的时候一模一样!“要不试试BI?”想到链家上了BI之后的好效果,我也想试试。有了这个想法后,我开始在网上没日没夜的自学了这个BI,为此自己花了500RMB买视频教程。在3个月的时间全心投入学习BI后,我尝试了在进销存ERP的数据库直接获取数据(前期不懂接入数据库,都是每天下载原始资料EXCEL进行更新),处理数据,构建数据关系,每日自动更新。最终成功输出很好的业务报表和月报,在企业里起到重大作用,减少了4个数据工作者,且数据更精准,更快速,更直观。还记得当时领导投来肯定的目光时,自己内心的狂喜。我也被领导任命为了信息部主管,确定了我作为公司新上系统的负责人,开启了BI之路。 在这里分享个对新手很有用的方法,用BI先不要创新!因为你不够了解这些数据,也不了解业务部门的习惯,先去用BI输出业务部门日常所用的报表,然后再去优化,最后你就自然能想到很多业务部门可能需要的报表。下图是BI的表关系,这个ERP数据库的表不多,但是也一定要搞明白并规划好。140785下图是月报二级截图,看每家门店两个部门的经营情况140839140787 下图是某家门店的B部门的半年报140788下图是FINEBI有这个功能:交叉表和明细表+金额字段放数据条+同比用颜色(很推荐)140789下图是BI做的业务报表截图,主要用来结合类别和供应商来查看怎么采购140790 四.快速成长:系统售前对接+上线系统+用BI处理了大量工作我也在工作期间对接了不少系统的售前工作,主要是涉及到了多个领域,真的是学了工商管理专业救了我,让我每个领域都很快入门,也很感谢国内的所有乙方公司,真的很耐心,让我在沟通中不断学习,怎样更好满足公司需求。下图是楼主对接用友时写的售前需求文档的一个目录汇总1407682.独立组建了信息部门,作为负责人上了几个系统,开始精通SQL作为负责人,责任也越发重大。上系统前组建了信息部门,整个部门包括我有6个人,除了1个重点人才是当地刚毕业的华人,其他都是刚毕业的菲律宾当地人,我当然是各种培育,当然这边就不讲那么多了。在菲律宾3年的时间上了不少系统,海鼎ERP,马帮电商ERP,泛微OA,企业微信等,其他的有的是购买了还没上,有的是企业战略目前还不需要,过几年才会购买。这里面让我花最多时间的自然是海鼎进销存ERP,因为公司主营就是零售百货,这块作为主业务自然最为重视。同时这个系统也真很细:供应链管理,财务管理,零售管理,分销管理,促销管理.....(是一个很大的系统,名创优品也是用这个)。当然也在上这个系统上学习了最多,在这期间在乙方教导下学了SQL语句,我在这个系统上用SQL独立制作了业务部门和老板真的想要的进销存全套的报表(投入的做了1年)。我数据能力很大的进步都来源于此,因为他们数据库真的是复杂(有7000多个表吧,以前的老ERP系统差不多就70个表。),业务又都较为复杂,我都慢慢都能搞定了,一些复杂的逻辑也都能搞清楚,后面自然看什么都有信心。下图是我做的所有报表,真的是建立起了全套体系140769140770 这里要说说系统和数据分析的密切关系了,我是这样理解的:系统在一定程度上能代表业务,系统的好处就在于将这些业务记录成数据,我们做为数据工作者要分析这些数据自然就是要懂系统。楼主实施过不少系统,觉得真的因此才提升了数据分析的能力。 3.BI的大作用,完成了很多项目通过B,我也完成了很多额外的项目,查快递公司账,电商盈亏,实时物流,采购部下单效率,费用体系,HR算薪体系。不过这些大多都是在上真正系统前的临时过渡,或者比较临时的项目,就举例其中几个。3.1BI查快递公司账那时候子公司(快递公司)出现异常亏损,老板要求我查到确凿的证据,快递公司负责人很不配合,想法设法的不交出数据库,我为了加快进程,去想办法拿到关键数据(1)快递系统里下载所有的运单明细,导出很多EXCEL(2)快递系统里下载所有的对账单,导出很多EXCEL(3)快递子公司的出入明细,和银行账号的实际出入明细,整理这些EXCEL到一个表里(4)找第三方物流要到了与他们的所有往来记录,整理这些EXCEL到一个表里然后将这4者全部导入BI,进行一定的数据处理,然后进行4个表间的关系链接。最后处理分类成 ,直接查处有多少的出入账,后来老板以此为筹码,让负责人把出入账都还上了还好楼主是掌握了BI,用EXCEL处理这些,真的会很乱,这体现BI的系统化,我们数据处理好了,表间关系链接好了,现在想用都还能再用起来~下图是这个数据集,现在还能用哦,看上一眼还能想起我的思路~140771下图是将最终分析的出入账分成9类,对负责人进行拷问140772(……最后只留了一个案例,其他的详细会在论坛分享哦~)3.2 物流中心BI的其中一个实时大屏,让送货的供应商和收货人员都清楚目前情况..1407733.3 BI分析电商结算,下图是总面板,能较为实施的看到盈利情况….140774经历过这些项目后,自己越发觉得BI是一门值得一提的技能。特别是在没系统,或者系统不支持自定义报表,或者是跨多个系统分析的时候,BI都能帮你形成一套很好的体系。自己通过一步步摸索信息化,也慢慢在这家企业稳住了脚跟,一步步在朝着自己的目标前进。但是突如其来的疫情打乱了我的计划。 五.疫情让我决定回国重头开始,重新走进职场1.疫情改变了一切,决心回国菲律宾3月份开始爆发严重的疫情,比起新冠本身的威胁,更可怕的是社会的动荡,经济的直线下滑。这个疫情下来让我真正想清楚了我到底应该为何而活,真的要尊重自己的内心。在一系列的思想斗争后,我决心回国,7月份提出了离职,为了给这份工作画上一个句号,硬是多呆了2个月来做善后和交接。 2.自身能力总结和个人未来方向我自身认为在菲律宾3年是70%的系统实施,30%的数据分析。所以想可以在系统实施这条路继续下去。但是在经历了回国后10次的面试,认为系统实施的这条路是有些局限性,比如我已经有了3年的经验,但是却局限于进销存ERP,甚至就是海鼎ERP,因为无法确保我能马上上手,用人单位都不太敢冒这个风险。如果从事系统实施的乙方(就是系统供应商)的话,他们会比较乐意让你来试试,但这很容易让你被困在这套系统中了。分析下来,我认为数据分析这条的路会更好一些,只要掌握了数据分析的技巧和技术,跨行业也许也都不算那么困难,况且3年的系统实施经验为了在数据分析这块打下了很好的基础,还是比较有信心能做好的,当然最主要的是数据分析是我自己最为喜欢这个工作~ 3.继续深入学习的计划BI产品:其他BI产品其实已经很熟练了,但是国内大部分企业用的确实都是用帆软,所以决定好好深入学FINE BI 和 FINE REPORT,BI在楼主看来是能压箱底的好技能。 SQL:增删改查楼主感觉已经不错了,牛客网和力扣网刷刷题巩固下。剩下的就是存储过程楼主还不太会,这块有时间还是要学习+应用的。 统计学+SPSS+PYTHON:楼主将数据类工作分为2种类型: 总结过去 和 预测未来, 总结过去用BI是肯定够了,大部分企业也就需要用数据去总结过去。但是通过历史数据来预测未来,这是一个更高端的工作,未来一定越来越有应用场景,这些就需要具备统计学的知识,用SPSS这些专业工具或者PYTHON(有决策树模型,线性回归这些东西)。大家有空去打打KAGGLE的比赛就会清楚,楼主第一次用BI去打比赛,真的跪了,太难了。 数据分析实际案例:就是要多谢分析的经验,有朋友是经营者可以帮他们做做分析,是真实案例又能帮助到朋友;打打比赛,会很有动力,而且能和高手们交流;分析些案例发到社区,这样能提升自己的动力我也还在路上,只不过这次的路是我自己喜欢并且乐于付出的!加油! 编辑于 2020-12-22 16:05 编辑于 2020-12-22 22:43
【2020冬季挑战赛】某药企销售年报(内含超详细数据清洗和数据分析过程)
一.个人基本情况 1.选手简介 139857 1.1.选手介绍 帆软社区用户名:caihuanglun 职业简介:在国外菲律宾佳达百货里担任信息部主管,主持了多个系统的实施和运维(进销存,OA,HR),也用BI产品构建了企业里多个不同业态的报表体系。 因为疫情原因和在数据分析这条路上遇到瓶颈,20年10月份回国,比起系统实施,更想要往数据分析师这条路走,希望能在国内好好发展这条路~ 1.2.参赛初衷 希望能多提升自己数据分析的能力 原来都使用其他BI产品,回国后水土不服,大部分公司都用帆软,刚好能学习 系统实施的经验比较丰富了,但是数据分析这块的经验不足,多点积累,找更适合的工作 2.场景介绍 2.1.业务背景介绍&数据来源 因为12月1号才参赛,手上又有其他事情比较赶,只能选着官方数据2来进行分析。时间真的来不及,很多想法还没实现,但是再过8分钟后就要截止提交了,只能先这样提交了哈哈哈,希望下次能早些参加,多点时间能实现所有数据分析的想法。 2.2.分析思路 拿到的数据进行表自身一致性和不同表间一致性的检查-----进行数据清洗-----分析表间隐藏的信息-----总体数据分析----明细维度分析 二.数据检查和数据清洗 1.数据检查和清洗的方向思考 官方数据提供了两个表:销售明细表,销售季度预算明细表。要去检查这两个表相同的数据(2019,2020 年上半年的销售)是否一致,也要检查表自己本身内部的数据是否有一致性。(这是一个数据工作者很好的习惯,对于拿到手的数据永远保持怀疑,去检查其一致性)139843139841139839因为预算表为汇总表,所以是用销售明细表去分组汇总和其核对。 2.销售明细表进行数据清洗 2.1时间跨度检查 19 年是只有上半年的数据,20 年也是只有上半年的数据,所以该销售明细表的销售时间跨度与预算表是一致的。139744 2.2分组汇总检查 销售明细表和预算表一样的字段的有4个:含税销售额,不含税销售额,总成本,城建税我们用仪表盘对销售明细表进行分组汇总,然后去和预算表做对比。140168139761发现销售明细表的这4个数据全都是预算表的10000倍,两个表间的一致性有问题。(1)从犯错的角度,预算表一般不会出错,因为这是总数据,且表里的实际销售和预算销售差不多。(2)从现实的角度,预算表半年销售额是百万级别的合理;销售明细表是百亿级别,每单流水销售额在1亿级别不合理。综上所述,认定销售明细表因为一些问题导致所有的金额数据都是正常的10000倍,要进行数据调整。 2.3数据清洗和清洗后检查 进入销售明细表:含税销售额,不含税销售额,总成本=(含税销售单价,不含税销售单价,单位生产成本高)*销售数量139745这3个单价都处于合理的水平,反而销售数量过于大。所以认定是销售数量是正常的10000倍,所以处理销售数量/10000进行数据清洗,在销售明细表原表上,对字段销售数量/10000140169销售数量调整后,进行刷新检查,发现销售明细表和预算表保持完全一致,说明数据调整成功。 3.销售季度预算明细表数据清洗 3.1表内数据一致性检查 含税销售,销售收入,销售成本,税金及附加 这些是确定的,且和调整后的销售明细表核对是完全对应的,要对下列信息进行试算平衡。毛利=销售收入-销售成本 ,营销线净利润=销售收入-销售成本-变动费用-固定费,各明细列加起来等于总计列,预算进度,同比增长等。核对后确认表内的信息是一致的。 3.2数据清洗 预算表原来的格式是不能用的,在原表上进行删除和补充的调整139853 3.3清洗后检查数据清洗后导入BI,根据原本去汇总后与原表对比139750检查汇总是完全一致的,明细数据也是一致的 三.分析并获得隐藏信息 我们得到的明确信息是有限的,要用官方给的这两个表格去分析并结合常识,得出一些关键性的信息来帮助我们进行后续的业务分析。(当然,现实情况不建议这样,直接去问业务部门会更快更准确,因为用数据推测出这些信息比较麻烦,且具有偶然性。) 1.原预算表,原来销售明细表的解读 1.1毛利=销售收入-销售成本1.2营业线净利润=毛利-变动费用-固定费用 1397511.3不含税销售单价=含税销售单价/(1+发票增值税率) 1397521.4含税销售额=销售数量*含税销售单价1397531.5销售收入=不含税销售额=销售数量*不含税销售单价 1397541.6销售成本=总成本=销售数量*单位生产成本 1397551.7发票增值税额=不含税销售额*发票增值税率 139756 1.8税金及附加=毛利*增值税*12% 2.产品信息的分析 导入BI,从相关的:产品归属业务部门-产品品类-产品名称-产品规格-销售单位-生成厂家这些维度去不断尝试分组汇总来得到信息。139757139758得出关键信息:2.1每个产品只属于一个产品归属业务部门-产品品类(重要!)2.2每个产品只有一个产品规格,一个销售单位2.3每个产品可能有不同生产厂家(重要!)139765139767 2.4产品增值在19年1,2,3月份是16%,之后就是13%,下降了。因此在销售单价没有变化的情况下,不含税销售单价提高了。(重要!) 3.客户和销售人员维度去分析139768得到关键信息3.1 每个客户只属于一个区域3.2 每个销售人员只属于一个区域 京津:a,b,c 江浙沪:d,e 粤闽桂:f,g,i3.3 除了客户 AA001 是由 b,c 2个销售人员负责(大客户?),其他所有客户几乎都是由1个销售单独负责。AH 4.销售人员和产品的维度去分析 139769 销售人员所卖的产品没有特定性 四.总体分析 总销售和利润 1397701.含税销售额下降7.65%,而销售收入只下降了5.96% ,这是因为2019年3月份增值税从16%调到13%,所以没有往下分析的必要。2.销售收入没完成预算,且同比下降5.95%,要从:2.1时间,2.2产品归属部门-产品品类-产品,2.3区域-客户,2.4销售人员这些维度去重点分析,看看是谁拖了后腿。 再从:2.5退货情况 等次要分析。3.毛利同比下降4.72%,比销售收入下降5.96%幅度低,毛利=销售收入-销售成本,说明是销售成本有所降低,要去分析销售成本的降低。4.净利润不仅完成预算159%,且同比增长32.96%,净利润=毛利-变动费用-固定费用,所以要从变动费用和固定费的降低去分析。总成本和费用-总毛利和利润 139771 5.销售收入降低5.96%,而销售成本下降6.96%,再看毛利率0.59%的略微提升,说明成本真的有略微降低,可以从:5.1日期,5.25厂家 去分析。 1397736.变动费用-产品促销费用只用了预算的46.47%,且同比减少44%;固定费用-广告费只用了预算的36.67%,且同比减少了38.89%。这两个数据都属于直接影响销售的投入,且都明细的业务部门的数据。所以将两者放在一起分析,看是否有影响销售收入。7.税金及附加=(不含税销售单价-单位生产成本)*销售数量*增值税率*12 =毛利*增值税率*12% 。所以其实完全取决于毛利和增值税,不用往下分析。8.现金产品折扣只用了预算的57.18%,且同比下降了38.43%,大幅度的降低了,这也是会影响销售的,但是因为没有明细维度和明细数据,没得分析。9.人力成本只用了预算的78.91%,且同比下降了10.5%,没有明细维度和明细数据 ,没得分析 五.明细分析 1.处理数据表(添加列等) 添加表-自助数据集-给销售明细表添加一些方便后面分析的列。如:销售年份,销售月份等等(一般能提前添加一些,但是主要还是会在实际分析的时候去发现需要,才回来添加)139774 2.各个维度的分析 2.1销售收入-时间分析 添加新指标:139775139776同比增长金额-月份表13977720年的2,3月同比超大幅度下降是导致20年销售收入不好的重要原因,主要原因为每单的销售数量大幅度的下降,导致每单的销售金额大幅度下降。2.2产品归属部门-产品品类-产品 139778业务部门健康的20年收入完成预算任务,且同比增长11.83%,业绩的主要下降还是在非处方药,且3款产品都差不多。产品促销+广告费对大健康类影响不大,而对非处方药的影响不好说,可能是有很大的影响,特别是产品促销费用这块下降的特别多。建议:大健康的广告投入可以保持20年的这个低水平来提供利润率,而非处方药的产品促销+广告费要尽量去达到预算。2.3 2.4 区域-客户分析-销售人员 139779因为一个客户大部分只有一个销售人员负责,所以一起分析。b销售人员在A客户的销售金额同比上升269.56%,但其实只多提供了4千多的销售额,且b销售人员在B客户的同比销售下降了8.44%,所以b销售人员没有什么突出业绩。同比上升的区域只有江浙沪,同比上升13.46%。主要依赖E客户和e销售人员,且提供的销售额非常高。F客户和f销售员同比上升60.35%,提供的销售额也属于中等,潜力巨大建议: E客户重点维护,e销售人员可以评为最佳业绩。 F客户潜力巨大,重点开发, f销售人员可评为最佳上升。 2.5退货情况 定义:退货率=退货金额/发货金额139781139782分析产品-厂家的退货率139783子公司2 有比较严重的退货问题,在感冒药1上,子公司2退货率高达2.62%,而子公司1销售量更大的情况下,退货率只有0.06%在胃药1上,子公司2退货率高达0.26%,而子公司1销售量更大的情况下,退货率只有0.06%建议:在子公司1产能足够的的情况下,将感冒药1的生产全部移交给,子公司1,并加强子公司2对药品的管控,药品的品质问题不容忽视。 以下的点是能具体再分析的,但是时间来不及了,哈哈哈 5.销售成本降低-日期,厂家,产品(成本同比有略微的降低,可以查明原因,然后看是否能可持续降低) 6.大单来源(每单的总价其实跨度很大,大单是重点)来自哪些区域,客户,产品 7.产品销量-毛利分析(哪些产品是优质产品,大大提高利润) 139817 140419
个人成就
内容被浏览106,733
加入社区6年12天
返回顶部