一、 选手简介 1、 选手介绍 帆软社区用户名:柠檬树 职业简介:数据开发相关工作,日常从事数据开发和报表制作,工作中使用过FineBI和FineReport,之前也从事过网站运营相关工作。 2、 参赛初衷 想借此机会挑战自己,给自己设定目标,从而更加深入学习FineBI。同时通过完成这次比赛学习数据分析相关内容,给以后的工作积累经验。 二、 作品介绍 1、 业务背景介绍 近年来,网络上涌现了越来越多的在线课程平台,本次结合某线上课程平台的数据分析平台运营相关内容,提供平台运营策略。 2、 数据来源 寻找数据对于个人选手是个比较困难的过程,浏览了各种网站,终于找到比较符合的数据。我的数据来源于和鲸社区,下载的数据包里共5张表,分别是登录表、课程信息表、全部信息表、用户表、用户地区表。 3、 分析思路
3.1 首先查看了5张表之间的联系,根据5张表中的字段可以分成两大内容,一是用户方面,二是课程方面。围绕这两大主题,初步制定了整体的框架,采用总分的形式,首先是总体概况,然后针对用户和课程分别分析。 3.2 用户方面提炼了以下关键词:注册、登录、留存、流失、收益、粘性。初步是准备使用AARRR用户运营分析模型,但因为表内字段缺少推广渠道和推荐等相关内容,所以根据现有的字段内容主要使用了用户生命状态分析模型、用户粘性分析模型以及FRM用户价值分析。 3.3 课程方面提炼了以下关键词:热门课程、课程价格、课程进程。针对课程使用了购物篮分析模型、TOP分析以及ABC分析模型。 4、 数据处理 4.1针对用户生命状态分析,用到了全部信息表中的用户ID、注册时间、最近登录时间,因日期是记录到2020-06-18的,所以把这天直接作为今日日期,然后计算最近登录时间距离现在有多久,从而将用户分类。定义将注册日距今小于180天且最近登录时间距今小于60天的用户划分为新用户;将注册日距今小于180天,最近登录时间距今大于60天的划分为一次性用户;将注册日距今大于180天,最近登录时间距今小于60天的划分为忠实用户;将其他类型归为流失用户。根据以上分析制作了如下自助数据集: 4.2 使用登录信息表制作用户粘性分析,首先将登录时间和用户ID通过分组汇总去重,一天内只记录一次登录,再新增计数列,最后通过分组汇总每周内用户登录的次数,如图: 4.3 分析用户参与付费课程的情况,使用RFM分析模型将用户分类。取全部信息表中用户ID、省份,取课程信息表中的用户ID、课程加入时间、价格,两个表左关联。分析的是付费课程的情况,所以过滤掉价格为0的记录。表中最大数据日期是2020-06-18,因分析需要新增一列将2020-06-19设为今日日期,从而计算用户距离最近一次采购时间的间隔(R);通过统计课程加入时间的次数计算出用户参与付费课程的次数(F);通过统计课程的价格计算用户的消费金额(M)。再通过求平均值,以及和平均值比较,得到向量化的三个指标。 4.4 在分析课程方面使用了购物篮分析模式,目的是通过分析用户参与的课程,挖掘同一个用户选择两类课程之间的联系,从而分析出已选择A课程的用户后期更倾向于参与哪种课程,由此达到推荐使用户满意的课程。此分析模式创建了3个自助数据集,一个是计算出参与课程的总用户数;一个计算参与单个课程的用户数;最后计算同时参与A和B的用户数,将以上三者合并计算得到“支持度”、“置信度”、“提升度”,如图: 5、 可视化报告 (1) 整体框架是总分的形式,第一屏主要概括平台的整体运营情况,主要使用了指标卡、仪表盘、折线图等组件,重点展示了本年平台的运营情况,将本年与去年同期数据对比,凸显本年平台运营的大好情况。使用地图和柱形图相结合的形式展现在各省份地区的用户分布情况,地图中设置了省份下钻到城市。在第一屏结束对平台整体情况做文字概述和数据分析。 分析报告第二屏是对用户的分析,首先通过用户生命状态和RFM价值两种分析模式,将用户以饼图形式分类。其次通过用户粘性和多维度统计用户数和体现用户特性。
第三屏是课程的分析,首先是统计十大热门课程,以条形图直观展示选择热门课程的用户数情况,表格形式辅助展示详细的热门课程信息。使用购物篮分析模式,以矩阵图的形式展示课程之间的联系,用于指导推荐课程给相应的用户,提高运营精准性。
在课程分析同时使用了ABC分析模式,因数据限制课程未分类,所以最后展示的课程较多,但代表性的A、B、C类课程还是可以体现出来。
(2) 数据分析结果 整体分析: ①由用户每月注册趋势图可知2020年是本平台的突飞猛进的一年,本年新增用户数占累计用户数的52.39%,本年新增课程收益占总额的95.73%,本年同期新增增长率基本都超过100%。可推算出2020年02月平台举办了拉新用户的活动和促进用户参与付费课程的活动,活动效果非常成功,建议可研究该活动优势,后期举办同类活动。 ②由各省份用户数分布情况可知本平台用户主要分布在南方地区,尤其广东对平台认可度较高,其次是湖北、北京、江苏,排名第一与第二的差距较大,说明本平台前景市场是可观的,但是其他城市的用户推广还需加把力,可学习借鉴广东省的运营策略。 用户分析: ①根据用户生命状态分析方法,可以看出流失用户占比较大且忠实用户较少,建议对有过课程记录的流失用户和一次性用户做邮件或短信推送;而对于新用户需要增加平台活动频度,保持用户粘性。 ②由在线用户情况可知,从2018年09月到2020年06月期间每月用户数整体呈增长趋势,每年的春秋季节普遍会达到一个波峰。由每日用户在线人数走势可知,在上午10点、下午3点、晚上8点是人数最多的时间段,建议在此时间点做广告推送等其他营销类活动。 ③由用户粘性数据分析可知,平台在2020年3月-4月用户活跃较高,每周登录次数超过2次的用户数在3月末的时候达到最高4566人,之后用户数逐渐回落。建议平台在用户运营上需要多制定一些提高用户活跃度及粘性的活动,例如打卡签到等激励措施。 ④分析用户所填学校的信息,根据已填内容,可以初略观察到有“职业”和“师范”关键词的学校较多,于是将学校名称自定义分组,增加职业学院和师范学院类别,以上大类分别占已填用户的百分比为25%、17.76%。 ⑤ 根据RFM分析模型,平台用户占比最多的是一般挽留客户(很长时间未买,购买的频率和金额较少),应该面向该部分人群推出营销活动,拉动用户的积极性;其次占比较多的是一般发展客户(最近购买过,但频率和金额都不大),应向该客户推送公司主营业务,通过宣传推广让产品信息送达客户手中。 课程分析: ① 由平台的十大热门课程数据可知,其中6门是免费课程,且排名第一的课程为免费课程76,选择此课程的用户数占所有用户的30.21%;4门付费课程,价格分别是109元和299元。由此分析主要受众群体是追求价格优惠的用户,在课程开发上可以偏重于此价位。 ② 分析进度完成100%的课程情况,可以看出课程31的用户最多;连同十大热门课程信息一起分析可知课程31、课程17、课程34为优质课程,后期可以重点推广。 ③ 分别分析免费课程和付费课程完成进度情况,进度在20%以下占比较多,需要制定激励或督促类型活动。 ④根据课程关联分析,由支持度分析图表观察到同时参与课程31和课程17、课程191和课程180两类组合的用户较多,可对只参与其中一种课程的用户推荐对应课程;由提升度图表可以制定推荐课程的优先顺序,首推提升度较高的关联课程。5、由ABC分析模型可知,付费课程中A类课程(数量少,价值大)的代表是课程173;B类课程(没有A类那么重要,介于A、C之间)的代表是课程94;C类课程(数量占比多单价值小)的代表是课程67。 (3)最终结果展示
三、参赛总结
1、FineBI工具 FineBI在工作中有用到,优势就不赘述了,重点夸赞下帮助文档和培训视频都很全面,极易上手。希望在后期可以增加多一些图表功能。 2、自我总结 原来对数据分析模型知之甚少,通过这次学习到很多数据分析方法,也了解到自己很多欠缺的地方,今后还需加油,学习之路还很漫长。
线上课程平台运营分析.pdf (1.59 M) |