某移动通信运营商福建分公司用户分析
一、选手简介
1、选手介绍
◆ 团队名称:说的队
◆ 队长介绍:帆软社区用户名Digar,目前就职于福建某高校,从事商务数据分析类课程的教学工作,个人对商务数据分析和BI可视化感兴趣。
◆ 成员介绍:星星,目前就职于福建某高校,从事市场营销类课程的教学工作,擅长市场营销策划和用户分析。
2、参赛初衷
今年上半年在工作中机遇巧合的接触到FineBI这款工具,在进行试用后发现FineBI很适合用于学校商务数据分析类课程的教学实训,因此趁着暑假系统性的学习了这款软件的操作。本次参加比赛主要想提升自身对FineBI这款工具的熟悉度,在制作比赛作品的过程中,使自己掌握对BI工具的使用方法和技巧。同时也希望与更多FineBI大神进行交流学习,获取更多的分析思维的激烈碰撞。
二、作品介绍
1、业务背景与需求痛点
业务背景:国内某移动通信运营商拥有海量、广泛、高质量、高时效的用户数据,如何基于丰富的用户数据进行综合分析是企业方目前急需攻克的难题。本次业务将聚焦该企业业务需求,进行用户整体分析、用户画像分析和用户行为分析。分析过程中将应用RFM模型和用户生命状态分析法对用户进行定义,并分别从用户生命周期、用户价值分类、信用分和话费敏感度(1-5)四个维度对用户行为进行分析,最终为该企业制定用户维护策略。
需求痛点:本次分析结果将有助于企业方了解该区域的用户整体特征、用户价值特征和用户行为特征,解决企业所提供的服务与用户需求之间不匹配的矛盾,为企业方提供合理的用户维护策略,使企业方可以更好的为用户提供高质量服务,提升企业的盈利水平。
2、数据来源
数据源来自2019年数字中国创新大赛赛题“消费者人群画像”的数据集,该数据集为国内某移动通信运营商福建分公司2018年x月份的样本数据(脱敏),包括客户的各类通信支出、欠费情况、出行情况、消费场所、社交、个人兴趣等多维度数据。
该数据集的数据结构如下所示:
字段列表
|
字段说明
|
用户编码
|
数值 唯一性
|
用户实名制是否通过核实
|
1为是0为否
|
用户年龄
|
数值
|
是否大学生客户
|
1为是0为否
|
是否黑名单客户
|
1为是0为否
|
是否4G不健康客户
|
1为是0为否
|
用户网龄(月)
|
数值
|
用户最近一次缴费距今时长(月)
|
数值
|
缴费用户最近一次缴费金额(元)
|
数值
|
用户近6个月平均消费话费(元)
|
数值
|
用户账单当月总费用(元)
|
数值
|
用户当月账户余额(元)
|
数值
|
缴费用户当前是否欠费缴费
|
1为是0为否
|
用户话费敏感度
|
一级表示敏感等级最大,五级表示最小。
|
当月通话交往圈人数
|
数值
|
是否经常逛商场的人
|
1为是0为否
|
近三个月月均商场出现次数
|
数值
|
当月是否逛过福州仓山万达
|
1为是0为否
|
当月是否到过福州山姆会员店
|
1为是0为否
|
当月是否看电影
|
1为是0为否
|
当月是否景点游览
|
1为是0为否
|
当月是否体育场馆消费
|
1为是0为否
|
当月网购类应用使用次数
|
数值
|
当月物流快递类应用使用次数
|
数值
|
当月金融理财类应用使用总次数
|
数值
|
当月视频播放类应用使用次数
|
数值
|
当月飞机类应用使用次数
|
数值
|
当月火车类应用使用次数
|
数值
|
当月旅游资讯类应用使用次数
|
数值
|
3、分析思路
4、数据处理
(1)字段设置:由于原数据集有29个字段,且排列混乱,因此数据处理的第一步就是将字段按照业务分析需求重新排列,对个别原字段名进行重命名。
(2)新增“用户生命状态”列:点击“新建公式列”按钮新增公式,使用原数据集中的“用户最近一次缴费距今时长”和“用户网龄”这两个属性,结合用户生命状态分析法新建“用户生命状态”列。
(3)新增“当月应用使用总次数”列:点击“新建公式列”按钮新增公式,使用原数据集中的“飞机类应用使用次数”、“火车类应用使用次数”、“金融类应用使用次数”、“旅游类应用使用次数”、“视频类应用使用次数”、“网购类应用使用次数”和“物流类应用使用次数”这七个属性,进行相加操作,产生“当月应用使用总次数”列。
(4)新增RFM模型相关列:点击“新建公式列”按钮新增公式,新增“最近一次消费时间”、“最近一次时间内消费频次” 、“最近一次时间内消费金额”、“RFM”等字段,应用这些字段进行RFM分析。
(5)新增RFM模型相关列:点击“新建公式列”按钮新增公式,新增“最近一次消费时间”、“最近一次时间内消费频次” 、“最近一次时间内消费金额”、“RFM”等字段,应用这些字段进行用户价值分类。
(6)新增“信用分(分类)”列:点击“新增赋值列”按钮新增公式,将信用分分为以30分为间隔值分为8个区间。
(7)新增“应用使用总次数(分组)”列:点击“新增赋值列”按钮新增公式,将应用使用次数以1000次为间隔值分为8个区间。
5、可视化报告
5.1用户整体分析
(1)数据含义表达和图表排版布局
用户整体分析部分构建指标包括:用户数,人均信用分,人均应用使用次数,用户年龄占比,用户消费行为分布,应用使用次数分布,用户信用分分布。用户数即某移动通信运营商福建公司用户总人数。人均信用分即用户账户的平均信用分值。人均应用使用次数即每位用户近1个月内的各类应用使用总次数。用户年龄占比即全体用户中不同年龄段人群的占比。用户消费行为分布即显示不同年龄段用户消费行为分布情况。应用使用次数分布即显示不同使用次数区间的用户分布情况。用户信用分分布即显示不同信用分区间的用户分布情况。
(2)通过分析得出的结论
A. 该移动通信运营商福建地区用户年龄段,30-40岁占36.93%,40-50岁占24.00%,20-30岁占22.07%。
B. 20-50岁年龄段的用户热衷的消费行为依次是旅游消费、运动消费、商场消费和影视消费。
C. 应用使用次数在0-1k区间和7k以上区间的用户数较多。
D. 信用分处在600-660分区间的用户人数最多。
E. 网龄越长,人均信用分越多,人均应用使用次数越少。网龄与信用分呈正比,网龄与人均应用使用次数呈反比。
5.2用户画像分析
(1)数据含义表达和图表排版布局
用户画像分析部分构建指标包括:用户价值分类,用户价值占比,用户生命状态占比和用户价值明细表。用户价值分类即基于RFM模型分布对最近一次购买数量、购买频率和购买金额进行分析,得出八种用户价值分类的用户数情况。用户价值占比即显示不同用户价值类型用户的数量占比情况。用户生命状态占比即根据用户网龄与最近一次缴费时间这俩维度对用户生命状态进行划分然后显示其比例。用户价值明细表即显示该移动通信运营商福建地区所有用户的用户价值分类明细数据。
(2)通过分析得出的结论
A. 用户中规模最大的三个群体分别是一般发展客户、重要发展客户和一般挽留客户。针对一般发展客户建议提供免费资费试用套餐以提高用户兴趣,提高其对品牌的满意度。针对重要发展客户建议提供会员或忠诚度计划或推荐相关产品以实现向上销售,帮助他们成为重要价值客户。
B. 用户生命状态群体中忠实客户占比97.63%。说明该客户群体认可企业方提供的服务。
C. 随着网龄的增长,重要发展客户在群体中的比例增加。忠实用户在群里中的比例增加。说明网龄与重要发展客户占比呈正比,与忠实用户占比呈正比。
5.3用户行为分析
(1)数据含义表达和图表排版布局。
用户行为分析部分构建指标包括:基于用户生命周期的用户行为分布,基于用户价值分类的用户行为分布,基于信用分的用户行为分布和基于话费敏感度的用户行为分布。基于用户生命周期的用户行为分布即以用户生命状态为横轴构建用户行为分布情况。基于用户价值分类的用户行为分布即以用户价值分类为横轴构建用户行为分布情况。基于信用分的用户行为分布即以信用分区间为横轴构建用户行为分布情况。基于话费敏感度的用户行为分布即以话费敏感度为横轴构建用户行为分布情况。
(2)通过分析得出的结论
A. 新用户的平均应用使用次数高于忠实客户。新用户和忠实用户最喜欢使用视频类应用。2、重要价值客户、一般价值客户、重要保持客户和一般保持客户的平均应用使用次数普遍高于平均值。且四类客户均喜欢使用视频类应用。
B. 信用分越高,平均应用次数越高。说明信用分与平均应用使用次数之间呈正比。
C. 用户话费敏感度越低,平均应用次数最低。说明用户话费敏感度与平均应用次数呈正比。
D. 随着用户网龄的越长,金融类应用的平均使用次数增多。网购类应用的平均使用次数减少。
5.4用户维护策略
(1)需要关注年龄处于20-40岁区间群体的需求,这个区间的人群人数占比最多,消费行为最旺盛。建议针对该年龄段人群提供特色资费套餐,为该人群的消费行为提供便捷。
(2)关注旅游消费和运动消费这两个领域的开发,积极开发基于这两个领域的客户服务项目,促进用户消费。建议针对这两个领域举行一些促销活动,引导用户消费。
(3)信用分值越高的用户越容易产生消费,建议通过合理引导用户,提升用户的信用分值。
(4)一般发展客户和重要发展客户在用户群体中占有很大比例,建议针对一般发展客户建议提供免费资费试用套餐以提高用户兴趣,提高其对品牌的满意度。针对重要发展客户建议提供会员或忠诚度计划或推荐相关产品以实现向上销售,帮助他们成为重要价值客户。
(5)应用平台建设方面,建议加强视频类应用和金融类应用的建设,这两类应用是用户需求量较大的应用,积极的建设可提高用户在平台上的粘性。
三、参赛总结
1、FineBI工具
之前我同事觉得FineBI只是Excel工具的加强版,这回通过制作参赛作品改变了我对FineBI工具的认知,FineBI的功能还是很强大的,只需在客户端用鼠标进行点击和拖拽,就能轻松的进行清洗数据,不需要涉及到复杂的代码。在组件制作方面,制作流程也很简单,很容易上手,按照官方教程捣鼓一天时间就能掌握每个组件的参数设置原理。在仪表盘设计方面,其所提供的模板在美观性上也给了我很多惊喜,好几个模板科技感都很强,基于这些模板做出来的作品看观赏性高。FineBI工具给我的映像就算简单易学、入门门槛低、智能化程度高,很不错的BI工具。
2、参赛总结
克服的困难:当我决定参加这次的比赛后,我遇到的最大难题就是数据源的获取问题,为此我花了很多时间,按照官方的教程,我找了好几个网站,也下载了很多样本数据,最后发现这些数据集要么数据量不够大,要么字段偏少,没有可分析性,该问题一度让我想放弃参加比赛。后来碰巧在某个网站上看到2019年数字中国创新大赛的一道赛题,这道赛题提供了5万条脱敏数据,要求选手用算法设计模型,我观察了下他们的脱敏数据,发现很适合用于做用户分析,于是就拿来参加本次比赛,该困难得以解决。
感恩的事儿:还是得感谢赛事群里指导老师的答疑,我好几回大半夜给指导老师发信息,对方都会及时回复,感谢感谢。
遇到的人儿:遇到一群志同道合的朋友。
认知新感悟:平常还是要勇于尝试些新的工具,这回要不是来参加这场比赛,我还真没发现用FineBI做数据分析这么简单。 |