【2022帆软杯·数据可视化分析】航空公司客户价值可视化分析

楼主
我是社区第973385位番薯,欢迎点我头像关注我哦~

1团队介绍

团队成员:唐子熠、王维肸、苏含

指导老师:张庆明

2作品背景

2.1背景

随着经济社会的不断发展,新时代人民群众的需要已经从“物质文化需要”发展到“美好生活需要”。美好生活离不开舒适安逸的出行方式,越来越多的人选择乘坐飞机出行。近年来,我国民用航空的主要客户运载能力和航线始终保持平稳增长,但航空线路的扩大和客户数量的增长带来的不仅仅是航空业的发展,也加剧了不同航空公司之间对各种资源的竞争。2022年1月7日,中国民用航空局发布了《“十四五”民用航空发展规划》,确定了“十四五”期间民用航空的六大发展目标,提出建设六大体系、实施六大工程。期间,民航局发展计划司司长韩钧还指出:预计到2025年,中国民用运输机场数量达到270个以上,比“十三五”末期增加30个以上。运输总周转量将达到1750亿吨公里,旅客运输量达9.3亿人次。机场的增加意味着今后航空市场的竞争也会更加激烈。如何在激烈的市场竞争中占据优势并实现利润的最大化成为众多航空公司必须面临的重要课题。

2.2 具体痛点

民航客运的竞争除了三大航空公司之间的竞争之外,还加入了新崛起的各类小型航空公司、民营航空公司,甚至国外航空巨头。航空产品生产过剩,产品同质化特征愈加明显,于是航空公司从价格、服务间的竞争逐渐转向对客户的竞争。

如今的营销已经远远不同于过去了,那个一张传单一则广告的时代结束了,这是个大数据的时代。一个时代有一个时代的生存法则,那些没有适应时代的企业,即使曾经是个庞然大物,今天也几乎不见踪影。在航空公司这个特殊的领域,国内竞争还是很严峻的,一个顾客的流失造成的损失是4-5个新顾客的流入所不能弥补的,这足以看出客户对一个公司的重要性,如今我们也很容易发现包括航空公司在内的很多企业开始把重心放在找寻高价值客户身上,如何在众多客户中精确的找出高价值客户就成了一个重要的研究内容,国内外有许多学者已经从各个不同角度对客户价值的内涵进行了阐述,对客户价值及相关理论的研究也伴随着时间的推移不断地深入、完善,同时对于客户价值分析的方法和技术不断优化并推陈出新,本作品的主要目的是。数据处理完毕并加以分析后,以直观形象的图形给予用户清晰明了的视觉呈现,并结合丰富的交互手段,便于企业理解及运用。实现对客户价值可视化旨在对不同价值的客户群体进行呈现,并凸显高价值客户群体的重要程度,以便于企业针对不同客户群体提供富有针对性的服务并制定相应的营销策略,从而实现企业利润的最大化。

3制作流程

3.1数据来源

网站名称

网址

和鲸社区

https://www.heywhale.com/mw/dataset/5e99aa88ebb37f002c60a074

此数据集根据航空公司系统内的客户基本信息、乘机信息以及积分信息等详细数据,选取宽度为两年的时间段作为观测窗口,抽取观测窗口2012年4月1日至2014年3月31日内有乘机记录的所有客户的详细数据形成原始数据,总共62988条记录。

3.2设计思路及逻辑

本作品一共分为三个模块:一是聚类结果分析模块,通过使用三种聚类评估指标(轮廓系数、CH指数、DBI指数)来对聚类结果进行评估,选出最合适的客户分类数量;二是总体客户价值特征分析模块,通过分析每一组客户第一年和第二年的总票价、平均折扣率、平均每公里的票价和总飞行次数和总飞行公里数来给每一组客户选择恰当标签,区分出每一组客户的价值高低;三是不同价值客户特征分析,通过分析每组客户的年龄组成、性别组成、入会时间和会员等级来分析每组客户的特征,指导航空公司针对每组客户中不同的人群制定相应的营销策略,帮助企业实现利润最大化。

首先,针对航空公司如何在激烈的市场竞争中占据优势并实现利润的最大化这个问题,结合帕累托定律:企业八成的收入来源于两成的消费者,很容易想到将客户进行分类,然后对不同价值的客户采取不同的营销手段来解决此问题。本作品使用K均值算法来对航空公司客户进行聚类,通过选取数据集中对分析客户价值权重较大的十个维度的数据来构聚类算法所需的模型,由于各个维度数据的数量级差异较大,本作品使用z-score来对数据进行标准化。然后基于标准化后得到的模型,在不同K值的选取下观察聚类效果。本作品用到了三种评估聚类效果的方法,分别是轮廓系数、CH分数和DBI指数,将这三种评估方法的结果用图表呈现出来,能有效的选取最合适的K值,即选出最合适的客户类别数。为了验证聚类结果的好坏,最直观的方式是将聚类结果以可视化的方式展现出来,由于模型的数据维度较大,本作品使用了PCA和TSNE两种降维方法来对数据进行降维,降维后每个客户都可以看作一个坐标点,通过绘制散点图来观察聚类结果的好坏。

其次,由于聚类后的客户群体没有标签,因此还需分析总体客户的价值特征,来区分客户的价值高低,通过分析每一组客户第一年和第二年的总票价、平均折扣率、平均每公里的票价和总飞行次数和总飞行公里数来给每一组客户选择恰当标签,区分出每一组客户的价值高低。在分析客户的价值特征时,企业也可从中发现某些问题,从而可以更好的制定营销策略。

最后,基于第二模块分析出的结论,分析不同价值客户的非价值特征,分别是客户的年龄、性别、入会时间和会员等级。企业可以在不同价值客户群的基础上挖掘出价值更高的客户,来实现利润最大化。

3.3设计框架

数据获取:从网页上下载航空公司客户数据集。

数据抽取:选取入会时间、观察窗口的结束时间、最后一次乘机时间至观察窗口结束时长、观察窗口内的飞行次数、观察窗口内的总飞行公里数、平均折扣率、第一年的票价收入、第二年的票价收入、平均乘机时间间隔和最大乘机时间间隔这十个维度的数据作为历史数据。

数据预处理:清洗掉历史数据中票价为空但总飞行公里数大于0的数据。用观察窗口的结束时间减去入会时间得到每个客户的持续时间,反映出客户的忠诚度;选取客户最后一次乘机时间至观察窗口结束时长来反映客户的活跃度;选取客户在观察窗口的总飞行公里数和总飞行次数来直观的反映客户的价值;选取客户的平均折扣率;选取客户的平均乘机时间间隔;选取客户的最大乘机时间间隔;用客户第一年和第二年的票价除以客户两年来的总飞行公里数得到客户平均每公里的票价。每个维度的数据数量级差异较大,用z-score对数据进行标准化,最后得到聚类算法所要用到的模型。

建模与分析:基于前面得到的模型使用k-means聚类算法对客户进行聚类,实现对客户的分群,再通过三种聚类评估指标对聚类结果进行评估,选出最合适的k值,最后基于选好的k值对客户进行价值分析。

可视化呈现:使用FineBI进行数据的可视化呈现。

 

4成果展示

4.1开篇介绍

开篇切入主题:

4.2第一模块——聚类结果分析

第一模块着重展示k-means算法聚类的结果,以图表的形式来展示在不同k值的选取下聚类的好坏。

首先,将三种聚类评估指标以折线图的形式展示出来,并给出每个聚类评估指标的简单介绍,帮助航空公司选出最合适的客户类别数。

其次,在选取了最合适的客户类别数的基础上,将全部客户的特征数据用PCA主成分分析和TSNE降维这两种降维方法进行降维,使每个客户都可看成一个二维坐标点,再用散点图的形式展示结果,可以验证前面客户类别数的选取是否正确。

最后给出k-means聚类算法、三种聚类评估方法和两种降维方式的简单介绍,让用户阅读图表的时候思路更加的清晰。

4.3第二模块——总体客户价值特征分析

第二模块着重展示总体客户的价值特征,因为k-means聚类算法属于无监督机器学习,所以得到的每组客户群是没有标签的,第二模块的主要目的是通过分析每一类客户的第一年和第二年的总票价、平均折扣率、平均每公里的票价和总飞行次数和总飞行公里数这几个特征来为每组客户选择恰当的标签,并且以雷达图的形式来展现每一类客户最突出的一个或多个特征,其次也可以让航空公司在分析每类客户的特征的同时,抓住每类客户的具体痛点,制定相应的营销策略来提高客户的活跃度、对公司的依赖度和回头率等。

4.4第三模块——不同价值客户特征分析

第三模块着重展示不同价值客户的特征,基于前面两个模块得出的具有不同价值的五类客户,对他们的入会时间、会员等级、性别组成和年龄分布进行可视化展示,点击左上角的词云图整个图表可以联动起来,可以帮助用户聚焦于想要关注的某类客户,进而对不同价值的客户制定不同的营销策略来实现企业的利润最大化。

5总结与分享

本作品基于聚类分析算法当中的Kmeans聚类算法为基础,对航空公司客户进行分组,展示价值分析结果,并使用FineBI来实现航空公司客户价值可视分析。

在使用Kmeans算法进行聚类的阶段,首先对K值的选取进行了一定的探索,只有确定合适的聚类数量,才能得到理想的聚类结果。该设计主要通过轮廓系数、CH值和DBI指数这三个聚类结果评价方法对不同K值下的聚类结果进行评价,并将得到的评价数据绘制成折线图,通过三个折线图的变化趋势初步确定了聚类数量K值的取值范围。然后通过PCA主成分分析和TSNE降维这两种降维方式对客户的特征数据降成两维,将降维后的数据绘制成散点图,可以直观的看出聚类结果的好坏。

客户价值分析部分,本部分分为两个模块,一是总体客户价值特征分析模块,该模块对每一类客户第一年和第二年的总票价、平均折扣率、平均每公里的票价和总飞行次数和总飞行公里数的分析过程进行了展示,对分析客户具体属于哪一类提供了帮助。另一个模块是不同价值客户特征分析模块,该模块对客户群的入会时间、会员等级、性别组成和年龄分布这几个特征进行了分析,可以帮助航空公司进一步了解各个客户群的特征分布,从而制定更加有效的营销策略来实现企业的利润最大化。

制作参赛作品过程中,队友间应该齐心协力,遇到问题应及时讨论解决方案,遇到举棋不定的地方时,要积极向老师提问,一个好的作品诞生前一定是经过层层打磨的。此次参赛经历对我们这个团队来说,意义非凡,经历了多次方案迭代,我们没有轻言放弃,彼此都在相互鼓励。更希望大家能享受过程,结局固然重要,但路上的风景才是陪伴我们漫漫人生路上最长久的东西。

分享扩散:

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

返回顶部 返回列表