一、选手简介
1、选手介绍
(1)团队选手版
- 团队名称:兴盛永威明
- 队长介绍:胡文馨,目前就读于华南农业大学数学与信息学院,是2020级工业工程与管理专业的研究生,个人感兴趣的方向和领域-数据分析等。
- 成员介绍:廖世盛、霍钊威、谢志明、韩咏林。以上四人与队长皆就读于华南农业大学数学与信息学院,是2020级工业工程与管理专业的研究生,且来自同一实验室。
- 团队组成:同班同学,来自同一个实验室。
- 团队照片:
2、参赛初衷
希望通过比赛实践提升BI工具的使用方法和技巧;和更多大神交流学习,进行数据可视化作品以及分析思维的激烈碰撞;大赛奖励很诱人;希望能借此比赛对作品能有进一步的提升和完善。
二、作品介绍
1、业务背景/需求痛点
【目的】
为进一步提升高校的智慧管理水平,更好服务广大学生群体。
【方法】
我们以某高校校园一卡通消费记录为数据基础,利用大数据和数据挖掘技术对其展开分析研究,充分挖掘学生消费行为背后的隐藏信息。通过对提取数据进行预处理和特征工程,统计分析学生的消费水平和消费习惯,深度分析不同群体的消费行为特征。
【结论】
通过将挖掘出的学生消费规律同其他行为之间的隐含联系,利用可视化技术,直观地呈现出来,不仅可以方便学校、老师和学生管理工作人员进行相关工作,也可以为辅助他们的决策提供强而有力的数据支撑。
【需求分析】
在信息化大背景下,随着校园人数越来越多,校园管理不断朝现代化方向靠拢,管理方式呈多样化发展,智慧校园建设已经在大学中全面开展。其中,校园一卡通对校园管理的现代化起着重要作用,在高校中的应用已经日趋成熟,是学校师生不可或缺的“通行证”,是校园数字化管理的重要组成部分,也是智慧校园建设的核心,学校与学生之间信息交互的纽带。校园一卡通为学校师生提供了诸多便利,也产生了海量数据,据信息涵盖了餐饮、门禁记录等。由于这些数据信息是学生自己使用产生的,所以对这些信息的研究分析有助于学校了解学生的需求和选择,更有助于学校的建设和管理。
随着数据化校园建设不断深入,积极落实国家精准扶贫政策的要求,高校借助大数据平台建立起了对家庭困难学生进行“隐形资助”模式。即在学校资助实施的过程中,学校根据学生近期在学校食堂用餐期间校园卡消费较低的情况,自主非公开化向贫困学生校园卡内定期打入一定金额的资金补贴,也称为“隐形补助”或者“隐形餐卡补贴”。如何更加准确、有效的获得确需帮助的学生信息,对高校的智慧管理提出了不小考验。
2、数据来源
学生人员基本信息、选课记录、住宿信息、一卡通消费流水信息、等。
消费行为分析用到学生人员基本信息、住宿信息和一卡通消费流水信息,现用python将其加载到分析环境,尚未分析的数据部分如下:
XH(学号)
|
XM(姓名)
|
XB(性别)
|
ZZMMMC(政治面貌)
|
DQZT(当前状态)
|
RXNF(入学年份)
|
YXSMC(院系名称)
|
XZBJMC(行政班级)
|
ZYMC(专业名称)
|
7FFC46689CA9F9C3B7E4807191CE9EEC
|
6D3C64B8E79460A7BF07E99FE48ADCDA
|
女性
|
团员
|
在读
|
2017
|
食品学院
|
19食品营养2
|
食品科学与工程
|
0E64078811A084ECD9D11CF0C6BBAA41
|
EFABB4BDC70D9EFFC367B7E1333E00B3
|
男性
|
团员
|
在读
|
2017
|
数学与信息学院、软件学院
|
17计算机1
|
计算机科学与技术
|
6335C7E05DD850DA11B55313AE3A1CB2
|
91AB05B3CD529E241ED235682A016297
|
女性
|
群众
|
在读
|
2017
|
兽医学院
|
17动物医学1
|
动物医学
|
……
|
……
|
……
|
……
|
…
|
……
|
……
|
……
|
……
|
CD52C95E150EAF36E1DC9F94D1D57676
|
CF89A2D20A69E46BF4CCEA9C7A8E4CA2
|
女性
|
团员
|
在读
|
2021
|
数学与信息学院、软件学院
|
21计算科学1
|
信息与计算科学
|
5BBDF030FA68067D0AA81CFDFA937478
|
0665B23EC666F0F4CC0E323346DE9D2A
|
男性
|
群众
|
在读
|
2021
|
数学与信息学院、软件学院
|
21计算科学1
|
信息与计算科学
|
4D2353962F4B833EA86FAE44B4270E18
|
F9633B32201E2566A73BCD0C8D1275E2
|
男性
|
团员
|
在读
|
2021
|
数学与信息学院、软件学院
|
21信管4
|
信息管理与信息系统
|
学生基本信息(仅限大赛使用)
XH(学号)
|
XQMC(校区名称)
|
RZRQ(入住日期)
|
RZZTMC(入住状态)
|
6B5812DF3126C9AA14292E6007E281BF
|
华山区
|
20210223
|
已入住
|
9907FC31D33536AC8E8BB470741E98EA
|
华山区
|
20210223
|
已入住
|
235855F03BFD7F5A871B02E79ACBB77F
|
华山区
|
20210813
|
已入住
|
……
|
……
|
……
|
……
|
5A0DF1A299E4949FE8C59A5FD3621769
|
华山区
|
20210903
|
已入住
|
9B52856F13EFE6850EFF26117A707338
|
燕山区
|
20210901
|
已入住
|
09B13222DD1F45AFEC8441AD84716046
|
华山区
|
20210901
|
已入住
|
学生住宿信息(仅限大赛使用)
XGH(学工号)
|
LSFSSJ(流水发生时间)
|
JYE(交易额)
|
SHMC(交易商户)
|
XQMC(校区名称)
|
RZRQ(入住日期)
|
RZZTMC(入住状态)
|
RXNF(入学年份)
|
YXSMC(院系名称)
|
XZBJMC(行政班级)
|
性别
|
072E4445F0434FB7A7BA89F6A9949FA1
|
20180902
|
-15.8
|
西园三楼
|
华山区
|
0
|
预分配
|
2021
|
数学与信息学院、软件学院
|
21大数据管理与应用2
|
女性
|
9D3B711BB5D00BF3F9CA54CC6F8C438A
|
20180902
|
-19
|
西园三楼
|
华山区
|
20210901
|
已入住
|
2021
|
数学与信息学院、软件学院
|
21计算科学2
|
男性
|
D0C21316C97C0D3E01E98E675E2174B4
|
20180902
|
-9
|
西园三楼
|
华山区
|
20210903
|
已入住
|
2021
|
电子工程学院(人工智能学院)
|
21人工智能2
|
男性
|
……
|
……
|
……
|
……
|
……
|
……
|
……
|
……
|
……
|
……
|
……
|
2AAC1DED73D15944334DEB362B65DDA8
|
20181003
|
-8
|
西园三楼
|
燕山区
|
20210816
|
已入住
|
2019
|
数学与信息学院、软件学院
|
19计算机国际班(国内)1
|
女性
|
4BBA682296436B8B71FBF118C41CE709
|
20181003
|
-16.8
|
西园三楼
|
启林北区
|
20210813
|
已入住
|
2020
|
公共管理学院
|
20公管类7
|
男性
|
32B7E596456EC9A825A3C4D8AFEEF1BA
|
20181003
|
-9
|
西园三楼
|
燕山区
|
20210903
|
已入住
|
2021
|
经济管理学院
|
21金融学(CFA)1
|
女性
|
一卡通流水信息(仅限大赛使用)
3、分析思路
对于一卡通消费数据的研究,主要是通过一卡通消费数据分析学生消费行为规律以及探索消费行为同其他学生行为之间的联系。
基于校园一卡通的消费数据,本研究将探究以下三个问题:
1)分析学生的消费行为;
2)食堂的运营状况,为食堂运营提供建议;
3)构建学生消费细分模型,为学校判定学生的经济状况提供参考意见。
4、数据处理
本文消费行为分析部分所采用的数据主要是已脱敏的消费相关数据,需经过校园数据清理与集成。数据清理主要用于清除噪声,如交易额为负值等部分异常信息。在数据预处理时进行列重命名、检查每列缺失值的占比,对于缺失值过多的列进行删除,便于未来进一步研究、分析及应用。
将学生的校园卡号相关数据.csv、学生校园一卡通进出门禁相关数据.csv、某学校学生校园一卡通食堂消费记录.csv三份文件加载到分析环境,理解字段含义。探查数据质量并进行缺失值和异常值等方面的必要处理,处理结果如下表:
校园卡号
|
性别
|
专业名称
|
门禁卡号
|
流水号
|
校园卡编号
|
消费时间
|
消费金额
|
余额
|
消费次数
|
消费项目编码
|
操作编码
|
消费地点
|
180001
|
男
|
18国际金融
|
19762330
|
117331517
|
20181
|
2019/4/21 18:30
|
7
|
28.4
|
206
|
41
|
249
|
第四食堂
|
180001
|
男
|
18国际金融
|
19762330
|
117341866
|
20181
|
2019/4/22 9:40
|
3.5
|
24.9
|
207
|
19
|
236
|
第一食堂
|
180001
|
男
|
18国际金融
|
19762330
|
117154618
|
20181
|
2019/4/10 16:42
|
11
|
2.7
|
189
|
82
|
18
|
第四食堂
|
…
|
…
|
…
|
……
|
……
|
……
|
……
|
…
|
…
|
…
|
…
|
…
|
…
|
184339
|
女
|
18工业工程
|
11513762
|
117193924
|
20184339
|
2019/4/15 7:27
|
0.6
|
45.9
|
527
|
127
|
204
|
第五食堂
|
184339
|
女
|
18工业工程
|
11513762
|
117195245
|
20184339
|
2019/4/15 13:14
|
6
|
39.9
|
528
|
132
|
204
|
第五食堂
|
184339
|
女
|
18工业工程
|
11513762
|
117212601
|
20184339
|
2019/4/12 15:05
|
0.5
|
58.3
|
521
|
141
|
204
|
第五食堂
|
某校学生校园一卡通食堂消费数据
将学生住宿信息.csv、一卡通流水信息.csv、学生基本信息.csv三份文件加载到分析环境,理解字段含义。探查数据质量并进行缺失值和异常值等方面的必要处理,处理结果如下表:
发端流水号
|
学号
|
流水发生时间
|
交易额
|
交易商户
|
校区名称
|
入住日期
|
入住状态
|
姓名
|
性别
|
院系名称
|
行政班级
|
专业名称
|
219409
|
44E2C30B7EE5BDA3A9072CE1793BFD98
|
20180902
|
-13
|
西园三楼
|
华山区
|
20210813
|
已入住
|
947322E5CED4481FACE372EA5A8C57D7
|
男性
|
兽医学院
|
17动物医学3
|
动物医学
|
219472
|
4CA324EC85189AA947C6D9CD9B62C7BD
|
20180902
|
-9
|
西园三楼
|
华山区
|
20210813
|
已入住
|
1AF9F3720D08F3F5627ACF739BD41655
|
男性
|
兽医学院
|
17动物医学2
|
动物医学
|
219720
|
9F9C5B4CF964931B28BFADA9C07B63E0
|
20180902
|
-6
|
西园三楼
|
华山区
|
20210813
|
已入住
|
BFDC280A376C88FA17B54F9F0F177C85
|
女性
|
水利与土木工程学院
|
17建筑学2
|
建筑学
|
…
|
……
|
…
|
…
|
…
|
…
|
…
|
…
|
……
|
…
|
…
|
…
|
…
|
373224
|
412900E8F6FDB07C85A09DEF344C6C68
|
20181001
|
-8
|
西园三楼
|
华山区
|
20210813
|
已入住
|
0C3743B4ADD8A2FD47F80FBCD3AA42B1
|
男性
|
动物科学学院
|
18动物科学5
|
动物科学
|
373240
|
580589F5B95A12522F6E0AB0BE33CB37
|
20181001
|
-13
|
西园三楼
|
华山区
|
20210813
|
已入住
|
A37CD8ED1D1BB6495C427A4294BE0C3D
|
男性
|
电子工程学院(人工智能学院)
|
18电信2
|
电子信息工程
|
376536
|
A4A3186C8E3F2A8C526A21E6713EE9A3
|
20181003
|
-10
|
西园三楼
|
华山区
|
20210813
|
已入住
|
4121ED20FBB8294CC11C573479976EDB
|
男性
|
电子工程学院(人工智能学院)
|
18电信3
|
电子信息工程
|
住宿信息
5、可视化报告
本文以某高校校园"一卡通“中学生交易流水记录为研究对象,从不同角度、不同深度研究学生在餐厅的就餐规律、消费水平、借阅习惯等内容,可以为学校科学管理、后勤餐饮、图书馆等部门优化资源配置提供科学依据。
通过将挖掘出的学生消费与借阅行为规律同其他行为之间的隐含联系,利用可视化技术,直观地呈现出来,不仅可以方便学校、老师和学生管理工作人员进行相关工作,也可以为辅助他们的决策提供强而有力的数据支撑。
(1)校区、专业对消费行为影响
获得不同校区、专业对学生消费地点影响的结果如下:
聚类类别汇总
聚类类别群体对于所有研究项均呈现出显著性(p<0.05),意味着聚类分析得到的3类群体,他们在研究项(专业名称,校区名称)上的特征具有明显的差异性,具体差异性可通过平均值进行对比,并且最终结合实际情况,对聚类类别进行命名处理。
交叉图
|
项
|
初始聚类中心
|
最终聚类中心
|
cluster_1
|
cluster_2
|
cluster_3
|
cluster_1
|
cluster_2
|
cluster_3
|
专业名称
|
0.850
|
0.377
|
1.676
|
0.709
|
-0.994
|
0.630
|
校区名称
|
-0.393
|
0.162
|
-0.994
|
-0.562
|
-0.408
|
1.422
|
交易商户
|
8.000
|
2.000
|
8.000
|
8.000
|
8.000
|
8.000
|
聚类中心
由以上分析结果可知,兽医学院和水利与土木工程学院等住在华山区的学生倾向于去西园三楼就餐,可能是因为华山区与西园三楼的距离较近;而住在燕山区的工程学院等学生也倾向于去西园三楼,这就说明一方面可能是西园三楼的饭菜较为可口,另一方面可能是工程学院与西园三楼的距离较近;同理,住在启林北的公共管理学院学生去西园三楼就餐也是如此。
此外,由交叉图可以得知学生们去“西园三楼”,“华山西点屋(网关)”,“华山超市”,“西点屋(新)”,“校医院”,“测试部门”,“体育部华山游泳池”,“教务处”,“图书馆流通部”消费的频率依次降低,且“校医院”,“测试部门”,“体育部华山游泳池”,“教务处”,“图书馆流通部”消费频次相对其他交易商户非常少,说明学生们大部分消费用在了“食”,用在运动、就医、其他事务上的消费较少。
以上分析还存在对有交叉重合的地方有缺陷,例如,除去住在华山区的同学们倾向于去西园三楼就餐,住在其他校区但是院楼可能在华山区的同学也由此倾向,尚待进一步分析。
对于我们所做的消费行为分析,未来如果能获得更多更详细的数据集,比如说全校所有交易商户的消费流水等,我们将能进一步减少分析中的误差,对大学生的消费行为有更精准的刻画。
(2)学生年消费总额差异
XGH(学工号)
|
年消费总额
|
C644ED32F02FB079D014A0820827B551
|
-1100
|
954363A8C5A45EBFF38B6A8320B45272
|
-1026.47
|
61C0184ED308AEADE03FA8314E0FF94E
|
-1018
|
D764E38B1BF98333B533E0E4360F175B
|
-1017.46
|
E158B2C312E2FD579A120B48BCF15C5D
|
-1010
|
D13A97E7AC951840532C5F3CA3B0061B
|
-996.6
|
827B267281F167FCE0B7F29A13A25FF2
|
-977
|
9946B06E72AE7598B0B914DB1D34BE3F
|
-946.13
|
0FC9A3EBA95D192979ABFB11A5B6B20A
|
-908.5
|
4E6D9E9CB880F07C6BF18912AC47E116
|
-811.8
|
……
|
A7FA1B8275F4B06E7FD8454FDE1320CA
|
-0.8
|
54FEC17DD3FE85BB0750AC23E764F409
|
-0.7
|
9B006B86D99F0437CA910EB92C339A74
|
-0.63
|
38BE2691819E9F424E6ABD2ACD312D91
|
-0.52
|
CDBB6DB608270025C1F3B7DBF0782073
|
-0.45
|
22FCFFA362FFCB3E490243C40DE17D84
|
-0.3
|
357CBE03C08AEC3706035CB4FB266505
|
-0.2
|
FAD057F8202FE5157CDC84E39B8A80FA
|
-0.2
|
D6D108B6AB43E9F065CE862ACB10B429
|
-0.16
|
955DA95FD386EC807A319A1CA56B8CC2
|
-0.1
|
9EF40205ED647A6EA63F3EBD561CEBA1
|
0
|
1C9C225C3E601CAB9C29D05FD9E155E2
|
0
|
C541AD31C7ED3C9784CC021CA6EBE5D1
|
0
|
4B62B205858053912064889388972C16
|
0
|
1FD95EF8B6C356A4D1C279593E2C0CCC
|
0
|
8443B1FB29B0046999A5AD83D0B97772
|
0
|
学生年消费总额
我们对数据集里的每个学生进行了年消费总额的统计,并进行排序。
虽然这可能是不完全统计,且该数据来自2018年全年,但是仍与我们的认知有偏差。年消费总额最高为1100元,而最低为0元,这其中可能有不常在学校消费的原因,但更多的我们能看到:
第一,学生的家庭社会背景、生活习惯、认知观念等对消费行为的影响是长期的,这导致消费行为本身具有一定的惯性,即便贫困生获得资助后也并不能改变其长期形成的消费习惯。第二,近年来,我国高校贫困生资助体系日益完善,高校也通过设立经济型食堂、经济型窗口等方式满足了贫困生的基本生活需求,根据马斯洛需求层次理论,贫困生尽管获得了额外的资助,但其在食物消费方面的需求已经基本得到了满足,即便获得更多的可支配资金,也不会将其用于增加食堂餐饮消费而是用于基本餐饮之外的其他方面,即实现更高层次的需求。
(3)图书借阅行为分析
- 首先通过学号关系将学生信息与借阅图书信息记录相对应,并计算其学生的绩点,形成学生借阅图书与学生绩点关系列表;
- 接着根据成绩降序排序,并筛选出学生成绩绩点在4.0以上的学生借的图书;
- 再次在华南农业大学图书馆中查询对应图书的图分类号以及相应的类别。形成学生成绩与借阅图书类别的列表;
- 最后通过借阅图书类别饼状图进行分析;
- 成绩与借阅关联饼状图
结论:通过分析可知课程成绩绩点较高的学生所借阅的大多数书籍和其专业相关,根据有无关联的可视化图表可以看出有多大比例成绩好的借书和专业有关。
(类别的饼图 据此进一步分析,我们推荐图书如下 )
推荐图书页面图
(4)食堂就餐行为分析
http://localhost:37799/webroot/decision/link/LHyE
http://localhost:37799/webroot/decision/link/dR8T
http://localhost:37799/webroot/decision/link/1kYc
食堂消费统计分析主要包括每日就餐、就餐高峰期和食堂的统计分析。通过对食堂消费的统计分析,挖掘出食堂就餐次数、早午晚餐高峰期时间等特征属性所满足的消费行为规律。
首先绘制各食堂就餐人次的占比饼图,分析学生早中晚餐的就餐地点是否有显著差别。(提示:时间间隔非常接近的多次刷卡记录可能为一次就餐行为)
各食堂就餐人次的占比饼图
由图5可知,该校学生早中晚餐的就餐地点以食堂2最多,其次是食堂5,最少的食堂3,食堂1和3较为接近。
其最可能的原因是食堂2和5的位置靠近教学楼和住宿楼,可见,为方便学生的学习和生活,应当将食堂位置规划在教学楼或者宿舍楼附近。
通过食堂刷卡记录,分别绘制工作日和非工作日食堂就餐时间曲线图,分析食堂早中晚餐的就餐峰值。
工作日消费曲线图
非工作日消费曲线图
由图6可知,该校学生的就餐时间在11:00时达到顶峰近50000次,也就是午饭时间,其次是7:00,即早餐时间近40000次,再次是18:00,达到约25000次,即晚餐时间。除此之外,在上午9:00会有个早午餐的小高峰,而在晚餐时间之后,21:00也会达到夜宵的小高峰。
由图7可知,非工作日的就餐时间相对没有工作日那么集中,早午晚饭的就餐时间分散至约4小时。可以分析得知,非工作日有部分同学睡懒觉到10:00左右,然后去吃午餐,还有一部分同学保持工作日的作息,一日三餐都照常去食堂,同时这部分同学的人数相对较多。
根据上述分析的结果,为食堂的运营提供建议如下——
应在6:00开放售卖早餐,到7:00加派工作人员和餐食,提高食堂工作效率,到9:30左右,减少工作人员,可以让这部分人员去准备午餐工作,留少量售卖人员,同时,早餐售卖时间至10:00。
午餐应不间歇的从10:00开始售卖,但开始的时候只需要少部分窗口开放,其他窗口继续准备午餐,直至11:00所有窗口开放,所有工作人员上岗,直到13:00结束午餐营业。
建议食堂在非工作日的下午13:00-16:00售卖下午茶点,同样只需要少部分窗口开放,而其他工作人员则去准备晚餐。
晚餐在16:00开始营业,慢慢的开放至18:00,所有窗口都开始营业,过了19:00开始慢慢减少窗口,并开始准备夜宵,20:00-23:00进行夜宵售卖。
(5)专业消费差异分析
http://localhost:37799/webroot/decision/link/rdzt
http://localhost:37799/webroot/decision/link/x8Hm
http://localhost:37799/webroot/decision/link/7NDd
根据学生的整体校园消费数据,计算本月人均刷卡频次和人均消费额,分析不同专业间不同性别学生群体的消费特点。
- 专业名称-月消费金额总额
从图中可以看出,各个专业学生一卡通消费次数和消费金额具有一定差异,其中月消费额最大值为18机械制造专业,前五分别是18机械制造、18连锁经营、18软件技术、18会计、18宝玉石鉴定,而18模具设计虽为第六,但也在30000以上。
同时,由于该图表的纵坐标为月消费金额总额,还需考虑到专业人数的影响,所以制作下列图表,如图9:
- 专业名称-专业人均月消费
由专业月消费金额总额除以专业人数,得到的专业人均月消费,结合图9,可以最大程度消除专业人数对于专业和消费水平的影响。得到结果为:其中人均月消费额最大值为18机械制造专业(学徒),前五分别是18机械制造(学徒)、18模具技术、18电气自动化、18汽车检测、18视觉传播,而18机械制造、18工业机器人、18计算机应用、18建筑设计虽只排到前十,但也在300以上。
除此之外,专业人均月消费最低的是18艺术设计,不到200,其次是18市场营销,再次是18国际金融,而18金融管理、18首饰设计、18会计、18审计、18市政工程、18国贸实务专业专业人均月消费都不到250;就月消费金额总额来看,最低的是18机械制造(学徒),其次是18市政工程,再次是18环境艺术,而18视觉传播、18产品艺术、18物流管理、18首饰设计、18动漫设计、18艺术设计专业月消费金额总额都不到15000。
由于在进行专业对消费行为的影响分析时,没有实现完全消除专业人数对于消费情况的影响,所以提取具有代表性的8个专业,加以“专业人均月消费”类目,以进一步刻画学生消费行为。
专业名称
|
消费金额总额
|
专业人数
|
专业人均月消费
|
18机械制造
|
39972.54
|
127
|
314.7444
|
18会计
|
33927.26
|
139
|
244.081
|
18模具设计
|
31851
|
89
|
357.8764
|
18艺术设计
|
14948.4
|
76
|
196.6895
|
18首饰设计
|
12088.5
|
50
|
241.77
|
18视觉传播
|
10708.89
|
33
|
324.5118
|
18市政工程
|
7367.65
|
30
|
245.5883
|
18机械制造(学徒)
|
5438
|
14
|
388.4286
|
- 专业消费差异分析聚类数据集
- 专业消费差异分析
- 月均消费金额区间人数分布
综合来看,18机械制造(学徒)专业人均月消费额较大,但月消费金额总额较低,显然是由于该专业人数仅有14人造成的,18视觉传播专业同理。同样的可以推测,18市政工程专业的专业人均月消费和月消费金额总额都较低,可能是该专业女生较多,饭量较小,亦或是该专业的学生相对较节俭,18首饰设计、18艺术设计专业同理。需要注意的是,该数据集仅仅包含食堂月消费金额,所以以上结论仅为推测。
而18机械制造专业的学生月消费金额总额最大,可能原因有三点,一则18机械制造的学生家庭环境经济条件都比较好,学生的生活费比较富裕;二则18机械制造的学生培养方案独立,学生学习任务相比其他专业的学生较重,所以学生的三餐日均消费水平都较其他学院更高。
考虑到并非全部学生都在学校食堂就餐,而校园一卡通目前只能记录学生在学校食堂的消费情况,无法记录学生在校外就餐或网上订餐的情况,所以进一步更详尽的分析需要获得更多数据集。
(6)性别差异分析
为了研究性别对于大学生校园一卡通消费的影响,对获得的数据进行了处理,获得更容易分析性别差异的数据集,如下图所示。
- 性别-消费次数次数统计
- 性别-消费金额次数统计
由表8-9可知,月消费金额和月消费次数,男生均高于女生。这表明男生在食量上确实大于女生。综上所述,在进行学生消费水平挖掘分析时,把性别作为特征属性是合理必要的。
三、参赛总结
1、FineBI工具
通过数据分析看板,可以直观发现、分析、预警数据中所隐藏的问题,及时应对业务中的风险,发现增长点;通过自助数据集功能,普通业务人员就能对数据做筛选、切割、排序、汇总等,自助灵活地达成期望的数据结果。
2、参赛总结
- FineBI极易上手,通过鼠标点击和拖拽即可完成分析,对于新手用户,也能30min内制作出数据报表。
- 感恩的事儿:数据分析给个人或业务团队的成长带来的帮助。
- 遇到的人儿:团队协作或者参赛交流中遇到志同道合的小伙伴。
- 认知新感悟:对于作品有了新的突破和尝试。
|