【2022BI数据分析大赛】基于校园消费与借阅数据的大学生行为分析

楼主
我是社区第1129187位番薯,欢迎点我头像关注我哦~

一、选手简介

1、选手介绍

(1)团队选手版

  • 团队名称:兴盛永威明
  • 队长介绍:胡文馨,目前就读于华南农业大学数学与信息学院,是2020级工业工程与管理专业的研究生,个人感兴趣的方向和领域-数据分析等。
  • 成员介绍:廖世盛、霍钊威、谢志明、韩咏林。以上四人与队长皆就读于华南农业大学数学与信息学院,是2020级工业工程与管理专业的研究生,且来自同一实验室。
  • 团队组成:同班同学,来自同一个实验室。
  • 团队照片:

 

2、参赛初衷
  • 简单介绍下参赛的初衷——

希望通过比赛实践提升BI工具的使用方法和技巧;和更多大神交流学习,进行数据可视化作品以及分析思维的激烈碰撞;大赛奖励很诱人;希望能借此比赛对作品能有进一步的提升和完善。

 

二、作品介绍

1、业务背景/需求痛点

【目的】

为进一步提升高校的智慧管理水平,更好服务广大学生群体。

【方法】

我们以某高校校园一卡通消费记录为数据基础,利用大数据和数据挖掘技术对其展开分析研究,充分挖掘学生消费行为背后的隐藏信息。通过对提取数据进行预处理和特征工程,统计分析学生的消费水平和消费习惯,深度分析不同群体的消费行为特征。

【结论】

通过将挖掘出的学生消费规律同其他行为之间的隐含联系,利用可视化技术,直观地呈现出来,不仅可以方便学校、老师和学生管理工作人员进行相关工作,也可以为辅助他们的决策提供强而有力的数据支撑。

【需求分析】

在信息化大背景下,随着校园人数越来越多,校园管理不断朝现代化方向靠拢,管理方式呈多样化发展,智慧校园建设已经在大学中全面开展。其中,校园一卡通对校园管理的现代化起着重要作用,在高校中的应用已经日趋成熟,是学校师生不可或缺的“通行证”,是校园数字化管理的重要组成部分,也是智慧校园建设的核心,学校与学生之间信息交互的纽带。校园一卡通为学校师生提供了诸多便利,也产生了海量数据,据信息涵盖了餐饮、门禁记录等。由于这些数据信息是学生自己使用产生的,所以对这些信息的研究分析有助于学校了解学生的需求和选择,更有助于学校的建设和管理。

随着数据化校园建设不断深入,积极落实国家精准扶贫政策的要求,高校借助大数据平台建立起了对家庭困难学生进行“隐形资助”模式。即在学校资助实施的过程中,学校根据学生近期在学校食堂用餐期间校园卡消费较低的情况,自主非公开化向贫困学生校园卡内定期打入一定金额的资金补贴,也称为“隐形补助”或者“隐形餐卡补贴”。如何更加准确、有效的获得确需帮助的学生信息,对高校的智慧管理提出了不小考验。

 

2、数据来源
  • 自选数据:用了哪些数据表,表含义简述

学生人员基本信息、选课记录、住宿信息、一卡通消费流水信息、等。

消费行为分析用到学生人员基本信息、住宿信息和一卡通消费流水信息,现用python将其加载到分析环境,尚未分析的数据部分如下:

XH(学号)

XM(姓名)

XB(性别)

ZZMMMC(政治面貌)

DQZT(当前状态)

RXNF(入学年份)

YXSMC(院系名称)

XZBJMC(行政班级)

ZYMC(专业名称)

7FFC46689CA9F9C3B7E4807191CE9EEC

6D3C64B8E79460A7BF07E99FE48ADCDA

女性

团员

在读

2017

食品学院

19食品营养2

食品科学与工程

0E64078811A084ECD9D11CF0C6BBAA41

EFABB4BDC70D9EFFC367B7E1333E00B3

男性

团员

在读

2017

数学与信息学院、软件学院

17计算机1

计算机科学与技术

6335C7E05DD850DA11B55313AE3A1CB2

91AB05B3CD529E241ED235682A016297

女性

群众

在读

2017

兽医学院

17动物医学1

动物医学

……

……

……

……

……

……

……

……

CD52C95E150EAF36E1DC9F94D1D57676

CF89A2D20A69E46BF4CCEA9C7A8E4CA2

女性

团员

在读

2021

数学与信息学院、软件学院

21计算科学1

信息与计算科学

5BBDF030FA68067D0AA81CFDFA937478

0665B23EC666F0F4CC0E323346DE9D2A

男性

群众

在读

2021

数学与信息学院、软件学院

21计算科学1

信息与计算科学

4D2353962F4B833EA86FAE44B4270E18

F9633B32201E2566A73BCD0C8D1275E2

男性

团员

在读

2021

数学与信息学院、软件学院

21信管4

信息管理与信息系统

学生基本信息(仅限大赛使用)

XH(学号)

XQMC(校区名称)

RZRQ(入住日期)

RZZTMC(入住状态)

6B5812DF3126C9AA14292E6007E281BF

华山区

20210223

已入住

9907FC31D33536AC8E8BB470741E98EA

华山区

20210223

已入住

235855F03BFD7F5A871B02E79ACBB77F

华山区

20210813

已入住

……

……

……

……

5A0DF1A299E4949FE8C59A5FD3621769

华山区

20210903

已入住

9B52856F13EFE6850EFF26117A707338

燕山区

20210901

已入住

09B13222DD1F45AFEC8441AD84716046

华山区

20210901

已入住

学生住宿信息(仅限大赛使用)

XGH(学工号)

LSFSSJ(流水发生时间)

JYE(交易额)

SHMC(交易商户)

XQMC(校区名称)

RZRQ(入住日期)

RZZTMC(入住状态)

RXNF(入学年份)

YXSMC(院系名称)

XZBJMC(行政班级)

性别

072E4445F0434FB7A7BA89F6A9949FA1

20180902

-15.8

西园三楼

华山区

0

预分配

2021

数学与信息学院、软件学院

21大数据管理与应用2

女性

9D3B711BB5D00BF3F9CA54CC6F8C438A

20180902

-19

西园三楼

华山区

20210901

已入住

2021

数学与信息学院、软件学院

21计算科学2

男性

D0C21316C97C0D3E01E98E675E2174B4

20180902

-9

西园三楼

华山区

20210903

已入住

2021

电子工程学院(人工智能学院)

21人工智能2

男性

……

……

……

……

……

……

……

……

……

……

……

2AAC1DED73D15944334DEB362B65DDA8

20181003

-8

西园三楼

燕山区

20210816

已入住

2019

数学与信息学院、软件学院

19计算机国际班(国内)1

女性

4BBA682296436B8B71FBF118C41CE709

20181003

-16.8

西园三楼

启林北区

20210813

已入住

2020

公共管理学院

20公管类7

男性

32B7E596456EC9A825A3C4D8AFEEF1BA

20181003

-9

西园三楼

燕山区

20210903

已入住

2021

经济管理学院

21金融学(CFA)1

女性

一卡通流水信息(仅限大赛使用)

 

3、分析思路

对于一卡通消费数据的研究,主要是通过一卡通消费数据分析学生消费行为规律以及探索消费行为同其他学生行为之间的联系。

基于校园一卡通的消费数据,本研究将探究以下三个问题:

1)分析学生的消费行为;

2)食堂的运营状况,为食堂运营提供建议;

3)构建学生消费细分模型,为学校判定学生的经济状况提供参考意见。

 

4、数据处理

本文消费行为分析部分所采用的数据主要是已脱敏的消费相关数据,需经过校园数据清理与集成。数据清理主要用于清除噪声,如交易额为负值等部分异常信息。在数据预处理时进行列重命名、检查每列缺失值的占比,对于缺失值过多的列进行删除,便于未来进一步研究、分析及应用。

将学生的校园卡号相关数据.csv、学生校园一卡通进出门禁相关数据.csv、某学校学生校园一卡通食堂消费记录.csv三份文件加载到分析环境,理解字段含义。探查数据质量并进行缺失值和异常值等方面的必要处理,处理结果如下表:

校园卡号

性别

专业名称

门禁卡号

流水号

校园卡编号

消费时间

消费金额

余额

消费次数

消费项目编码

操作编码

消费地点

180001

18国际金融

19762330

117331517

20181

2019/4/21 18:30

7

28.4

206

41

249

第四食堂

180001

18国际金融

19762330

117341866

20181

2019/4/22 9:40

3.5

24.9

207

19

236

第一食堂

180001

18国际金融

19762330

117154618

20181

2019/4/10 16:42

11

2.7

189

82

18

第四食堂

……

……

……

……

184339

18工业工程

11513762

117193924

20184339

2019/4/15 7:27

0.6

45.9

527

127

204

第五食堂

184339

18工业工程

11513762

117195245

20184339

2019/4/15 13:14

6

39.9

528

132

204

第五食堂

184339

18工业工程

11513762

117212601

20184339

2019/4/12 15:05

0.5

58.3

521

141

204

第五食堂

某校学生校园一卡通食堂消费数据

将学生住宿信息.csv、一卡通流水信息.csv、学生基本信息.csv三份文件加载到分析环境,理解字段含义。探查数据质量并进行缺失值和异常值等方面的必要处理,处理结果如下表:

发端流水号

学号

流水发生时间

交易额

交易商户

校区名称

入住日期

入住状态

姓名

性别

院系名称

行政班级

专业名称

219409

44E2C30B7EE5BDA3A9072CE1793BFD98

20180902

-13

西园三楼

华山区

20210813

已入住

947322E5CED4481FACE372EA5A8C57D7

男性

兽医学院

17动物医学3

动物医学

219472

4CA324EC85189AA947C6D9CD9B62C7BD

20180902

-9

西园三楼

华山区

20210813

已入住

1AF9F3720D08F3F5627ACF739BD41655

男性

兽医学院

17动物医学2

动物医学

219720

9F9C5B4CF964931B28BFADA9C07B63E0

20180902

-6

西园三楼

华山区

20210813

已入住

BFDC280A376C88FA17B54F9F0F177C85

女性

水利与土木工程学院

17建筑学2

建筑学

……

……

373224

412900E8F6FDB07C85A09DEF344C6C68

20181001

-8

西园三楼

华山区

20210813

已入住

0C3743B4ADD8A2FD47F80FBCD3AA42B1

男性

动物科学学院

18动物科学5

动物科学

373240

580589F5B95A12522F6E0AB0BE33CB37

20181001

-13

西园三楼

华山区

20210813

已入住

A37CD8ED1D1BB6495C427A4294BE0C3D

男性

电子工程学院(人工智能学院)

18电信2

电子信息工程

376536

A4A3186C8E3F2A8C526A21E6713EE9A3

20181003

-10

西园三楼

华山区

20210813

已入住

4121ED20FBB8294CC11C573479976EDB

男性

电子工程学院(人工智能学院)

18电信3

电子信息工程

住宿信息

 

5、可视化报告

本文以某高校校园"一卡通“中学生交易流水记录为研究对象,从不同角度、不同深度研究学生在餐厅的就餐规律、消费水平、借阅习惯等内容,可以为学校科学管理、后勤餐饮、图书馆等部门优化资源配置提供科学依据。

通过将挖掘出的学生消费与借阅行为规律同其他行为之间的隐含联系,利用可视化技术,直观地呈现出来,不仅可以方便学校、老师和学生管理工作人员进行相关工作,也可以为辅助他们的决策提供强而有力的数据支撑。

(1)校区、专业对消费行为影响

获得不同校区、专业对学生消费地点影响的结果如下:

聚类类别汇总

聚类类别群体对于所有研究项均呈现出显著性(p<0.05),意味着聚类分析得到的3类群体,他们在研究项(专业名称,校区名称)上的特征具有明显的差异性,具体差异性可通过平均值进行对比,并且最终结合实际情况,对聚类类别进行命名处理。

交叉图

 

初始聚类中心

最终聚类中心

cluster_1

cluster_2

cluster_3

cluster_1

cluster_2

cluster_3

专业名称

0.850

0.377

1.676

0.709

-0.994

0.630

校区名称

-0.393

0.162

-0.994

-0.562

-0.408

1.422

交易商户

8.000

2.000

8.000

8.000

8.000

8.000

聚类中心

由以上分析结果可知,兽医学院和水利与土木工程学院等住在华山区的学生倾向于去西园三楼就餐,可能是因为华山区与西园三楼的距离较近;而住在燕山区的工程学院等学生也倾向于去西园三楼,这就说明一方面可能是西园三楼的饭菜较为可口,另一方面可能是工程学院与西园三楼的距离较近;同理,住在启林北的公共管理学院学生去西园三楼就餐也是如此。

此外,由交叉图可以得知学生们去“西园三楼”,“华山西点屋(网关)”,“华山超市”,“西点屋(新)”,“校医院”,“测试部门”,“体育部华山游泳池”,“教务处”,“图书馆流通部”消费的频率依次降低,且“校医院”,“测试部门”,“体育部华山游泳池”,“教务处”,“图书馆流通部”消费频次相对其他交易商户非常少,说明学生们大部分消费用在了“食”,用在运动、就医、其他事务上的消费较少。

以上分析还存在对有交叉重合的地方有缺陷,例如,除去住在华山区的同学们倾向于去西园三楼就餐,住在其他校区但是院楼可能在华山区的同学也由此倾向,尚待进一步分析。

对于我们所做的消费行为分析,未来如果能获得更多更详细的数据集,比如说全校所有交易商户的消费流水等,我们将能进一步减少分析中的误差,对大学生的消费行为有更精准的刻画。

(2)学生年消费总额差异

XGH(学工号)

年消费总额

C644ED32F02FB079D014A0820827B551

-1100

954363A8C5A45EBFF38B6A8320B45272

-1026.47

61C0184ED308AEADE03FA8314E0FF94E

-1018

D764E38B1BF98333B533E0E4360F175B

-1017.46

E158B2C312E2FD579A120B48BCF15C5D

-1010

D13A97E7AC951840532C5F3CA3B0061B

-996.6

827B267281F167FCE0B7F29A13A25FF2

-977

9946B06E72AE7598B0B914DB1D34BE3F

-946.13

0FC9A3EBA95D192979ABFB11A5B6B20A

-908.5

4E6D9E9CB880F07C6BF18912AC47E116

-811.8

……

A7FA1B8275F4B06E7FD8454FDE1320CA

-0.8

54FEC17DD3FE85BB0750AC23E764F409

-0.7

9B006B86D99F0437CA910EB92C339A74

-0.63

38BE2691819E9F424E6ABD2ACD312D91

-0.52

CDBB6DB608270025C1F3B7DBF0782073

-0.45

22FCFFA362FFCB3E490243C40DE17D84

-0.3

357CBE03C08AEC3706035CB4FB266505

-0.2

FAD057F8202FE5157CDC84E39B8A80FA

-0.2

D6D108B6AB43E9F065CE862ACB10B429

-0.16

955DA95FD386EC807A319A1CA56B8CC2

-0.1

9EF40205ED647A6EA63F3EBD561CEBA1

0

1C9C225C3E601CAB9C29D05FD9E155E2

0

C541AD31C7ED3C9784CC021CA6EBE5D1

0

4B62B205858053912064889388972C16

0

1FD95EF8B6C356A4D1C279593E2C0CCC

0

8443B1FB29B0046999A5AD83D0B97772

0

学生年消费总额

我们对数据集里的每个学生进行了年消费总额的统计,并进行排序。

虽然这可能是不完全统计,且该数据来自2018年全年,但是仍与我们的认知有偏差。年消费总额最高为1100元,而最低为0元,这其中可能有不常在学校消费的原因,但更多的我们能看到:

第一,学生的家庭社会背景、生活习惯、认知观念等对消费行为的影响是长期的,这导致消费行为本身具有一定的惯性,即便贫困生获得资助后也并不能改变其长期形成的消费习惯。第二,近年来,我国高校贫困生资助体系日益完善,高校也通过设立经济型食堂、经济型窗口等方式满足了贫困生的基本生活需求,根据马斯洛需求层次理论,贫困生尽管获得了额外的资助,但其在食物消费方面的需求已经基本得到了满足,即便获得更多的可支配资金,也不会将其用于增加食堂餐饮消费而是用于基本餐饮之外的其他方面,即实现更高层次的需求。

(3)图书借阅行为分析
  1. 首先通过学号关系将学生信息与借阅图书信息记录相对应,并计算其学生的绩点,形成学生借阅图书与学生绩点关系列表;
  2. 接着根据成绩降序排序,并筛选出学生成绩绩点在4.0以上的学生借的图书;
  3. 再次在华南农业大学图书馆中查询对应图书的图分类号以及相应的类别。形成学生成绩与借阅图书类别的列表;
  4. 最后通过借阅图书类别饼状图进行分析;
  5. 成绩与借阅关联饼状图

结论:通过分析可知课程成绩绩点较高的学生所借阅的大多数书籍和其专业相关,根据有无关联的可视化图表可以看出有多大比例成绩好的借书和专业有关。

(类别的饼图 据此进一步分析,我们推荐图书如下 )

推荐图书页面图

(4)食堂就餐行为分析

http://localhost:37799/webroot/decision/link/LHyE

http://localhost:37799/webroot/decision/link/dR8T

http://localhost:37799/webroot/decision/link/1kYc

食堂消费统计分析主要包括每日就餐、就餐高峰期和食堂的统计分析。通过对食堂消费的统计分析,挖掘出食堂就餐次数、早午晚餐高峰期时间等特征属性所满足的消费行为规律。

首先绘制各食堂就餐人次的占比饼图,分析学生早中晚餐的就餐地点是否有显著差别。(提示:时间间隔非常接近的多次刷卡记录可能为一次就餐行为)

各食堂就餐人次的占比饼图

由图5可知,该校学生早中晚餐的就餐地点以食堂2最多,其次是食堂5,最少的食堂3,食堂1和3较为接近。

其最可能的原因是食堂2和5的位置靠近教学楼和住宿楼,可见,为方便学生的学习和生活,应当将食堂位置规划在教学楼或者宿舍楼附近。

通过食堂刷卡记录,分别绘制工作日和非工作日食堂就餐时间曲线图,分析食堂早中晚餐的就餐峰值。

工作日消费曲线图

非工作日消费曲线图

由图6可知,该校学生的就餐时间在11:00时达到顶峰近50000次,也就是午饭时间,其次是7:00,即早餐时间近40000次,再次是18:00,达到约25000次,即晚餐时间。除此之外,在上午9:00会有个早午餐的小高峰,而在晚餐时间之后,21:00也会达到夜宵的小高峰。

由图7可知,非工作日的就餐时间相对没有工作日那么集中,早午晚饭的就餐时间分散至约4小时。可以分析得知,非工作日有部分同学睡懒觉到10:00左右,然后去吃午餐,还有一部分同学保持工作日的作息,一日三餐都照常去食堂,同时这部分同学的人数相对较多。

根据上述分析的结果,为食堂的运营提供建议如下——

应在6:00开放售卖早餐,到7:00加派工作人员和餐食,提高食堂工作效率,到9:30左右,减少工作人员,可以让这部分人员去准备午餐工作,留少量售卖人员,同时,早餐售卖时间至10:00。

午餐应不间歇的从10:00开始售卖,但开始的时候只需要少部分窗口开放,其他窗口继续准备午餐,直至11:00所有窗口开放,所有工作人员上岗,直到13:00结束午餐营业。

建议食堂在非工作日的下午13:00-16:00售卖下午茶点,同样只需要少部分窗口开放,而其他工作人员则去准备晚餐。

晚餐在16:00开始营业,慢慢的开放至18:00,所有窗口都开始营业,过了19:00开始慢慢减少窗口,并开始准备夜宵,20:00-23:00进行夜宵售卖。

(5)专业消费差异分析

http://localhost:37799/webroot/decision/link/rdzt

http://localhost:37799/webroot/decision/link/x8Hm

http://localhost:37799/webroot/decision/link/7NDd

根据学生的整体校园消费数据,计算本月人均刷卡频次和人均消费额,分析不同专业间不同性别学生群体的消费特点。

  1. 专业名称-月消费金额总额

从图中可以看出,各个专业学生一卡通消费次数和消费金额具有一定差异,其中月消费额最大值为18机械制造专业,前五分别是18机械制造、18连锁经营、18软件技术、18会计、18宝玉石鉴定,而18模具设计虽为第六,但也在30000以上。

同时,由于该图表的纵坐标为月消费金额总额,还需考虑到专业人数的影响,所以制作下列图表,如图9:

  1. 专业名称-专业人均月消费

由专业月消费金额总额除以专业人数,得到的专业人均月消费,结合图9,可以最大程度消除专业人数对于专业和消费水平的影响。得到结果为:其中人均月消费额最大值为18机械制造专业(学徒),前五分别是18机械制造(学徒)、18模具技术、18电气自动化、18汽车检测、18视觉传播,而18机械制造、18工业机器人、18计算机应用、18建筑设计虽只排到前十,但也在300以上。

除此之外,专业人均月消费最低的是18艺术设计,不到200,其次是18市场营销,再次是18国际金融,而18金融管理、18首饰设计、18会计、18审计、18市政工程、18国贸实务专业专业人均月消费都不到250;就月消费金额总额来看,最低的是18机械制造(学徒),其次是18市政工程,再次是18环境艺术,而18视觉传播、18产品艺术、18物流管理、18首饰设计、18动漫设计、18艺术设计专业月消费金额总额都不到15000。

由于在进行专业对消费行为的影响分析时,没有实现完全消除专业人数对于消费情况的影响,所以提取具有代表性的8个专业,加以“专业人均月消费”类目,以进一步刻画学生消费行为。

专业名称

消费金额总额

专业人数

专业人均月消费

18机械制造

39972.54

127

314.7444

18会计

33927.26

139

244.081

18模具设计

31851

89

357.8764

18艺术设计

14948.4

76

196.6895

18首饰设计

12088.5

50

241.77

18视觉传播

10708.89

33

324.5118

18市政工程

7367.65

30

245.5883

18机械制造(学徒)

5438

14

388.4286

  1. 专业消费差异分析聚类数据集

  1. 专业消费差异分析
  2. 月均消费金额区间人数分布

综合来看,18机械制造(学徒)专业人均月消费额较大,但月消费金额总额较低,显然是由于该专业人数仅有14人造成的,18视觉传播专业同理。同样的可以推测,18市政工程专业的专业人均月消费和月消费金额总额都较低,可能是该专业女生较多,饭量较小,亦或是该专业的学生相对较节俭,18首饰设计、18艺术设计专业同理。需要注意的是,该数据集仅仅包含食堂月消费金额,所以以上结论仅为推测。

而18机械制造专业的学生月消费金额总额最大,可能原因有三点,一则18机械制造的学生家庭环境经济条件都比较好,学生的生活费比较富裕;二则18机械制造的学生培养方案独立,学生学习任务相比其他专业的学生较重,所以学生的三餐日均消费水平都较其他学院更高。

考虑到并非全部学生都在学校食堂就餐,而校园一卡通目前只能记录学生在学校食堂的消费情况,无法记录学生在校外就餐或网上订餐的情况,所以进一步更详尽的分析需要获得更多数据集。

(6)性别差异分析

为了研究性别对于大学生校园一卡通消费的影响,对获得的数据进行了处理,获得更容易分析性别差异的数据集,如下图所示。

  1. 性别-消费次数次数统计

  1. 性别-消费金额次数统计

由表8-9可知,月消费金额和月消费次数,男生均高于女生。这表明男生在食量上确实大于女生。综上所述,在进行学生消费水平挖掘分析时,把性别作为特征属性是合理必要的。

 

三、参赛总结

1、FineBI工具
  • 对BI工具的看法:

通过数据分析看板,可以直观发现、分析、预警数据中所隐藏的问题,及时应对业务中的风险,发现增长点;通过自助数据集功能,普通业务人员就能对数据做筛选、切割、排序、汇总等,自助灵活地达成期望的数据结果。

 

2、参赛总结
  • FineBI极易上手,通过鼠标点击和拖拽即可完成分析,对于新手用户,也能30min内制作出数据报表。
  • 感恩的事儿:数据分析给个人或业务团队的成长带来的帮助。
  • 遇到的人儿:团队协作或者参赛交流中遇到志同道合的小伙伴。
  • 认知新感悟:对于作品有了新的突破和尝试。
分享扩散:

沙发
发表于 2022-5-14 08:54:37

案例打卡:在学校的时候听说过:学校通过分析同学一卡通的消费情况(食堂消费次数、消费金额)定位到需要帮助的同学,并给他们打补助。我想这就是数据分析的意义吧,其目的是解决问题。作品的主题很有意义,图表可视化展示方面可以再优化,同学们加油!

参与人数 +1 F币 +6 理由
帆软苏茜 + 6 有效打卡奖励

查看全部评分

板凳
发表于 2022-5-16 10:47:03
这个必须在学校吃饭分析才准确,建议介绍一下数据清洗的过程,可能这个分析对校园的食堂和图书管理员更有帮助,谢谢分享
参与人数 +1 F币 +1 理由
帆软苏茜 + 1 有效打卡奖励

查看全部评分

地板
发表于 2022-5-17 00:18:48
数据清理主要用于清除噪声,如交易额为负值等部分异常信息。在数据预处理时进行列重命名、检查每列缺失值的占比。看到这句话就想到数据挖掘的比赛了哈哈哈
参与人数 +1 F币 +1 理由
帆软苏茜 + 1 有效打卡奖励

查看全部评分

5楼
发表于 2022-5-25 17:58:40
选题蛮不错的,可视化细节可以再优化下;看完第一感觉是专业的月人均消费居然不高。。。也可能是脱敏的影响?另外,华农的酸奶超好喝啊~
参与人数 +1 F币 +1 理由
帆软苏茜 + 1 有效打卡奖励

查看全部评分

6楼
发表于 2022-5-30 10:51:08
案例打卡:整体的分析逻辑让想起了上大学的时候,不过主题的学生行为通过用户画像来表现。是否更好
参与人数 +1 F币 +1 理由
帆软苏茜 + 1 有效打卡奖励

查看全部评分

7楼
发表于 2022-5-30 22:36:22
案例打卡:选题非常的感兴趣,更准确了解到了大家吃饭的画像,可以避开饭点?哈哈哈,没想到人均月消费可以差这么多。仪表盘整体展示效果会更好~
参与人数 +1 F币 +1 理由
帆软苏茜 + 1 有效打卡奖励

查看全部评分

8楼
发表于 2022-5-31 15:34:45
选题很不错的,但对于具体影响消费金额高低的相关性要素分析不够全面,简单的通过次数和食量大小进行相关性分析带有片面性.
参与人数 +1 F币 +1 理由
帆软苏茜 + 1 有效打卡奖励

查看全部评分

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

7回帖数 1关注人数 5965浏览人数
最后回复于:2022-5-31 15:34

返回顶部 返回列表