【2023BI数据分析大赛】利昂内尔·梅西俱乐部生涯进球分析
利昂内尔·梅西俱乐部生涯进球分析
本作品根据专业足球网站的数据,对阿根廷足球运动员利昂内尔·安德烈斯·梅西·库奇蒂尼的俱乐部生涯进行总结
一、个人介绍
1.个人简介
大三一般在校生,铁血阿萨球迷,梅西人迷。
2.参赛初衷
希望通过比赛实践提升BI工具的使用方法和技巧。
和更多FineBI大神交流学习,进行数据可视化作品以及分析思维的激烈碰撞。
多掌握一方面的知识,对未来考研就业都有好处。
让更多人了解梅西和我们的球迷群体,宣传球迷文化,培养中国的足球环境,为中国足球发展做贡献。
二、作品介绍
1.业务背景
2022世界杯,梅西率领的阿根廷队获得冠军,梅西加冕球王,由于国内自媒体的发展,全国有上亿观众从各种渠道了解到世界杯的消息,对球员希望有更深的了解。
2.需求痛点
首先,足球数据复杂难以判断,只能在权威机构德转等平台寻找,有些复杂到平台都没有的数据还需要自己看录像查资料分析;其次,数据量巨大,分析思路需要筛选有用信息后,再进行初步分析;再次,网络上误导信息多,由于现阶段网络上某些运动员团队营销造势,很难对现有数据进行验证分析;然后,由于现阶段中国国内足球氛围差,对足球相关事务理解执行偏激,很打击积极性和可行性;最后,合理方案的得出需要结合实际,给出意见。
3.数据来源
自选数据:来自德国转会市场网站(https://www.transfermarkt.co.uk/)
抓取2003-04赛季至2022-23赛季(截止到8月13日)梅西俱乐部比赛数据。
字段名
含义
Season
赛季
Competition
比赛类型
Matchday
比赛轮次
Date
日期
Venue
主客场状态
For
效力球队
Opponent
对手
Result
比赛结果
Pos.
场上位置
Minute
进球时间
At score
进球后比分
Type of goal
进球方式
Goal assist
助攻队员
X
定位进球位置坐标
Y
其中,X,Y定位进球位置的坐标具体为:(半场设置为6×5的区域)
LW (0.5,2.5)
AM (3,1)
CF (3,3.5)
RW (5.5,2.5)
SS (3,2.5)
4.分析思路
5.数据处理
进球位置的处理
(1)针对在收集数据时出现的一些异常情况,首先新建赋值列,对“Pos.”字段中的相同内容进行合并
(2)利用分组汇总计算相应的进球和位置
(3)新建组件。选择散点图
其中,颜色设置为“位置”,大小与“进球数”相关。
(4)在“组件样式”中:背景
组件背景设定为自定义图片,选择为一张上传的足球场半场绘图。
进球时间的处理
(1)过滤,由于在收集的进球数据中存在补时和加时赛等传统意义上并不记入比赛常规时间的内容
所以我们选择对数据集中常规时间以外的数据进行过滤。
(2)设定进球时
新建一个公式列,计算进球时。
(3)设定进球时间
利用设置的进球时,将其改为数字型以便计算。
(4)新建计算字段列、行
(5)分类汇总
统计不同时间的进球数。
(6)新建组件
使用矩形树图。
6.可视化报告
通过观察组件总结梅西的俱乐部生涯可以看到,他在西甲、国王杯、欧冠都保持着很高的进球效率和进球数,这也说明梅西的巅峰确实几乎全是在巴塞罗那时期。说明梅西生涯巅峰期的强大,同时也对分析梅西生涯其他数据有帮助。
三、参赛总结
FineBI工具
FineBi上手快,对新人很友好,还附有教程,便于学习使用。
当然,它同样有问题,打开时运行速度欠佳,容易卡顿是它的缺点之一,这导致我的作业速度非常慢。
没有存储按钮,自动存储虽然很方便,但却不太令人放心。
有一点基础,所以FineBi的上手和使用显得比较得心应手。
FineBi的公式使用起来非常简单,只要对Excel的公式熟悉,FineBi的公式完全没有压力。
该作品是由一人完成,而且到最后匆匆忙忙,没有很好的美观性,没有团队协作的逻辑严谨,没有专业数据分析师的专业基础,但很努力的在完成该项作品。同时也是因为作为为爱发电,为了自己喜欢的运动真正能在中国发展,不求多高的奖项,只希望学习能力和技术的同时能干一些自己喜欢的事情,为自己喜欢的事情做一些贡献。