【2020帆软杯·数据可视化分析】奥运会数据分析报告

楼主
我是社区第973385位番薯,欢迎点我头像关注我哦~

 

奥运会整体分析

1.奥运会各项指标分析

对数据集athelete_events.csv进行数据预处理后,统计获得120年来奥运会累计举办届数、参赛国家/地区数、累计出现的赛事数、参赛运动员总数、参赛运动员男女比例。

截止2016年,奥运会共举办过50届(其中不包含第 1 次与第 2 次世界大战取消的 3 届夏季奥运会),最近一届夏季奥运会共有207个国家或地区参与,奥运会举办120年来共出现过744个比赛项目,共有133969名运动员参加过奥运会,其中男性共100275人,占参赛人数的74.82%。

2.历届奥运会参赛人数趋势分析

统计夏季奥运会与冬季奥运会参赛人数,制作折线图与参数人数趋势线

近20年来奥运会参加人数、参加国家数、赛事数不断上升,且均在2016年里约热内卢奥运会达到历史最大值。从人数来看,每届夏奥会参赛人数都是冬奥会的4-5倍。

3.世界各国举办奥运会分布(截止2016年)

统计过去120年来奥运会的举办城市及国家,利用地图进行展示,颜色越深,说明该国家举办奥运会次数越多。

截至2016年夏季奥运会已举办 28 届,位于欧洲、美洲、大洋洲、亚洲的城市获得过举办权,其中在欧洲举办的次数最多,共有16次。

截至2016年冬季奥运会已举办 22 届,位于欧洲、美洲、亚洲的城市获得过举办权。

历届奥运会举办国家分布图显示,举办过奥运会次数最多的是美国(8次),其次是法国(5次)和意大利、日本、英国、加拿大等国家(3次)。

4.各城市举办奥运会次数情况

统计过去120年来奥运会的举办城市,利用树形图进行展示,块状越大,则说明该从城市举办的次数越多。

历届奥运会承办城市树状图显示,举办过奥运会次数最多的是伦敦(3次),其次是因斯布鲁克、圣莫里茨、巴黎、斯德哥尔摩、洛杉矶以及雅典(2次)。可见,奥运会分布的国家和地区是相当广泛的。

5.历届申办奥运会候选城市趋势

统计1936年后历届奥运会的的申办候选城市个数,发现以下规律:

进入21世纪以来,申办奥运会的候选城市数随时间推移呈现下降趋势,并在近几年达到最低值。

奥运会赛事分析

1.历届奥运会热门项目

使用词云图,将历届奥运会中参赛人数最多的项目进行展示。

可以看出田径是最热门的体育项目,累计有38116人参赛。其他热门的体育项目还有:体操、游泳、射击、划船、自行车等。冬季奥运会的热门项目包括高山滑雪和速度滑冰等。

2.百年奥运会各项运动产生金牌占比

统计百年来奥运会各项目的金牌占比情况

产生的金牌数占比量最多的体育项目有:田径(9.97%)、游泳(8.26%)、划船(7.13%)、体操(5.81%)、击剑(4.39%)等。

3.历届奥运会发放奖牌数趋势

从折线图中,可以看到热门赛事与奥运会各项运动产生的金牌数量占比最大的几个赛事有极高的重合度,奥运会项目热门与否与该类项目发放的金牌数有很强的关联。

4.游泳、田径项目金牌榜与国家金牌榜的联系

得游泳、田径者得奥运:可以看到,总奖牌榜TOP4国家均在游泳、田径奖牌榜TOP8中,且游泳田径项目TOP1即为总奖牌榜TOP1,美国在游泳和田径项目上获得的奖牌数约占其奖牌数50%以上,且历史上游泳、田径发放的金牌数在发放的总奖牌数中占比达到18.23%,故若想获得好成绩,游泳田径项目为兵家必争之地。

5.被单个国家“垄断”的体育项目

使用Python进行数据统计:进入21世纪以来,各国在奥运会某个项目上获得金牌率大于等于50%的情况,称之为被“垄断”的体育项目。

进入21世纪后,在奥运会的花样游泳和艺术体操两个项目上,俄罗斯包揽了所有的20枚金牌,摘金率达到100%;在乒乓球项目上,中国获得了2000年之后20枚金牌中的19枚,摘金率达到95%。

参赛者分析

1.参赛运动员各项指标分析

计算数据集中,不同性别运动员参赛平均年龄,获奖平均年龄,平均身高,平均体重,获奖率等指标进行分析。

2.历届奥运会性别比例趋势分析

一开始奥运会基本是“男人的运动”,女性运动员仅为个位数,但在1924年之后女性参赛运动员人数出现明显的持续增长,但在1980年到2000年间持续大幅上涨,到近几届奥运会男女参赛人数基本趋于相等:总体上,现目前参加奥运会男女比例几乎接近于1:1,说明女性地位越来越高,男尊女卑的现象在奥运会上基本不在再出现,平等、尊重是现代奥运会的主旨。

3.奥运会获奖相关因素分析

获奖情况与年龄

参赛运动员的平均年龄在 21-26 岁之间,男性参赛者和获奖者的平均年龄均高于女性,其中男性参赛者平均年龄为26.28岁、男性获奖者平均年龄为26.49岁,女性参赛者平均年龄为23.18岁、获奖者平均年龄为23.81岁,由不同性别获奖参赛运动员分布图得可以推断:运动员的巅峰年龄在22-25岁之间。

获奖情况与性别

女性获奖牌概率高于男性获奖牌概率,男性获奖牌概率为20.47%,女性获奖牌概率为21.94%。

获奖情况与运动员身高体重

获奖与身高、体重的关系

基本符合正态分布,当运动员身高为180cm,70Kg时获奖概率最大,故可以根据数据得出如下推断:满足条件身高为180cm、体重为70Kg年龄在22-25岁之间的运动员获金牌的概率更大。

获奖情况与运动员BMI指数

由各项运动获金牌运动员BMI指数折线图得:各项运动获金牌运动员BMI指数平均值基本上在22附近波动,可以推测:当人的体型满足上述条件时,身体的协调性和力量更均衡和全面。

大部分同类型的比赛,男性的BMI指数大多高于女性,考虑到运动员肥胖概率较低,则可以认为大部分同类型的比赛男性比女性更强壮。

4.历届奥运会运动员平均年龄变化趋势

现今运动员年龄较之前趋于稳定,少有出现大幅波动,且处于运动员巅峰年龄,说明运动会运动员的选拔越趋专业化、制度化、规范化、科学化。

5.运动员累计获得金牌榜

历史上获金牌数最多的十名运动员。其中,获得金牌数最多的是美国“飞鱼”——迈克尔菲尔普斯,共获得23枚金牌,短跑名将博尔特获得了8枚金牌,中国体操运动员邹凯获得5枚金牌,并列中国历史金牌榜首位。

参赛国家分析

1.国家累计获得奖牌榜分析

通过对百年来参赛国家获得的奖牌数目进行统计,进行柱状图展示。

美国是金牌数最多的国家,其次是俄罗斯和德国,而中国由于参加奥运会时间较晚的历史原因暂时位居第七。

2.分析奥运会是否存在主场优势

从近6届奥运会主办国的表现来看,折线图呈现中间高过两边的三角形,说明作为东道主成绩确实好过以往,主场优势是真实存在的。

3.国家奖牌数、举办奥运会次数与国家GDP关系

奖牌榜TOP15中,多数为发展较好的欧美国家,国家GDP总值和国家奥运会举办次数呈现一定程度的正相关关系,一个国家GDP越高,其举办的奥运会的可能性就越大。

中国参赛队伍分析

1.中国奥运会参赛运动员各项指标

计算数据集中,中国不同性别运动员参赛平均年龄,获奖平均年龄,平均身高,平均体重,获奖率等指标进行分析。

中国参与奥运会的男女比例更加均衡,优于世界平均水平,且我国的奥运队伍较较世界平均水平更年轻,男女性参赛者及获奖者年龄均小于世界平均水平。其中男性参赛者平均年龄23.73岁、男性获奖者平均年龄23.59岁,女性参赛者平均年龄22.39岁,女性获奖者平均年龄23.01岁。

中国获奖数量,金银牌数量基本持平。

2.中国在奥运会上的表现分析

统计了中国自1984年奥运会以来的奖牌分布情况

虽然近几年,中国都牢牢占据奖牌榜前列,但直到 1984 年,许海峰才夺下中国历史上的第一枚奥运金牌,弥补不上前几十年的无力,故总金牌榜位于第13位。中国队1984年开始有奖牌记录,奖牌总数逐年上升,在2008年主场举办的奥运会上奖牌数达到峰值,此后一直稳定在奖牌榜和金牌榜前列。

3.中国美国对比分析

参赛人数对比:统计中美两国历届奥运会参赛人数,制作柱状图与趋势线

与美国相比,我国参赛人数在2008年达到最高并超越美国参赛人数,但其余仍少于美国参赛人数。由于美国自1896年奥运会创办即参加,人数上的劣势短时间内无法挽回。

强势项目对比:统计中国传统的十大项目以及2016年奥运会上,中国获得奖牌数前10的项目。以及美国获得奖牌前10的项目。分别利用树形图与漏斗图来进行展示。

中国的传统强项有:体操、跳水、游泳、排球、举重、射击、乒乓球等。

在最近一次夏季奥运会中,中国传统强项中的体操、柔道等传统优势体现较历史表现不明显,在获得奖牌数排名中排名出现下滑,但举重、田径、拳击等项目优于历史表现。在最近一届夏季奥运会中,美国最强势项目游泳获奖牌数约为中国强势项目前四名的获奖牌数之和,故中国强势项目与美国相比仍不够强势,且男女运动员获奖率均低于美国,其中中国男性运动员与美国男性运动员获奖率差距最大,获奖率落后于美国男性运动员25.2%。

奥运会经济效益分析

1.近八届夏季奥运会主办国国家GDP增速与失业率分析

奥运会创造大量就业岗位,能在奥运会举办之前降低整个国家的失业率,以近八届的夏季奥运会为例,除近两届奥运会外,其他国家在奥运会前两年均出现失业率下降的情况。但部分国家在奥运会结束后失业率出现回弹的情况。2008年及之前的奥运会均能对举办国家年GDP增速产生积极作用,使举办国家年GDP增速总体上升,但在2008年之后的两届夏季奥运会举办国家GDP增速上升不明显,甚至出现下降。

2.2006-2010北京及周边地区第三产业、房地产业总值变化

由2006-2008年北京及周边地区第三产业及房地产业增长情况可知:2008北京奥运会能对举办城市的第三产业及房地产市场产生较大积极影响,并能对周围地域产生辐射带动作用。

3.2007-2008北京各月工业增加率变化情况

奥运会对工业产生了短期的负面影响。

4.1992-2016年奥运会举办国举办成本及超支情况

近年来奥运会举办成本近年来不断上升、超支比例自2008年以来总体上不断上升,夏季奥运会在2012年达到近24年来的最大值149.6亿美元,冬季奥运会举办成本在2014年达到近24年来的最大值218.9亿美元的同时也达到了近24年来超预算支出的最大值289%。

5.2008年北京奥运会直接支出比例

在2008年北京奥运会直接支出中,场馆改造、租赁费总占比最高,达到20.6%,其次分别为运动员住宿、兴奋剂检查、医疗和餐饮服务(17.52%)和计分和通信技术(17.15%)。

总结与建议

①给国际奥委会的建议:

1:夏季奥运会承办候选城市在申办1992年奥运会时达到最高,但近年来各国申办奥运会的积极性呈现下降趋势,在近几届奥运会申报数达到最低。

建议:从近八届举办国经济数据来看其原因可能与近年来奥运会对各国失业率及GDP等经济、社会方面的积极效应不显著和近年来奥运会举办成本上升等情况有关。建议国际奥委会可以回到1992年奥运会申报的时间段去寻找使各国积极性上升的原因。

2:近年来奥运会举办国在GDP增速、失业率下降等方面获得的积极效应较前几届不显著。

建议:从奥运会直接支出等支出、参会运动员人数、预算超支情况等原因进行分析,是否存在对设施要求过高导致举办国负担较重等情况。建议国际奥委会可以适当减轻给主办国家、城市带来的负担,加大对举办国家的经济支持力度。

3:国家经济总值与承办奥运会次数成正比,美国等经济强国往往举办多次奥运会。

建议:国际奥委会可以在选择申办国家及城市时,应当优先考虑国家/城市经济实力,也可以给其他一些GDP排名靠前的国家但尚未举办过奥运会或举办次数较少的国家一些机会。

②对参赛国家的建议

1:田径与游泳项目发放的奖牌数在发放的总奖牌数中占比达到18.23%,在奥运会奖牌榜取得较好名次的国家均在田径、游泳项目中取得较好成绩。

建议:参赛国家可以根据实际情况,提高对游泳、田径项目的重视程度,加大对游泳、田径项目的投入和训练。

2:奖牌榜排名前列的国家均有其占有优势或具有统治地位的项目。

建议:参赛国家可以着重对某一个项目重点投入资源,以形成自己的优势项目。

3:一个国家的获奖数量排名与其GDP排名呈现正相关关系。

建议:参赛国家要注重国家经济发展,良好的国家的经济才能为奥运会参赛队伍提供给更好物质条件,经济发展才是硬道理。

4:世界女性运动员的的获奖概率为21.94%,高于男性运动员获奖概率20.47%。

建议:参赛国家可以根据实际情况,适当加大女性运动员数量。

5:不同性别获奖运动员的获奖年龄分布均基本符合正态分布(男性略微左偏)。

建议:参赛国家需要重视男女运动员均存在获奖的“黄金年龄”,加大对处于巅峰运动员的投入,提高参赛队伍中处于黄金年龄的运动员的占比。

6:不同项目获奖运动员BMI指数差异较大、获奖运动员身高体重频数分布均存在某一区间远大于其他区间的情况。

建议:不同项目运动员培养与选拔时建议综合考虑身高、体重和BMI指数因素,以选拔与培养体型更适合该项运动的运动员。

③对中国参赛队伍的建议

1:历届中国参赛人数总体少于美国参赛人数。

建议:增加运动员数量,从数量上缩小和美国的差距。

2:美国运动员获奖率为40.41%,高于中国约17.7%。

建议:研究和学习美国人培养和选拔运动员的方式,在质量上弥补与运动员的差距。

3:强势项目与美国相比仍不够强势,中国2016年总金牌数与美国2016年排名前两名的优势项目(游泳、田径)的获奖数相当。

建议:继续加大在优势项目上的投入,进一步发挥自身优势,形成“垄断项目”;对游泳、田径等奖牌数多的项目加大投入,以建立更强势的中国强势项目。

④对在考虑申办奥运会的国家的建议

1:近年来奥运会在GDP增长和就业方面带来的积极效应不显著,且举办成本、预算超支占比呈上升趋势。

建议:在考虑申办奥运会时,首先要结合本国经济情况,谨慎考虑。

2:2006-2008年北京奥运能对举办城市的第三产业及房地产市场产生较大积极影响,并对周围地域产生辐射带动作用,但对工业产生了短期的负面影响。

建议:将举办城市定在第三产业发达的城市,避免在工业发达的城市及其周边举办。

3:经济实力越强的城市举办次数越多、举办的概率越大。

建议:经济实力也是能否举办奥运会的因素之一,想要增加举办奥运会的概率,申办国家努力发展经济也不失为一个有效的办法。

分享扩散:

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

0回帖数 1关注人数 492浏览人数
最后回复于:2024-1-31 09:44

返回顶部 返回列表