【2022帆软杯·数据可视化分析】国际经济格局变化趋势及中国未来展望

楼主
我是社区第973385位番薯,欢迎点我头像关注我哦~

①团队介绍

团队成员:李铭杰、郭鸣敏、马煜程。

学校:中南林业科技大学

②作品背景

20世纪是一个多灾多难的世纪:全球经历了两次世界规模的战争、30年代的经济大萧条、长达50年的冷战和动荡。但世界经济仍然取得了非凡的成就:第二次工业革命使得全球经济突飞猛进,并在90年代末世界经济达到了周期性高点。而如今,人类方才迈进21世纪的门槛,由于科学技能的迅速生长,社会生产力极大提高,世界经济得到前所未有的繁荣。人们在享受的同时也会忧虑,这种繁荣能连续多久呢?俗话说:以史为镜,可以明得失。本团队创作此作品旨在通过对20-21世纪国际经济格局的变化趋势以及中国自身内部经济发展情况,为21世纪中国未来的发展方向提出创新性建议。

③制作流程

分析思路:

1.明确主题

由世界经济发展趋势对中国未来发展提出展望

  1. 制定计划

第一阶段我们先从世界整体经济发展情况入手,由于经济是一个宏观的概念,细分的领域很多。所以我们经过讨论决定取影响最深远、最能体现经济变化趋势的几个因素进行分析。分别从全球GDP、TOP10国家产业构成对比、教育与人均GDP的关系、劳动力占比情况以及各项支出占GDP支出的百分比等进行可视化分析。

第二阶段我们通过从第一阶段了解到的关于不同时期世界的经济发展趋势,敏锐地捕捉到跨入21世纪时世界发展的格局变化,并以此来对中国21世纪以来的经济发展进行分析。同时为了使数据更有说服力,我们对中国的分析分为对内和对外两类,整体上叙述了中国基本国情的变化,对内有人民币汇率变化、各行业总额、恩格尔系数和基尼系数、国家财政收入支出对比等,其中针对各省份的发展,我们也列出了发展差距较为大的部分,更能体现中国整体情况;对外则有与各大洲的进出口总额百分比、进出口商品种类对比等。

第三阶段就以上分析的情况,对中国的未来的发展提出建设性意见

3.数据收集

通过爬虫和Web应用程序测试的工具selenium对数据进行爬取收集,数据来源主要为国家统计局(stats.gov.cn),世界银行(data.worldbank.org.cn/)等,由于网上统计数据并不全部完善,因此当在分析一段时间内因素变化趋势时,我们会选择性跳过数据残缺、数值不可信的年份或者数据(前提是不影响结果的分析),以达到整体分析的可控性与真实性。

?

4.数据处理

利用python的数据分析包之一——pandas库处理excel,遇到不可直接通过excel分析的时候,就通过批量转置来处理,最后再归集成总体归结成几个大表导入FineBi,需要分析的时候就抽取数据。

5.数据分析&&6.数据显示和报告撰写

见成果展示

④成果展示

⑤总结与分享

(我们走过最长的路,是比赛过程中的弯路。)

首先是数据收集的过程,在向世界银行获取数据的时候,因为有现成的excel,所以不用去爬取数据,所以想先就想要分析的点进行选择性下载,之后才发现,如果这样的话,后期假如有需要分析的点补充,又要重新去下载,较为麻烦。为此决定对全球所有国家数据进行爬取,而后再进行筛选分析。由于要对200多个国家进行数据爬取,假如用爬虫的话,写代码的时间相对较长,爬取的时间也较长。因此决定用selenium进行爬取,事实证明效率大大提升了。然后就是对国家统计局数据获取的时候,也同样想用selenium来爬取,但是这个网站和世界银行的网站不同,当click botton将年份更换的时候,它运用的是ajax形式,普通的selenium不起作用,而我们对ajax_selenium了解甚浅,若重新学已来不及,最后还是决定老老实实用爬虫爬取数据,也同样达到了目的,不断探索不断进步~

接着是数据处理的部分,从世界银行爬下来的数据,全球有接近1/3国家的数据是大部分空白,或者是东亚与太平洋地区、IDA混合、早人口红利这些团体性组织对分析帮助不大的国家或组织,所以要将他们剔除。然后通过网上的信息将各国家找到对应大洲,方便后面分析。随之而来的一个大坑来了,当我们处理完全部数据想将它们归并合拢成一个大表的时候,发现pandas库合并类应用最为广泛的merge函数不能满足我们的要求,因为我们的年份是作为列名,在合并的时候不能读取到两个单元格相同的列名合并。若强行合并会导致列名对不齐且数据有遗失。刚开始以为是数值的问题,后来在excel将列名处理成文本后,仍然不行。也百度了很多次,但是大多数人的情况与我不同,无法解决问题。这就很头痛了,也尝试过其他方法也不行,在这个地方卡了几天,导致进展缓慢。最后找到了一个的办法,用append函数直接强硬合并,这样就完美绕开了列名的问题,最终也达到了目的。

最后是数据分析的情况,一开始我们对各种图表都不熟悉,想到一个图就拼命往上套元素,导致像个无头苍蝇,有时候就会达不到效果。后来学聪明了,在作图前先看一遍图表的文档,做起来就很得心应手了。后面的排版,调色是个大工程,花费了很多很多时间,要考虑颜色的鲜艳程度,能否给人耳目一新的感觉以及会不会影响图标效果的表达等等……

(完结撒花!)这次比赛总体体验还是很好的,团队成员也比较默契,遇到阻碍会积极交流沟通解决问题,这不知不觉中不仅让我们提升了对数据可视化技术的掌握程度,也使我们通过比赛体会到了团队合作的乐趣,那种为共同目标奋斗的感觉确实很令人向往,或许这才是比赛真正的意义。

分享扩散:

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

返回顶部 返回列表