【2022帆软杯·数据可视化分析】全球幸福指数及中国国民幸福指数影响因素分析

楼主
我是社区第973385位番薯,欢迎点我头像关注我哦~

1 团队介绍

团队名称:扬“帆”竞逐队

团队成员:刘康全、李文主、万富民

指导老师:龚志伟

学校:中南林业科技大学

2 作品背景

中国的幸福研究早在20世纪90年代己经开始,在21世纪10年代逐渐发展成熟。随着时代发展,我国幸福感研究正在逐步走向成熟。在2010年全国两会上,温家宝在作政府工作报告时表示,“我们所做的一切都是要让人民生活得更加幸福、更有尊严”[1]。一项2011年的统计数据显示,中国己有100多个城市提出了“幸福城市”的建设目标。可以说,幸福中国、幸福城市一直是国家政府、研究学者、普罗大众的共同追逐目标。

2020年新冠疫情在中国蔓延,面对不清楚病例,不知道治疗方案的新型冠状病毒,在所有医疗人员的共同努力下,中国人民上下一心的防控下,中国抗疫取得了傲人的成果,大部分地区都达成了零病例。在其他国家疫情蔓延,防控无效的情况下,至今全球仅有中国还在严防死守。从国家层面看,在中国体制下的疫情管制,管控可以说是相当成功,国内外抗疫可以说是两极分化,毋庸置疑,中国人是‘幸福的’[2]

然而,根据2021年全球幸福指数排行,中国的幸福指数并不高,排在第72位。同时,中国的幸福排名虽逐年升高,但总体排名还是较低,从2015 年的世界中下游水平到现在的世界中游水平,甚至还不如周边的一些发展中国家[1]。因此,为了进一步加强国民幸福指数,我们采集了中国综合社会调查的数据,分别从影响国民幸福指数的个人层面和社会层面两个方向进行可视化分析,以此来探究不同影响因素对中国国民幸福指数影响程度的大小,从而寻求更全面更有效提高中国居民幸福指数的可行性方案,不断缩小与排名靠前国家的差距。

3 制作流程

3.1数据来源

表1 作品数据来源

网站名称

网址

可视化作品所用数据

世界幸福指数报表官方网站

https://worldhappiness.report/

2022年全球幸福指数指标排行

全球经济强国历年幸福指数情况

中国历年幸福指数情况及预测

中国学术调查数据资料库

http://www.cnsda.org/

幸福指数影响因素-个人层面

幸福指数影响因素-社会层面

3.2设计思路及逻辑

本次可视化分析作品,以两大部分探究全球幸福指数及中国国民幸福指数影响因素。

3.2.1第一部分:全球幸福指数分析

主要探究全球各国幸福指数分布与排名,从中挖掘出中国在全球的排行和中国与其他经济大国、发展中国家幸福指数的差异,并探究2020年疫情影响下全球十大经济强国幸福指数的增长率。在此,我们发现中国在全球幸福指数排行和发展中国家幸福指数排行中排名都不高的情况,因此我们聚焦到中国,探究影响中国国民幸福指数的影响因素。

3.2.2第二部分:中国幸福指数分析

此部分分为四个小部分,分别是数据基本信息、中国幸福指数总体情况、从社会层面观测国民幸福指数和从个人层面观测国民幸福指数。

(1)数据基本信息:

我们首先对我们所采集到的数据进行了描述性统计分析,分别从受访者的性别、婚姻状况、年龄、城镇/农村、教育程度和省份进行分析。以证明我们所采集数据的多元性、多样性与准确性。

(2)中国幸福指数总体情况:

此部分我们对中国历年幸福指数各影响因素进行分析,然后分析了中国历年幸福指数的增长率与增长情况,并对2023年中国幸福指数进行预测分析。

(3)从社会层面观测国民幸福指数:

此部分我们探究了中国各省的幸福指数排名与分布,并将人群分成中国国民、高幸福指数人群、中低幸福指数人群,和青年人群、中年人群、老年人群,利用随机森林模型分别探究不同人群对中国九大社会层面影响因素(即公共教育、医疗卫生、住房保障、社会管理、劳动就业、社会保障、政府帮扶、公共文化和城乡基础)的重要程度,最后通过多维分析,运用住房保障与劳动就业两个维度分析出就业与购房情况较好的省份。

(4)从个人层面观测国民幸福指数:

此部分我们首先分析了家庭孩子数量与家庭共同生活人数对家庭幸福指数的影响程度。然后我们利用回归分析得出在个人层面和休闲娱乐层面对国民幸福指数各因素的重要程度。最后我们探究了不同幸福程度人群的保险购买情况,并分析了不同家庭收入对国民幸福指数的影响程度。

因此,我们根据设计思路及逻辑结合已经进行数据清理与分析后的数据利用Fine BI对作品进行了可视化的制作。

3.3实现方法

我们首先根据设计思路及逻辑绘制出了可视化作品的基本框架(如图2),并根据基本框架利用FineBI 完成可视化作品的制作。作品内容如下:

图2 可视化作品结构框架

3.3.1第一部分:全球幸福指数分析

第一部分共6个图表,包括全球各国幸福指数分布地图、全球各国幸福指数对比堆积柱形图、参与全球幸福指数评选的国家多层饼图、全球幸福指数前十国家聚合气泡图、全球经济前十的发展中国家条形图、全球经济强国疫情前后幸福指数对比多系列柱形图。

(1)根据全球各国幸福指数高低和综合排名,绘制出以颜色深浅区分的全球幸福指数分布图,蓝色越深的国家幸福程度越高,黄色越深的国家幸福程度越低。可以非常直观的看出欧洲和北美洲的国家幸福程度较高,亚洲和非洲国家的幸福程度较低;

(2)根据全球幸福指数数据,对影响全球幸福指数的指标主要划分为慷慨程度、对腐败的看法、健康与其寿命、社会清廉程度、生活自由和人均GDP六大类以及其他指标。以此绘制出全球各国幸福指数对比的堆积图,更加直观地分析高幸福指数国家受哪些指标的影响更大,从而给地幸福指数国家提供了提升幸福指数的启示;

(3)根据全球幸福指数数据,将各个国家按照所在大洲归类绘制出多层饼图,可以直观的分析各大洲的幸福指数情况;

(4)根据全球幸福指数数据,绘制出全球幸福指数排名前十国家的聚合气泡图,可以直观地看出经济发展水平与幸福指数的关联关系;

(5)根据全球幸福指数数据以及世界各国经济发展水平数据,针对发展中国家的幸福指数进行分析,绘制出发展中国家幸福指数排名条形图,可以明显看到中国在发展中国家中的幸福指数排名,进一步分析原因,寻找对策;

(6)根据全球主要经济体疫情前后幸福指数数据,绘制出全球经济强国疫情前后幸福指数增长率对比柱形图,可以直观的发现疫情对幸福指数的影响,同时反映几大经济主体疫情防控的积极性和有效性。

3.3.2第二部分:中国幸福指数分析

第二部分共27个图表,其中包括探究中国国民幸福指数影响因素的多层饼图,问卷数据基本信息扇形图、填充地图、柱状图、面积图,中国历年幸福指数影响因素对比折线图,中国历年幸福指数对比范围面积图和折线图,2021年中国各省幸福指数分布地图,2021年中国各省幸福指数排名条形图,中国各省-社会层面各影响因素对比多系列柱状图,不同幸福指数-社会指标重要性漏斗图,不同年龄段-社会指标重要性条形图,各省份就业与购房情况对比多维点图,家庭孩子数量与共同生活人数对幸福指数影响情况的矩形树图,中国国民个人层面-各社会指标重要性和中国国民休闲娱乐层面-各指标重要性词云图,不同幸福程度保险购买情况仪表盘,以及不同幸福程度家庭收入对比多系列柱状图。

(1)根据问卷调查数据,对一百多项指标进行相同项整合、剔除干扰性指标的处理,最终得到9个社会层面指标、27个个人层面指标,绘制出影响中国国民幸福指数共36个指标的多层饼图。

(2)根据问卷调查数据,对问卷填写者基本信息归类分别绘制出比例信息的对比玫瑰图、问卷填写者来源分布地图、以及相关探究正态分布属性的柱状面积图。

(3)根据调查问卷数据以及历年幸福指数影响因素数据,绘制出历年来影响中国国民幸福指数的六大指标对比图,可以直观地观察各指标影响程度随年份的变化。

(4)根据中国历年幸福指数数据,绘制出历年幸福指数范围面积图与折线图,可以直观地发现中国幸福指数的发展趋势及增长率变化,进而可以通过已有趋势预测以后年份中国幸福指数的大小。

(5)根据问卷调查数据,得到来源于各地区的填写者不同幸福指数的数目,绘制出中国各省幸福指数填充地图,可以直观地看出幸福指数地区间的差异,以及经济发展水平对幸福指数影响情况。

(6)根据问卷调查数据,按不同幸福指数各地区所占比例综合评分,绘制出中国各省幸福指数排名的条形图,进而更直观地展现中国各省幸福指数高低状况。

(7)根据问卷调查数据,整理出九个社会层面影响幸福指数的指标,由此绘制出中国各省社会层面各影响因素对比多系列柱形图,由此可以直观地观察各省幸福指数影响因素的差异,从而针对不同情况制定不同提升幸福指数的措施。

(8)根据问卷调查数据,从影响幸福指数的九个社会指标出发,按照幸福程度不同分类,利用随机森林模型进行建模分析,绘制出不同幸福程度社会指标重要性排名漏斗图,可以直观地发现社会指标对不同幸福指数的人群的幸福指数影响重要性排名的差异。

(9)根据调查问卷数据,通过问卷的就业与购房反馈数据,绘制出各身份就业与购房情况对比散点图,结合住房保障和劳动就业两个社会指标可以更好地反映,住房与就业对不同身份幸福指数的影响情况。

(10)根据问卷调查数据,将不同年龄人群按照区间进行划分,结合九大社会指标绘制出不同年龄段社会指标重要性条形图,直观地反映了社会指标对不同年龄段人群影响的差异。

(11)根据调查问卷数据,选取填写者孩子数量和家庭共同生活人数数据,结合幸福指数分别绘制出孩子数量和家庭共同生活人数与幸福指数矩形树图,可以直观地发现,孩子数量差异和家庭共同生活人数对幸福指数影响的差异。

(12)根据调查问卷数据,通过对个人指标进行休闲娱乐和生活层面分类,由此分别绘制出个人层面两方面指标对个人幸福指数影响强弱词云图,可以直观地看出在不同方面对个人幸福指数影响最大的个人层面指标。

(13)保险参与也是社会保障的要义。根据问卷调查数据,对问卷填写者的保险购买情况进行统计,按照保险品种进行分类,绘制出不同幸福指数投保保险情况仪表板,可以直观的发现不同幸福指数对投保保险品种的差异。

(14)根据问卷调查数据,从个人层面指标出发,绘制出不同幸福指数家庭收入对比多系列柱形图,可以直观地发现家庭收入的不同对幸福指数的影响情况。

4 成果展示

根据2022年全球幸福指数排行,中国排在第72位。中国的幸福指数排名虽逐年升高,但总体排名并不高。因此,为了进一步加强国民幸福指数,我们分别从影响国民幸福指数的个人层面和社会层面两个方向进行可视化分析,以此来探究不同影响因素对中国国民幸福指数影响程度的大小,从而寻求更全面更有效提高中国国民幸福指数的可行性方案,不断缩小与排名靠前国家的差距。

首先我们对作品主题,数据来源与探讨内容进行了简要的说明:

图3 可视化作品主题、数据来源与探讨内容基本介绍

4.1模块一:全球幸福指数分析

主要探究全球各国幸福指数分布与排名,从中挖掘出中国在全球的排行和中国与其他经济大国、发展中国家幸福指数的差异,并探究2020年疫情影响下全球十大经济强国幸福指数的增长率。

通过对全球幸福指数的分析,得出高幸福指数国家主要分布在欧洲、美洲和大洋洲,而亚洲和非洲各国的幸福指数普遍偏低。全球幸福指数最高的国家为芬兰,其值高达7.821,其次是丹麦与冰岛且世界幸福指数前十国全是发达国家。中国排在第72位,幸福指数位于美国(第16名)与日本(第54名)之下,由此说明中国在全球的幸福指数排行并不高。在全球经济前十的发展中国家中,中国幸福指数依然处于中游水平。在2020年疫情爆发期间各国幸福指数增长率大多处于负增长,只有中国幸福指数增长率为正增长。从侧面反映了这些国家的防疫政策并不完备,也体现了中国对疫情防控的有效性与及时性。

图4 模块一第1部分

图5 模块一第二部分

图6 模块一第三部分

4.2模块二:中国幸福指数分析

通过对全球幸福指数的分析发现,中国的幸福指数并不高。虽然中国的幸福指数排名在逐年升高,但总体排名还是较低。因此,我们将视野聚焦到中国,分别从中国社会层面和个人层面探究影响国民幸福指数的影响因素。

图7 模块二影响国民幸福感的影响因素

4.2.1第一部分:数据基本信息

我们首先对采集到的数据进行了描述性统计分析,分别从受访者的性别、婚姻状况、年龄、城镇/农村、教育程度和省份进行数据可视化。通过分析发现,城镇/农村与男/女比例接近于1:1,已婚/未婚比例接近于7.5:2.5,各省受访者人数分布较均匀,受访者年龄组成和受访者教育程度均近似服从正态分布。说明此次调研所采集到的数据符合多元性、多样性与准确性。因此,用此数据做数据分析具有较强可信度。

图8 模块二数据基本信息

4.2.2第二部分:中国幸福指数总体情况

此部分我们首先对中国历年幸福指数各影响因素进行分析,在2020年新冠疫情爆发期间慷慨程度、人均GDP、社会支持和积极影响都处于下降趋势,并且消极影响也有所增加,说明新冠疫情在经济、政治等方面对我国产生了不小的影响。然后分析了中国历年幸福指数的增长率与增长情况,发现中国历年幸福指数大体呈上升趋势,2020年新冠疫情爆发时,幸福指数增长率大幅度降低,但2021年幸福指数明显回升,说明中国对疫情处理的正确性。最后我们利用回归模型对2023年幸福指数进行了预测,预测结果为5.97,呈上升趋势。

图9 模块二中国幸福指数总体情况

4.2.3第三部分:从社会层面观测国民幸福指数

此部分我们首先探究了中国各省的幸福指数排名与分布,发现在2021年,全国平均幸福指数为3.86,中国北部各省幸福指数较高,中国西南方向各省幸福指数普遍偏低。其中,河北省幸福指数最高,其次是山东省和吉林省。然后,我们将人群分成中国国民、高幸福指数人群、中低幸福指数人群,和青年人群、中年人群、老年人群,利用随机森林模型进行建模分析,分别探究不同人群对中国九大社会层面影响因素(即公共教育、医疗卫生、住房保障、社会管理、劳动就业、社会保障、政府帮扶、公共文化和城乡基础)的重要程度,在结果准确率达到0.95时,得到最影响中国国民幸福感的社会指标为社会保障、住房保障与劳动就业;最影响高幸福指数人群的社会指标为公共教育、公共文化和社会保障。最影响中低幸福指数人群的社会指标为劳动就业、公共文化和政府帮扶。最影响青年人群幸福指数的社会指标为城乡基础、公共文化和医疗卫生。最影响中年人群幸福指数的社会指标为医疗卫生、城乡基础和社会管理。最影响老年人群幸福指数的社会指标为社会保障、医疗卫生和政府帮扶。最后通过住房保障与劳动就业两个维度得出,就业与住房最好的省份为四川省,其次为安徽省、湖南省和山东省。

图10 模块二从社会层面观测国民幸福指数第一部分

图11 模块二从社会层面观测国民幸福指数第二部分

图12 模块二从社会层面观测国民幸福指数第三部分

4.2.4第四部分:从个人层面观测国民幸福指数

此部分我们首先分析了家庭孩子数量与家庭共同生活人数对家庭幸福指数的影响程度,发现家庭孩子数量为1个时的幸福程度最高,其次是2个和0个,家庭共同生活人数为2个时的幸福程度最高,其次是3个和4个。然后我们利用回归分析得出在个人层面和休闲娱乐层面对国民幸福指数各因素的重要程度,在个人层面,人们更注重于自己的健康状况,其次是家庭经济地位、自我认知和收入。在休闲娱乐层面,最能提高国民幸福指数的休闲娱乐方式是购物逛街,其次是聚会、读书和上网。最后我们探究了不同幸福程度人群的保险购买情况,发现高幸福指数与中低幸福指数人群都比较注重城市/农村医疗保险和养老保险的购买,而高幸福指数人群比中低幸福指数人群更加注重商业性医疗保险和养老保险的购买。并分析了不同家庭收入对国民幸福指数的影响程度,发现资金上的匮乏并不能完全决定生活上的幸福感。

图13 从个人层面观测国民幸福指数第一部分

图14 从个人层面观测国民幸福指数第二部分

图15 从个人层面观测国民幸福指数第三部分

4.3模块三:总结与建议

结合以上可视化案例分析得出总结与建议。

图16 总结与建议

5 总结与分享

5.1总结

首先,非常感谢我的团队,我们分工明确、配合默契。从选题的畅抒己见到定题的一拍即合,我们少有摩擦;从数据整理到数据清洗,分工明确,步步为营。从可视化分析到仪表板制作,我们每个人都在其中越来越运筹帷幄。最终团队经过长达一个多月的时间,不断打磨不断锤炼,呈现出这份较为满意的答卷。

选题的时候,我们每个人先通过自己寻找数据量多且信服度高的数据,再集中商讨主题的确定。在开商讨会时,我们每个人都很愿意倾听队友的意见和建议,良好的组内氛围使我们的进程十分顺利。最后通过团队的头脑风暴,发现了中国在全球幸福指数排名情况的现实问题,以及根据收集到的中国社会调查数据,结合中国实现全面小康伟大成就的背景,最终,我们确定做全球幸福指数与中国国民幸福指数影响因素分析。选题之后,我们并没有盲目的就开始准备进行数据分析。而是列出框架,提前做好思维导图并拟定好接下来要做的事情。同时寻找另外相关的数据,如2021年全球幸福指数情况、全球历年幸福指数情况等。此外,在进行可视化分析时,我们每个人都有自己负责的部分,这也促使我们更有动力去学习FineBI,学习可视化分析。同时,在对数据进行分析时,我们提出多种模型对数据各指标进行建模分析,如logistic回归分析和随机森林模型等数据分析方法。随着比赛的愈加深入,团队也配合的更加默契。

最后,通过参加此次比赛,我们不仅学会了FineBI的应用,能够制作相关可视化分析图表,还掌握了很多数据分析的方法。当然,比赛最难能可贵的是和朋友更加默契的配合以及不断磨练的品质和学习更多新的知识,以及洞察事物背后的原因与意义,正在慢慢培养我学会思考、学会分析的能力。写到最后,还是要感谢我们的指导老师龚老师,提供的宝贵意见;感谢我的好队友,认真负责,合作愉快。最后,希望所有美好的期许终将纷至沓来。

5.2分享

通过参与本次比赛过程中的不断探索与学习,我们收获了很多关于数据分析、挖掘与可视化的知识和技能,从最初期的主题确定到最后的可视化成品,收获颇丰。在此,我们将我们收获到的一些要点分享如下:

1、数据选题方面可以选择一些题目比较新颖与格局较大的主题,如以全球层面或全国层面的一些主题,并能得出一些比较客观真实的结论。

2、数据收集时,应考虑数据的可靠性与可用性,对于数据的寻找,可在和鲸社区(https://www.heywhale.com/)、GitHub(https://github.com)、中国学术调查数据资料库(http://www.cnsda.org/)、CSDN(https://bbs.csdn.net/)等数据网站进行数据的采集。

3、对原数据进行清理时需要认真仔细,数据清理的好坏很大程度上影响着数据结果的可靠性。

4、可对数据进行一定的建模分析,如分类、预测、评价等都可利用有一些模型得到可观的结果。

5、做可视化时,一定要注重图表的可视性与故事性,需要像讲故事一样能直观理解各图表的前后衔接。

6、最重要的事说三遍:学好FineBI!学好FineBI!学好FineBI!一定要好好学习FineBI软件,掌握其各种功能,才能最大限度地制作出好的可视化作品。当然,如果你在作图中遇上什么困难,可通过FineBI小助手寻求帮助。

分享扩散:

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

返回顶部 返回列表