一、选手简介
1.选手介绍:
- 团队名称:赢了队长请客吃饭队
- 队长介绍:社区id:穿山甲001,目前是某高校在读的大数据专业的本科生,对于数据分析和数据可视化等大数据应用领域有着浓厚的兴趣,具有个人创新意识和团队配合协作能力。本次比赛负责数据可视化和团队任务工作的分配。
- 成员介绍:
- 小明:某高校在读的大数据专业的本科生,对于Python和数据库等计算机应用编程能力熟练,在队长的号召下果断参加本次比赛,负责主要的是数据可视化和色彩的调配。
- 小婷:某高校在读的大数据专业的本科生,热爱数据可视化应用,有着一定的数学建模基础,能够高效率和高质量的完成数据清洗和处理以及前期准备工作。本次比赛主要负责的是数据前期的爬取,清洗,还有数据之间逻辑关系的建议和协调。
- 小珍珠:某高校在读的电子商务专业的本科生,对于图表的美化和图片的优化有着丰富的经验,精通PS技术和相关的制图工具。本次比赛除了配合各队员工作外,还对仪表板进行了星空动态的设计和一些高水准的外观设计。
2.参赛初衷:
- 希望通过本次比赛,更深入了解数据分析和可视化技术的重要性,提高自身的数据分析能力。
- 机会来之不易,要好好把握住本次机会,提升自己,增长自己的见识和视野。
- 团队性比赛能够提高彼此的社交能力和交流沟通能力。
- 能够与更多的FineBI大神竞争,在竞争中积累数据分析经验,不断成长。
- FineBI这是一款很好的数据分析和可视化软件,值得我们学习和掌握。
- 比赛的奖品奖励性价比较高,值得踊跃尝试和参加。
二、作品介绍
1、业务背景:
碳排放问题至今仍然是一个非常严峻的问题,对各行各业和社会带来大大小小的影响,其中一个最直接的影响就是产生温室效应,而由随之而来的自然灾害和社会问题,如全球气候变暖、冰川融化等现象出现,这些皆会在经济、文化、地理等各层次方面对人类生活产生重大影响。尽快碳排放相关问题一直是国内外学者研究的热点,大量文献从不同方面进行了广泛的研究,但是碳排放管制效率的研究并不多见以及数据的不确定性和一些客观因素的存在,因此对碳排放主题问题进行研究有着重要的研究意义和业务价值指导性,希望通过我们的的研究成果能够为不同行业带来积极的参考价值。
2、数据来源:
自选数据:本次比赛一共用到31个数据表,均取决于真实可靠的数据网站。在采集数据时,我们也采用了八爪鱼和pyhton进行数据的爬取和采集。
(1)其中19个数据表来自国家统计局,主要是对我国进行一个详细的碳排放数据分析和于碳排放相关领域的数据分析:
http://www.stats.gov.cn/
例图(原始数据未进行数据清洗):
(2)其他12个数据来自外国权威数据网站,主要是对世界进行一个综合的碳排放分析,目的是为了更完整和更准确的对数据进行分析和数据可视化:
https://edgar.jrc.ec.europa.eu/report_2021
例图(原始数据未进行数据清洗):
3.分析思路:
- 本队首先进行德尔菲决策方法来确定我们所研究主题的方向进行一个定位,主要从世界到中国再到中国内部省区进行一个由浅入深,逻辑有序的数据分析,能够得到一个完整的数据分析结论和可行性措施及建议,如图:
- 之后,我们讨论了关于不同数据所适合的数据可视化图形类型的选择,如图:
4、数据处理:
将所采集到的数据分为世界、中国、中国各省数据,并创建三个文件夹归纳:
将已分类好的数据导入到FineBI大赛账号专门的大赛业务包中,如图:
将数据表彼此建立关联关系,密切数据之间的联系,深入挖掘数据中的价值,如图:
将需要用到的字段转化为文本类型,而不是数值类型,如图:
将表中原有的数据按照一定的计算来得出我们所需要得理念数据,便于数据分析,如图百分比的转换:
将在自助数据集中处理后的数据导入不同的图表类型,进行数据可视化操作,如图:
1.数据冗杂,清洗不便
2.数据类型太多,需要分门别类
3.数据单位不统一,需要对数据进行计算
1.充分利用FineBI自助数据集中的功能,对数据进行清洗和处理
2.在处理数据前,构建一个有逻辑性的思维导图,确定数据处理方向
3.明确数据表中存在的内部关系,便于数据的清洗
5、可视化报告:
1)排版布局:预知趋势变化,我们就确定下了多系列折线图,用不同颜色代表不同国家,并且开启闪烁效果,提高可视化的美观度,比较近年世界主要国家的温室其他排放总量。
2)数据表达:通过对世界主要国家进行一个折线趋势对比图,能够直观地表达出近年来这些国家温室气体排放量的趋势。以印度中国为首的东方大国近年来温室气体的排放量上升趋势较明显,中国与印度在2020年分别达到了12000吨、7000吨的气体排放量,经济发展的同时也伴随着环境的污染,也代表这国家工业水平的提高。美国作为第一强国,已经步入到第三次科技革命的浪潮,工业正在向新兴产业和新能源工业转型,在20年的时间里温室气体的排放量下降了22%;俄罗斯、英国、德国所代表的工业体系温室气体排放量一直控制在3000吨左右,排放量相对较低,这与该国的工业因素与客观因素有关。
1)排版布局:采用世界地图,对世界主要国家的地理位置进行一个直观的表达,相比传统的可视化模型来说,地图更具有一种数据可视化的吸引力。
2)数据表达:本图是对分析世界主要国家温室气体排放总量进行一个准确的数据报告,提高数据分析的完整性和时效性。美国的温室气体排放量仍然较大达到了每年63603.92吨的气体排放量,印度、俄罗斯其次,这与国家的工业发展水平和状况有着很强的关联性;相反,虽然中国温室气体排放量为每年12764.05吨,相对于其它国家的气体排放量较小,但我国经济发展水平居于全球前几位,同时,也能保障对温室气体排放的管控,这和我们国家的政策和法规分不开;德国和英国代表的老牌工业国家每年的排放量分别为9126.28吨、5323.45,因其传统工业较少,新型工业崛起,所以温室气体排放量相对较少。
1)排版布局:用饼状图来对世界主要国家在不同行业的碳排放量占比,用不同的色调来搭配,更直观地能看出表达含义。
2)数据表达:从总体上看,世界主要国家在电力行业的碳排放量占比较大,从而引发出我们对电力问题和碳排放相互之间的联系;从微观上来看,不同国家在不同行业的碳排放量占比与其国内因素也是有一定的关联的。
1)排版布局:词云图,通过搜集到的近年世界各国碳排放量一个汇总,选择词云图能够将数据转换为图像来表达出来,有利于对数据的清晰展示;瀑布图,用瀑布图对不同收入程度国家进行一个分析,并且对最值进行一个闪烁效果,提高数据可视化的可读性和参考性。
2)数据表达:词云图,卡塔尔近年来碳排放量位于世界首位,其中一个重要原因就是石油和煤等资源的开采,加上其工业的不断发展和对环境保护的缺失。以美国、印度为代表的经济大国的碳排放量与其经济发展水平有一定的关联,其他国家的世界碳排放量均有一定的占比高收入国家与低税国家的碳排放总量形成鲜明的对比,这二者之间的差值为68.39;瀑布图,高收入国家应该加强对世界碳排放量的管控,低收入国家也应该加强自身的发展,中收入国家也应该有相应的碳排放量管理机制。
1)排版布局:将我国大气主要污染物成分展示成面积的样式,更具有冲击力和视觉效果。
2)数据表达:经过数据计算转化为百分比后,将按照1为标准来对主要污染物进行一个百分比划分,可以看出烟(粉)尘比百分比最大,其他污染物均有一定的占比。
1)排版布局:用两个玫瑰图,用不同的颜色色调来代表电力进口和出口量,利于两者数据的分析和对比。
2)数据表达:我国电力进口量近年一直比较稳定,而电力出口量近年有所下降,也得出了电力生产量的增加定会带来大量的化石燃料燃烧,在产生电能的时候不可避免地会会环境造成污染。
1)排版布局:用传统的表格图,直接将原始数据表达出来。
2)数据表达:这是对碳排放问题和电力问题研究的一个重要补充,将各领域的用电量展示出来,进而又能得出不同的分析和结论。
1)排版布局:用堆积图来对近年我国电力生产可供量和生产量进行一个数据量的展示和对比。
2)数据表达:从2011年到2020年,我国火力发电量比例越来越少,2011年-2020年,我国电力可供量和生产量都在不断上涨,,且在2020年两者上涨幅度最大但火力发电的规模缺依旧庞大,一直占总电力生产的50%以上,我国为实现2060碳中和的目标,一直在大力发展可再生能源发电,风能发电量,核能发电量比例年年上升。同时我国拥有大量水力发电建筑,水力发电量比例也仅次于火力发电。按照趋势,新能源发电规模将会越来越大,传统火力发电量会慢慢减少。
- 近年我国2016-2021年我国化石燃烧总量和碳排放总量:
1)排版布局:通过组合图方式将两者数据建立联系,二氧化碳排放量用柱状图表示,化石燃烧了用折线表示,均用渐变色来填充颜色。
2)数据表达:我国化石燃料燃烧总量和碳排放年年上涨,在2020年我国碳排放和化石燃料总燃烧量均出现大幅度下降,碳排放和化石燃料燃烧量 来源于工业生产和日常生活,2020年正是疫情最严重的一年,工业生产和日常出行几乎停滞,碳排放和化石燃料下降。
1)排版布局:总共分为四个不同数据类型的柱形图进行合并对比,颜色采用渐变色,由小到大,柱状的样子渐圆,渐宽。
2)数据表达:从2011年到2020年,我国火力发电量比例越来越少,但火力发电的规模缺依旧庞大,一直占总电力生产的50%以上,我国为实现2060碳中和的目标,一直在大力发展可再生能源发电,风能发电量,核能发电量比例年年上升。同时我国拥有大量水力发电建筑,水力发电量比例也仅次于火力发电。按照趋势,新能源发电规模将会越来越大,传统火力发电量会慢慢减少。2011年-2020年,我国热能发电百分比越来越低,但其规模依旧庞大,一直占总电力生产的50%以上,我国为实现2060年碳中和的目标,一直在大力发展可再生资源发电,风能发电量,核能发电量百分比年年上升。同时我国拥有大量水力发电建筑,所以水力发电量百分比仅次于火力发电。按照趋势,新能源发电规模将会越来越大,传统火力发电量会慢慢减少。
1)排版布局:采取散点图来表示,强化视觉效果,配上模板背景图和闪烁效果、警戒线等。
2)数据表达:由以上图示得出能源消耗总能量的排名为:山东省、山西省、辽宁省、内蒙古自治区、河北市等。能源量较大,这和传统制造业的能耗较大原因离不开,如电解铝,炼钢等重工业,能耗大,碳排放量高。能源消耗种类可以反映出我国能源的多元化,其中对于原碳的需求仍然占比较重要的比重,其他种类均有一定的占比。能源消耗反映了不同地区的经济发展水平,能源消耗量大的地区经济发展势头强盛,沿海地区大于中部地区大于西部地区,因此经济水平不同,能源消耗量也不同。
1)排版布局:两者均采用雷达图,并对原有传统的雷达图进行轴线的调节,提高美观度;用高亮的颜色来表示总量。
2)数据表达:左图,山东省、山西省、辽宁省、内蒙古自治区、河北市等。能源量较大,这源于传统制造业的能耗较大。如电解铝,炼钢等重工业,能耗大,碳排放高;右图,河北省与广东省的二氧化碳排放量最高、江苏省次之,往后依次是辽宁省、河南省、浙江省、山西省、湖北省、四川省。
1)排版布局:一是用柱状图表示,用不同的颜色来表示,按照降序的顺序来排列;二是用填充地图,颜色曰深代表量越大,也是比较清晰的。
2)数据表达:由左图明显可以看出我国山东和山西的碳排放量位于我国首位,其中一个重要原因就是因为煤的开采和利用,造成了碳排放量的上升,环境污染也日益恶化,而相对于资源比较缺乏的地区或者重工业较少的地区,它的碳排放量少业是有着一定的合理原因;据右图分析,颜色越深代表碳排放的总量越多,2010年-2021年我国各省碳排放总量中山西省和山东省尤为突出。原因之一是因为碳排放主要来源于民间燃烧化石燃料的习惯,和老工业区传统的重工业,日钢,泰钢,魏桥等高能耗企业众多。以及火力发电在两省的盛行。
- 作品公共链接:https://bisolutions.fanruan.com/webroot/decision/link/M3yx
- 数据可视化最终输出:
- 备注:本仪表板采用动态模式,图片不能表达出来,因此配上视频讲解,供大家更好的了解和欣赏。
三、参赛总结
1.关于FineBI工具:
本团队全体成员均使用过多种数据可视化工具,较于其他可视化工具FineBI可以更加快捷的导入图标,更方便的改变背景,自由配色和动画效果,因此数据可视化外观更加震撼、美观、协调。与其他数据可视化工具不同,FineBI中开创性的加入了帆软社区的功能,使新用户可以更快的上手,在遇到数据可视化问题时,也可以第一时间在帆软社区中找到解决方法。这是FineBI中最亮眼的两个特点。
2..参赛总结:
(1)数据分析工作的首要任务,在于找到需求,收集数据。本团队从三个维度分析碳排放问题,需要的数据范围极广,于是我的队友多方面寻找数据源,拿到了大量数据。再从数据海中,分类,删除,整合,这些工作耗费了成员大量的精力、时间、头发。在此由衷的感谢我的队友,数据前期的收集、清理工作枯燥乏味,且毫无成就感,感谢他们对这些误区工作的忍耐和认真。
(2)数据可视化的过程,我们力求美感。然而有的数据做某些图那是奇丑无比,于是我们一份一份作图,一点一点的变色修图,想找到最优雅的数据可视化作品。最终成品的背后,是无数日夜无用的工作,是大量报废的图和数据。在这些过程中,我们初步明白了什么样的数据适合什么图,这无疑是提高了我们审美,和对数据的初步判断能力。
(3)最终撰写文字,我们也没有仅仅局限于数据可视化作品,而是多方位寻找文献,论文的支持。让数据分析更加科学,更加真实。
(4)感谢我们的指导老师和队长是完美主义者以及队伍成员的辛苦付出,使得最终作品高效率高质量地完成,也令我们团队满意和自豪。 |