【2021夏季挑战赛】高考可视化分析

楼主
我是社区第511308位番薯,欢迎点我头像关注我哦~
一、选手简介                

1、选手介绍
        
团队名称:勇敢的牛牛们

队长介绍:郝飞,帆软社区用户名:勇敢牛牛不怕困难,目前就读于金陵科技学院,计算机工程学院,19级数据科学与大数据技术。是帆软认证BI工程师。本人学习专业以及研究方向为数据挖掘,数据分析等。

成员介绍:
  • 成员一:徐进航,帆软社区用户名:徐进航。目前就读于金陵科技学院,计算机工程学院,19级数据科学与大数据技术。帆软认证BI工程师。
  • 成员二:沈苡名,帆软社区用户名:沈屁屁。目前就读于金陵科技学院,计算机工程学院,19级数据科学与大数据技术。帆软认证BI工程师。
  • 成员三:徐佳宇,帆软社A区用户名:lris1。目前就读于金陵科技学院,计算机工程学院,19级数据科学与大数据技术。帆软认证BI工程师。
  • 成员四:袁雪,帆软社区用户名:袁雪。目前就读于金陵科技学院,计算机工程学院,19级数据科学与大数据技术。帆软认证BI工程师。
  • 成员五:庄怡,帆软社区用户名:淘气居居。目前就读于金陵科技学院,计算机工程学院,20级数据科学与大数据技术。帆软认证BI工程师。
        
团队组成:由学校宣传得知比赛,六人志同道合,本着互相学习,督促进步形成了牛牛团队。

团队照片:先保密啦
        
      
2、参赛初衷
  • 在这个数据组成的时代,学习并灵活运用可视化分析
  • 发掘自身不足,和队友讨论,取长补短,逐步完善,并提高自己的数据分析能力
  • 诱人的大赛奖金
        
二、作品介绍
      
1、业务背景
        
紧随高考季,全国各省的高考落下帷幕,所有的省份也公布了各省的省控线和各个学生的分数。莘莘学子十二年苦读的成果,对一个学生,一个家庭而言至关重要。高考固然重要,志愿填报也不容小觑。我国大学数量多,总类杂,常令人们眼花缭乱,一筹莫展。通过这一部分,我们希望大家对于我国的大学情况有一个总体认知和概念。这些天以来,高考成绩陆续出炉。选填志愿便成了当下考生与家长们最要紧的问题。在此之前,考生与家长们要对本省高考和自我有个清晰的认知。无论是地狱级难度的高考卷亦或是最热报考地,都让我们对江苏满怀好奇之心,于是我们对江苏这一省份的高考和大学上做了更为细致全面的分析。
        
      
2、数据来源
        
自选数据:和鲸社区{kesci}https://www.kesci.com/home/dataset                          百度高考大数据

      
3、分析思路
        
面对高考后的高校选择,无非从城市,学校,专业三大角度进行分析比较。喜欢的城市,喜欢的学校,喜欢的专业甚至是喜欢的人,从某种角度会影响着未来的在走向。
        
得到数据后,第一个想法就是先分析当今高考的现状,比如多少人,各省的高考情况是什么的,其次想要分析中国整体的概况,方便考生认识了解各城市的高等教育水平层次,选择一个最受欢迎的省份进行进一步分析。
      

        
我们认为,中国大学的概况和中国高考的概况是两条并行的线,在高考生眼中是由分数,然后选择自己的学校专业,,也有人为了自己的梦想城市,再考虑对应的学校专业。先引出中国大学可以从宏观的角度分析,国家高校的分配布局,教育质量水平。
        
     
4、数据处理
      
数据由一个总表与多个小表构成,总表的数据处理,在仪表盘中添加函数,筛选,或是在MySQL中制作并导出,形成一长串的自主数据集。

4.1 全国大学数据
      

4.2 生源地为全国,高考生报考院校热度
      

4.3生源地为江苏,高考生最热专业
             

        等等数据。。。。。。。
        

      
5、可视化报告
        
Part1 中国大学总体报告
      

      
分析报告:上述图表主要展示各个省份211和985院校的数量。结果显示:
        1.  在各个省份中作为首都北京的211或985高校数量最多,高达30多所。其次是经济发达的上海,被称为教育大省的江苏。
        2.  可以看出一些经济和地理优势比较好的地区,高校的质量也很好,这也更能吸收新生去报考。
        3.全国大学总数为2769所。其中985高校个数为46所,211高校个数为125所,双一流高校个数为145所。在全国高校中,985高校所占个数最少,其次211,最后为双一流院校。
        4.总体来看中国985高校、211高校以及双一流高校的总数在全国院校中可以说所占比例极少,所以对于高考生来说竞争更加激烈,像这种高校招生来说也会更加严苛。

             

        
分析报告:上述图表主要展示全国不同类型大学数量。以便高考生可以从不同类型的院校以及结合自己的兴趣来选择高校。结果显示:
        1.  从院校类别看,综合类和理工类院校总数最多,值得注意的是普通本科公办院校内师范类紧跟其后,位居第三。从小有志向当老师的学子们,可以选择这类学校。
        2.  从上述排名可以看出大多数院校注重理科,偏向理工。其次这些年国家对教育越来越重视,提倡高校注重大学生综合全面发展。
        3.  热度位居前十的专业分别为航空航天工程、信息工程、药学、工商管理、表演、人力资源管理、表演艺术、临床医学和城乡规划。
        
        
由统计结果不难发现,大城市的教育资源更强大。为什么?
        
一方面,一个地区的经济水平越高,相应的人均可支配收入越高,对教育文娱产业的投入也就越大,于是造就了教育产业的繁盛。
        
另一方面,基于人口规模的聚集,这些城市更容易带动教育产业的发展,聚集人群数量越大,则发展越好
        
        
Part 2 全国高考概况统计
        
不同省份的高考难度,一直是一个争议严重的问题。每个地方的人,都会觉得自己是比较难的那一个。因为其实不管在哪里,高考都是件不容易的事情。高考录取,本质上是一种“省内筛选”,是全国各个高校,以省(直辖市,自治区)为单位进行的竞争,而各省之间的录取难度是有所不同的。  

      
      
        
        
分析报告:上述图表主要展示了近几年全国高考报名人数录取人数、2021年最热十大报考地和2020全国高考录取率(以部分省份为例)来给高考生详细和充分的参考数据,便于高考生选择到自己心仪的学校。结果显示:
        1.2012-2020年全国高考报名人数逐渐递增,而高校录取人数也成递增的趋势。其中2021年高考报名人数高达1078万人是历史新高。
        2.2021年最热十大报考地江苏居首位,也充分的显现了江苏作为教育大省和经济大省对学生的吸引力。
        3.从部分省份的本科录取率来看,相差并不算大,无论经济发展水平的差异,或是人口多寡之分,接近的录取率使得整个高考环镜相对公平。其中个别省份例如“上海”的录取率超过了70%。
        4.总的来说,近年来,参考人数和录取人数都呈上升趋势。从增加幅度来看,录取人数卒年增加。2020年,高考录取率名列前茅,超过70%,其他地区,例如辽宁、江苏、河北和山东都超过了50%。
        
      
      

        
分析报告:上述可视化图表通过高考模式对比和全国文理科占比来突出全国各个省份高考的难度,其中根据高考模式的占比分为五个模式:优惠、普通、困难、噩梦和地狱。我们采取“985录取率”,“211录取率”,“一本录取率”三个指标的共同排名来评估各地高考竞争烈度,加上一个“清华北大录取率”进行额外评判(因为方差过大,这个指标不算得分),最后进行得分排名。结果显示:
        1.从录取率上来说,江苏和湖北,这两个传统印象中的“高考熔炉”,其实没有那么难,也就是处于普通模式,或者困难模式。印象流的事情很多,我们就是希望用数据量化的方式,打破印象流,构筑更量化客观的评价体系。
        2. 985录取率:指该省所有高考考生中,被985高校录取的人数比例。全国平均大约是1.62%(这个是所有高考考生为分母,而不是所有高考适龄人口做分母)。新疆,湖南大致是处于全国平均水平的,评65分,天津5.9%,上海5.3%,北京4.3%远高于全国平均水平,吉林,青海也都在3%以上。
        3. 211录取率:指该省所有高考考生中,被211高校录取的人数比例。全国平均大约是5.01%。北京14.0%,上海13.58%依然是遥遥领先,而天津不是第三,第三的是西藏,西藏的211录取率超高(和其高考考生本身只有2万多有关)。但是西藏的985录取率并不那么高。天津,青海,吉林,宁夏等地区依然是非常友好,录取率较高。

      
Part 3 江苏高考细致统计分析
        
由于总分低,录取分数低,一直被外省调侃。我们将从以下几方面,分析江苏省的教育概况,供应届高考毕业生填报志愿等参考。
        
      
      


分析报告:江苏各年高考录取情况讨论

        1. 过去五年江苏高考分数线较为平稳,一本分数线在331-353之间,二本分数线在277-325之间。
        2. 虽然试卷难度大,但是比取得分数高低更重要的是位于全省的排名。江苏省的文科达线人数在5.3万人上下波动,理科达线人数在14.5万人上下波动。自2017年报名高考人数为往年的最低人数后,之后五年都是在缓慢逐步增长,而文理科达线人数变化并不大,这样来看,江苏省内的高考竞争依然非常激烈。
        
      

分析报告:江苏高校专业及热门学校

        1.     江苏省内大学分布较为均衡,大部分市有5-7所大学,宿迁市内大学最少,只有3所。其中,以省会城市南京最为突出,遥遥领先,高达54所。最热报考院校中,十三所位于南京。23个江苏省特色学科中,有19个分布于南京的院校,入榜学科类型丰富。
        2.     由此看出,南京作为江苏省的省会城市,高等教育资源集中,教学水平高,对于教育的重视度高,积极拓宽学科种类,助力学科全方面发展。
        3.  江苏高校类型中,专科的数量超过50%,其中大多是公办理工类院校。普通本科中,公办理工类和综合类数量相当,使得不同层次的学生都有充足的空间受到更高水平的教育。

        
作品展示:(见附件)



三、参赛总结


经历几天的忙碌,最终完成了报表的终极版,有几点总结吧:

        
1.  做表的初衷(命题的选择)
        
我们之所以选择了自主数据,主要原因是想借取高考季与毕业季的时间段,对中国高校的教育情况,高校的分布,高考的概况,以及对江苏进行特定的分析。今年是江苏改革的第一年,也是合并全国卷的第一年。不少应届毕业生对待选择高校,城市,存在迷茫的现象。分数高的同学,对选择城市,高校以及专业存在迷茫,分析热门地,热门高校,与热门专业,为他们的志愿提供些许参考。原本想对不同分段的同学拟造可选高校集,因为主观性比较强,就放弃做了。
        
2.  数据的爬取与预处理
        
网上的数据很多,在运用过程中会发现,做出的表最后大多用不上,在使用中,却会发现需要其他的表进行填充。我们的表多而杂,没有进行自主数据的合并处理,使得最后的表格很多。其次不少数据存在空缺的现象,做一些图筛选的时候显得而更加麻烦。本次数据来源科赛与百度大数据实时更新,可能有些许的出入,还请谅解指正。
        
3.  报表制作
        
报表的制作过程,同队的说法不一,这也是我们制作过程中最大的困难,制作的内容,色彩,排版都存在很大的出入。对待统计图的选择与说明,最终还是达成了一致的意见。
        
4.  致谢
        
感谢出版方帆软提供了这个平台,给我们一个互相学习,努力进步的机会,在扩展在自己业务能力的同时,也提高了我们对数据的跟深一步认识。同时也感谢队友们的互帮互助,提取了很多宝贵的意见。

分享扩散:

沙发
发表于 2021-7-5 19:49:57
勇敢牛牛不怕困难,那个饼图还没有改,,,,
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

2回帖数 4关注人数 16743浏览人数
最后回复于:2021-7-14 17:25

返回顶部 返回列表