一、团队介绍
1. 团队成员介绍:
马超:负责撰写分析思路,完成数据处理,可视化报表制作,及分析文档的撰写。
丁宇:可视化报表的展示ppt制作,协助完成数据的查找搜集工作。
陈功:完成数据查找搜集工作,协助完成分析文档的撰写。
2.组合契机:期待能够参加帆软杯这种全国大学生性的比赛,也为了能够在竞赛过程中提高自己的综合能力。
3.合作方式:同班同学,线下商讨作品的分析方向以及实现方法,合理分工完成各自的任务,最终整合报告。
二、作品背景
1. 问题背景:
随着本科生越来越多,本科学历已经不再是许多岗位的“敲门砖”,大部分用人单位打上了“研究生以上”的标签。为了提升自己的就业竞争力,越来越多的大学生加入了考研的队伍。因此,近些年考研人数连年增高,屡创新高,在教育资源有限的情况下,高校分数线激增不下,考研竞争激烈程度不断增加。大多数人对于考研的基本情况的了解存在一些误区:跨专业选择过于理想化,缺乏切合实际的分析、片面追求热点,扎堆现象严重、喜欢仅从专业名称字面理解专业;考生人数越来越多,高校资源紧张,报录比越来越高,考生压力增加。
2.希望解决的问题:
1)部分考生对考研情况了解有限,对各专业的考研难度,以及对未来就业不了解。
2)高校教学资源有限,考生越来越多,分数线越来越高,越来越多的考生无法上岸。
3)考研学生扎堆现象严重,许多经济较高城市考研人数爆满,经济滞后地区得不到考生。
三、制作流程
1.背景驱动:
考研目前以及成为了大的趋势,越来越多的人参加考研,这也导致考研内卷严重,在教育资源有限的情况下,越来越多的人无法上岸。
2.数据来源
1)数据集来源:
作品数据集来源为和鲸社区官方推荐的数据:考研历年国家分数线
https://www.heywhale.com/mw/dataset/5fe1706383e4460030ab004f/file
具体包含以下几个重要数据:
考研历年国家分数线(1)
考研历年国家分数线(2)
考研历年国家分数线(3)
考研历年国家分数线(4)
考研历年国家分数线(5)
考研历年国家分数线(6)
2)额外数据来源(若直接点链接打不开请将链接复制到浏览器打开):
搜狐:
https://www.sohu.com/a/419253383_100169011
中华人民共和国教育部:
http://www.moe.gov.cn/jyb_xxgk/s5743/s5744/A03/202110/t20211025_574874.html
http://www.moe.gov.cn/s78/A03/moe_560/2020/quanguo/
知网:
https://kns.cnki.net/kcms/detail/detail.aspx?dbcode=CMFD&dbname=CMFD0506&filename=2006097313.nh&uniplatform=NZKPT&v=bfU-8HkecXfgHJxv4j9rJEim2yLjRPX3H8Zdhf6LG_KukNkk4Q_mtK4GYSSMipod
中国考研培训行业白皮书2021:
https://www.analysys.cn/article/detail/20020080
新浪财经:
http://finance.sina.com.cn/mac/
新东方:
https://news.koolearn.com/20210415/1239453.html
https://wx.yikao88.com/xiyikaoyan/monishiti/13401.html
麦克斯:
http://www.mycos.com.cn/index.php/Index/news_info/nav/3/id/49268.html
从上述等可靠数据来源中搜集数据。
3.设计思路与思维脑图框架:
考虑考研分析的整体多方面因素,我们将整体思路分为以下六个部分:
1)整体分析:从整体角度查看近年考研基本情况以及趋势。
2)考研参与者分析:对考研参与人群的具体动机,报考情况,人口组成等因素进行统计分析。
3)专业分析:对各专业学术硕士,专业硕士国家分数线,专业在高校中开设情况,专业招生人数,专业就业率等角度进行分析。
4)高校分析:对全国高校专业开设情况,以清华大学与北京大学为代表的自划分数线的高校进行分析。
5)地区城市分析:对各省份招生人数录取人数与GDP情况进行分析。
6)总结与建议:综合总结可视化大屏的分析内容;对考研参与者,高校,教育部,政府的建议。
具体分析细节与思维脑图如下图所示:
4.实现方式
作品实现的第一阶段:收集整理数据,确定分析方向并设计分析思路与思维脑图。
作品实现的第二阶段:对数据进行处理,主要为数据缺失值,重复值,异常值的预处理,以及对所需使用的数据利用Python语言进行合并、统计、汇总。
作品实现的第三阶段:对进行处理过后的数据进行可视化大屏的制作,利用FineBi完成而可视化报表并简要分析。
四、成果展示
为了解决考研当下存在的问题,我们就近几年的有关考研的考生人数、专业、院校、地区等数据进行分析。根据可视化作品多方面因素分析目前考研形势,帮助考生确定考研报考方向,解决考生扎堆问题,让考生更好地规划专业及院校,也对解决考研“越来越卷”的情况提出总结与建议,希望能够给当下考研形势一些建议作用,帮助学生,高校,以及硕士教育三者实现共利。
1. 模块一:整体分析
内容:从整体角度刨析出当下考研的形势,其中可以看出全国考研学术硕士专业大类共有25项,专业硕士大类共有31项,全国共有449所高校开创硕士点,全国高校可报考专业数目多达748个,即使较为丰富的教学资源仍然不能满足每年数百万的考生。除2014年,研究生取消公费导致2014年,2015年全国考研报考人数减少外,考研人数整体增长迅速,但录取人数增长缓慢,考生录取压力大。
全国城市高校数量分布地图可以看出高校分布下个对集中在北京,天津、上海、江苏等城市经济发达的地区。右下角展示图表展示了全国高校数量前20的城市其中北京居首多达47所。
2. 模块二:考研参与者分析
内容:除了2014-2015年因政策影响每一年考研人数都在增加,2020年报考人数高达341万人,录取人数111.4万人,不达三分之一,平均每年报考201.5万人录取64.57万人,平均报录比3.16。总体上与时间呈正相关。
通过综合方面对考试报考情况,报考原因的分析,可见考生压力越来越大,考试期待往重点高校就读,往届考试报考人数占比不断提升,考生压力不断增加。
3.模块三:专业分析
内容:据图所示理工科的专业分数线偏低,考试难度较大;管理学,经济学等文科类的专业分数线较高竞争也很激烈,工学,管理学,医学,教育学,有极高的就业率,考生为追求顺利的工作,报考招生人数也是最多,出现考生扎堆现象。清北等一流高校具有最多数的考研专业。
4.模块四:高校分析
内容:高校分析展示出各高校不同专业的开设数量其中在全国高校中开设最多的专业是工商管理(204所)其次是计算机科学与技术(167所)、会计(163所)。报考专业确定的考生有更多的高校选择,其中以清北为代表的自划分数线高校各专业分数线很高,极少部分难度大且冷门专业分数线较低。
5.模块五:地区城市分析
内容:如图可以看见,经济发达,人均GDP越高的地区相对人均GDP较低的地区有有更多的招生人数,综合原因,GDP较高,城市高校教育资源较多,考生向往大城市丰厚的待遇,故而蜂拥而至报考经济发达地区。每年硕士报考人数与当地GDP水平呈现正相关,经济发展伴随着考生更多,同时也是因为考生的学业与就业压力所影响。
6.模块六:总结与建议
根据上述各模块考研形势可视化数据,做出如上图所示总结。(具体分析内容与总结价值情况请根据FineBi资源包)。
五、总结与分享
1. 数据的搜查和选取工作,以及制作方案的设计需要团队共同商量组成,正所谓三个臭皮匠顶过诸葛亮,众人共同完成结合不同的思维才能对数据做出更好的分析。
2. 对于数据的处理和汇总统计一定要对得到的结果进行检查,在后续制作可视化报表过程中再发现数据错误会很麻烦。
3. 可视化指标的梳理实在难以完成可以对数据进行提前处理获得所需制作的可视化报表的数据。
|