【2022BI数据分析大赛】考研趋势分析与预测

楼主
我是社区第347864位番薯,欢迎点我头像关注我哦~

一、团队简介

1、选手介绍

团队名称:BUCT 数据爱好者

队长介绍:朱海涛,北京化工大学信息学院辅导员

成员介绍:

陈浩:自控20级学生,负责数据处理,数据爬取,运用自身对python的掌握处理,过滤数据,达成团队数据需求
陈俊宇:计科20级学生,负责报告书写,思路构建处理,部分图表制作,统一调动组内的工作进度

李卓昊:生医20级学生,负责图标,仪表盘制作,软件的学习较为深入,提供图表数据

周扬晓宇:自控20级学生,负责报告书写,思路的添加修改,细化思路分支

张智星:材料21级学生,负责仪表盘制作,仪表盘规划,准确获取数据处理思路

 

2、参赛初衷

我们因对数据处理的兴趣与对自身数据处理技术学习的渴望而聚在了一起,此次finebi数据大赛为我们提供了良好的学习交流平台。团队成员本着锻炼自己,在课外学习实践技能的初衷来参加本次比赛,希望通过比赛来增强自身的本领与技能,为将来走上社会岗位充实自身技能,发挥个人价值。

 

二、作品介绍

1、业务背景/需求痛点

近年来,我国的教育事业不断发展,考研人数越来越多,针对该严峻的考研形式,我们通过查阅数据集,进行大数据分析,对考研形式与情况进行可视化分析同时进行相关预测并给出合理建议。

 

2、数据来源

中国考研网,考研中心

自选数据:

 

3、分析思路

考研是一个很大的工程,考研成功上岸,是广大学子继高考后再次进入名校,进入热门专业,弥补高考遗憾以及衔接工作能力的选择之一。由于考研形式是公平性更强的笔试—复试形式,对个人硬实力要求严格,对考生的应对能力和学业水平有着更高的筛选性。研究生在经历课题磨练后,将会拥有更广阔的人脉资源,更好的工作岗位竞争力,因此,我们小组从考研人数入手,作为开头剖析,根据历年研究生报考人数,各省考研人数推断出全国考研大框架;随后,我们根据往年考研的报录比,分析出当前考研的难度及“卷”度,考研是否为我们大学毕业后的“必由之路”,我们是否要处于被动的考研焦虑中;接着,我们对当下各大学及各地区的情况进行一个汇总,分析出热点地区,热点院校。这考虑到考研伴随着“工作”的经验,不同的地理位置,将会有不同的学习资源,将会为研究生毕业后走上工作岗位或者读博深造有着密切的关联,也能看到一些不以院校排名为“死规矩”的有趣现象。考研,是学术学历的进一步深造,最终目的都是为了就业,科学的了解考研,是为广大学生减轻考研焦虑,不沉溺于旁人和网络的催促中,虚假考研,无效考研,被考研绑架了大学充实自我能力的黄金时光,而是真正做到充实自我,为了自己的未来谱写华章。

 

4、数据处理

首先是进行数据的提取,过滤掉不需要的数据,然后部分数据之间还需要建立关联,以及数据的二次处理,比如求和,排序等等,这其中也有不少困难,例如很多工具的使用不够熟悉,数据过滤不够到位等等,但好在我们是一个团队,团队里的每个人都出谋划策并且不断尝试,于是才有了成果。我们调用python函数库处理表格,学习finebi的使用后处理字段,合并数据等等,学习并实践应用数据处理办法。以下为数据处理结果展示:

全国报录比处理:

各年份研究生在读/招生/毕业情况:

往年研究生报名/录取差值

 

5、可视化报告

(1)考研人数分析报告:

上述分析报告:上述图表主要表明了各省份和各年份的考研报考人数。结果显示:

  1. 在各个省份中北京上海等具有良好区位优势和资源的省份,报考人数相较于其他省份而言更多。其中,北京市考研人数相较其他省份,出现了断崖式增长,北京坐拥优质的经济资源,教育资源,浓厚的政治环境,文化深度,在该氛围下走出来的大学生,对考研深造,具有执着的见解。
  2. 由于各设有考研院所大学在全国的分布不均,如北京上海这些教育资源丰富,且集中,众多高等院校985,211等双一流名校集中,因此该地区竞争压力极大。而优秀学生的相互竞争,同时带来了“考研焦虑”,这使得很多对考研或者就业并不明确的学生,收到此氛围影响,投入到考研的“事业”中去,并且选择二战,三战,以至于考研人数不断内翻,报考人数激增。
  3. 从年份来看,考研人数成指数上升的趋势,除了2014年以及2015年外,报考人数都逐年增加,特别是2022年报考人数已达4570000人,增长比例将近21%,这表明考研依旧在持续升温,一是因为广大学子对学位及工作憧憬要求越来越高,对自己的读书梦有一个新的拐点,奋力一搏;二是考研二战、三战的人数越来越多,因为对工作的不满,对自己以付出的努力具有不对等心理,选择再战。14、15年两年增长比例有所下滑,主要原因是因为14年研究生取消公费,开始实行自费+奖学金制度,这使得一些本抱着研究生“养老”态度的同学放弃了走研究生的道路。但是两年低谷期过后,随着市场竞争压力愈演愈烈,考研的含金量被逐步放大,越来越多的人对研究生竞争拥有新的认知,考研人数回转,并持续上涨至今,是其大趋势。
  4. 总体来看,中国目前考研人数在地区上呈现不均等分布,教育资源,经济资源及名校集中的地区,报考人数呈几何倍数多于其他省份。从时间上看,考研难度日益艰巨,考研人数越来越多,考研形式严苛,学生“内卷”行为屡见不鲜,对盲目考研者就像是无形的大山,压制着本该青春洋溢的充实自我,丰富自身学识的大好时光,无论与否,我们都应明确考研的终极目标也是为了就业,因此我们应衡量好自己的目的及价值判断,不为无谓的复习做题埋没了培养个人社会素养,竞赛技能,知识的实践与应用的大好时光。
  5. 考研难度分析

经过数据的筛选和处理,我们将从以下几个方面进行考研难度的分析。

①根据上图,我们发现像北京,上海,河南,山东等地考研人数都超过了24万人次相较于其他省份较高,同时由于资源与教育水平的差距,不同省份的考研难度与考研人数呈现明显的区域分布特征。诸如西南片区,除了教育相对发达的四川有16万人次的考研人数外,其他省份的考研人数都较少。

②分析上图我们不难发现,历年来的报名与录取人数的差值在不断增长,即反映出报考人数的增长速率明显高于录取人数的增长速率,在该趋势的影响下,考研的录取比只有约30%左右,而这仅仅是对于总体而言,若单独抽取出较为优秀的考研专业和学校来具体分析该录取比只有仅仅()。这就导致考研难度逐年增加,想要考研越来越难。

③从当今中外各大型公司企业的学历要求的大环境考虑,我们不难发现,研究生只是一个起步平台,这就导致了越来越多的人为了跻身更好的公司,走上了考研的道路,再加之疫情的影响,近年来打算去国外读研的应届毕业生开始选择报考过国内的大学,于是我们不难发现近三年来考研人数的增长率最高达到了惊人的21.8%。这也是侧面体现出来近年来的考研态势愈发严峻的趋势。对于学校来说生源的可选择性增加,生源的优质性也成为了高校需要考虑的问题,简单讲,院校间的招生竞争也十分激烈。各个学校都想提高自己的生源水平,招到更多优质的学生,所以就只能在研究生招录方式上进行改革,而改革也意在削减当下的考研热,避免应试制也渐渐成为研究生培养的终点。

(3):考研大学及专业选择概况:

分析报告:

  1. :考研对于多数大学生而言就是第二次高考,因此选择好的院校,进入高一档次的院校以及自己喜欢的专业“转型“是多数考生的上岸所想。对于不同档次的院校,国家对相同专业做出了评级,因此同样是某专业的考研分数差将会有不同程度的增减。
  2. :高考对专业的选择与调剂是每一位大学生的必由之路,进入大学以后,不少学子对该专业有了深刻的认识,我们通过对考研热门专业排名分析可以清晰的指出,前十的专业都有一个共同的特点,即一定的“泛用性”。这些热门专业的知识,大多都可以应用于不同的社会岗位中,所谓人们常说的万金油

③:归类合并后我们发现,前十的专业中,计算机技术、计算机科学与技术、软件工程三门学科都是计算机专业的细化,这直接体现出了计算机学科在多领域的融会贯通,人才需求量大,培养方面多样。其中一个重要原因正是第三次科技革命所带来的社会趋势,万物互联时代的到来,使计算机在教育行业也成为“朝阳学科”。

④:除此之外,在的热门专业排行中,法学,金融,工商管理这些学科的排名傲居榜首,这除了他们与经济关联性相当贴切以外,更重要的是这些专业涉及社会情况、国家政策,对当下的形势保持一个动态的分析,对未来长远的走向有着更深刻的洞察能力,这类人才也是市面上人才市场广受欢迎的人才,同时,这些专业的学习也有助于学生对自己未来的人生规划,理财规划有着良性帮助,许多学生也因此选择该专业攻读研究生。

(4):未来预测:

分析报告:

  1. 对于考研人数的预测我们不难发现,信息类专业的分数总体上保持着较高的分数水平,历年全国分数线都在300分以上,表明了该专业的报考人数逐年增加,对要报考该专业的学生的要求越来越高,侧面说明了该专业在未来有一定的向好性,是如今的“朝阳行业”。
  2. 对于计算机类的报考人数分析我们发现,报考该专业的人数历年来呈上升趋势,这是现在对计算机从业者的市场要求量大,同时薪资待遇良好,导致该专业愈发火爆,但正因如此该专业报考竞争压力大,对于是否报考该专业还需要谨慎考虑.

(5)总体情况

作品公共链接:https://bisolutions.fanruan.com/webroot/decision/link/zI13

 

三、参赛总结

1、命题选择:考研似乎是每一位大学生在步入社会前,不可避免,需要思考判断的道路之一,但是当下有相当数量的大学生对考研其实缺乏认知,考研是为“氛围”所裹挟,其实这并不是考研的初衷。考研的报录比常年居于30%,作为一个人才选拔的制度,总会有淘汰的发生,因此认清竞争形势,明确自身需求,所有的行动最终指向“工作”,是我们作为大学生应该建立的心理基石。

 

2、成员分工:很高兴我们小组这次的比赛各司其职,达到了很好的合作效果,每个人都体现了自己的能力与价值,而学习了新的技能后,都有了各自的收获,在互相交流中达成了进步的初衷。

 

3、实践成果:我们小组都是第一次接触大数据类型的比赛,面对网上如此庞大的数据以及我们制定思路时想要的数据集被“隐藏”,其实细化的点子本来有很多的,但是后来都因为数据的缺失无法成功实现,因此做了很多的删减工作。这也很现实,将来走上工作岗位也会面对这样的问题,我们需要做的就是,怎么样用现有的数据,做的更好。

 

4、致谢:感谢FineBI平台给予了我们这样的机会去实现大数据处理,初步理解大数据的操作流程,对当下的热门问题有了更深刻的分析。同时感谢我们辛勤的组员,不辞劳苦,没有怨言地去完成各自的工作,以及老师提供的指导意见,新增加的思路和处理,大家都在此次比赛中收益良多

分享扩散:

沙发
发表于 2022-5-15 10:00:40
案例打卡:考研这个话题热点无疑了~虽然好几份作品以考研可视化为主题,但是各自重点不同。文档中分析思路的描述是:先可视化考研人数、考研难度、大学情况,最后进行计算专业的考研趋势分析。完整地看完作品,个人觉着分析内容对不上作品名“预测”二字,作品更多是考研数据的图表展示,预测部分就放了各个历年均分的折线图,另外,该折线图不足以支持其分析结论。展示面板可以考虑增加模块的区域划分、去除过多图例等~
参与人数 +1 F币 +6 理由
帆软苏茜 + 6 有效打卡奖励

查看全部评分

板凳
发表于 2022-5-15 23:04:14
数据不全的需要清洗,数据维度少的话,通过分析模型得到更多的数据,多做几个仪表盘,相信会有更多收获,一起加油
参与人数 +1 F币 +1 理由
帆软苏茜 + 1 有效打卡奖励

查看全部评分

地板
发表于 2022-5-24 21:48:32
案例打卡:预测的话感觉需要大量数据,并且需要考虑的影响因素挺多的,这样才能做出可信度较高的预测结果。这篇是挺有意义的先行探索了。哈哈哈,其实主要是没怎么看到辅导员的经验分享,所以感觉总感觉少了点什么。
参与人数 +1 F币 +1 理由
帆软苏茜 + 1 有效打卡奖励

查看全部评分

5楼
发表于 2022-5-30 13:23:04
案例打卡:第三篇考研分析,现在的学生考研真的不容易,不过感觉分析逻辑不是很明显呢,要是能够增加问题在仪表板说明会更好
参与人数 +1 F币 +1 理由
帆软苏茜 + 1 有效打卡奖励

查看全部评分

6楼
发表于 2022-5-31 15:54:10
对历史数据的分析和展示比较充分,就预测部分而言,显得有些简单了,可以再深入一些.
参与人数 +1 F币 +1 理由
帆软苏茜 + 1 有效打卡奖励

查看全部评分

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

5回帖数 1关注人数 8695浏览人数
最后回复于:2022-5-31 15:54

返回顶部 返回列表