【2023BI数据分析大赛】高一物理考试报分析报告
一. 选手简介
1.1 选手介绍
(1)团队名称
青铜数据小分队
(2)队长介绍
最强青铜五,绰号五哥,数据产品中的六芒星战士,曾主导大数据能力平台、大数据应用平台从0到1的搭建,对教育大数据有深刻的理解,喜欢跑步,性格风趣幽默,团队里的灵魂人物。
(3)成员介绍
Eison:拥有六块腹肌的超级无敌大帅哥,比队长帅一丢丢,是一名资深的数据工程师,擅长数据建模、数据挖掘,熟悉各类大数据平台的使用,喜欢运动,目前单身哦。
大仙姑:比小仙女更高一级,是一名碳数据专家,要问路上跑的车有多少辆,她可能不知道,但是要问这些车的碳排放是多少,她可是信手拈来,她的口头禅是:势必在2030年完成习主席的双碳目标。
1.2 参赛初衷
说是为了理想有点扯,主要还是因为平时工作太无聊,想找点有意思的事情做。
三人中队长和Eison从事数据行业,对数据可视化有一定的了解,大仙姑从事传统行业,属于传统行业+数字化转型。作为数据领域的从业者,我们一直致力于将复杂的数据转化为易于理解的可视化图表,并通过这些图表向用户展示业务洞察。但是大家各自的工作中并没有太多的机会去完成数据可视化的设计,大家的工作更偏向于底层数据的处理。
基于此,我们三个报名了本次比赛,希望在这次比赛中,能够充分发挥我们的创意,搭建出一份令人满意的作品。
二. 作品介绍
看到很多往届作品,大家偏向于借助数据可视化来实现业务的增长。我们本次带来的作品是教育大数据,希望借助大数据的能力、通过数据可视化的手段,帮助教育场景中的每一个角色发现问题、解决问题,实现新时代的教育数字化转型。
本次作品基于某中学高一班级的一次物理模拟考试成绩展开分析,接下来我们一起开始吧。
2.1 业务背景/需求痛点
近年来,国家高度重视大数据的发展,政府也全面提升对大数据产业的支持。国务院于2015年8月印发《促进大数据发展行动纲要》,明确指出要全面推进我国大数据发展和应用,加快建设数据强国,并系统规划在未来五到十年内大数据在各领域的具体应用工作。
《国家中长期教育改革和发展规划纲要(2010—2020年)》、《国家教育事业发展“十三五”规划》、《教育信息化2.0行动计划》等文件,明确了国家加快教育现代化建设,推进新时代教育信息化发展的大基调,发展“互联网+”、大数据、新一代人工智能等重大战略任务,利用教育大数据促进教育变革已经成为教育事业发展的必然趋势。
学校面临考试招生、教学质量提升、人才培养模式转型等诸多挑战,以往单靠经验的传统校园管理模式已经无法适应当前的需求。发展教育大数据并利用大数据驱动学校的管理变革、教师精准教学、学生个性化学习,成为学校及师生迫切需求。
在智慧教育出现之前,对学⽣的成绩分析主要是基于⼈⼯的⽅式进⾏的。教师的评估和观察是主要的⽅法,他们根据学⽣的作业、考试或其他学习活动来评估学⽣的成绩。这种⽅法有以下⼀些缺点:
主观性:⼈⼯评估容易受到教师的主观偏⻅和个⼈的教学⽅法的影响。不同的教师可能有不同的评估标准和⽅法,这可能导致不公平的评估和学⽣成绩的波动。
低效率:⼈⼯评估需要⼤量的时间和精⼒,特别是对于⼤规模的学⽣群体。这使得成绩分析过程变得⾮常低效,很难对每个学⽣的具体需求进⾏深⼊分析。
数据利⽤不充分:⼈⼯评估⽆法充分利⽤学⽣的各种学习数据,如完成作业的时间、解题过程中的步骤、课堂参与度等。这些数据对于准确评估学⽣的学习情况和提供个性化的反馈⾮常重要。
缺乏及时性:由于⼈⼯评估的限制,学⽣的成绩通常在作业或考试完成后的⼀段时间内才能得到反馈。这使得学⽣⽆法及时了解⾃⼰的学习进度和需要改进的地⽅,也使得教师难以在第⼀时间调整教学策略。
相⽐之下,智慧教育借助⼈⼯智能和数据分析技术,可以提供更客观、⾼效、个性化的成绩分析。它可以跟踪学⽣的整个学习过程,收集⼤量的数据,并通过算法对数据进⾏处理和分析,从⽽提供更准确、全⾯的成绩评估。此外,智慧教育还可以实时⽣成学⽣的学习报告和反馈,帮助学⽣及时了解⾃⼰的学习状况,提⾼学习效率。
本次比赛,我们围绕某学校高一年级的一次物理考试展开分析,希望借助大数据,使学校管理者通过学业水平、学科能力、学科知识多个维度进校班级之间的对比,掌握本校学生的整体学习情况,进而对未来一段时间内学校整体的管理、教学、教研做出下一步的规划,对个别班级进校重点关注,实现优秀班级稳中求进、普通班级不断提升。
2.2 数据来源
本次分析数据源为某学校高一年级一次模拟考试的物理考试成绩,由于考试数据比较敏感,我们将成绩数据做了一些调整得到,数据主要包含:
(1)试卷题目信息表:主要记录试卷和题目的基础信息,包括试卷id、试卷名称、年级id、年级名称、学科id、学科名称、题目id、题目分数;
(2)题目学科能力关联关系表: 主要记录题目和学科能力的关联关系,包括题目id、学科id、学科名称、学科能力id、学科能力名称;
(3)题目知识点关联关系表:主要记录题目和知识点的关联关系,包括:题目id、学科id、学科名称、知识点id、知识点名称;
(4)学生作答明细表:主要记录学生作答题目的基础信息,包括学生id、学生姓名、年级id、年级名称、班级id、班级名称、学科id、学科名称、试卷id、试卷名称、题目id、题目名称、题目分数、题目得分、题目得分率;
2.3 分析思路
(1)我们有什么数据
目前我们有一次物理考试的学生作答明细数据,主要记录学生作答每个题目的结果数据,包含题目分数和学生在该题目上的得分。同时我们有知识点和题目的映射关系,学科能力和题目的映射关系。
在收集到数据后,需要进⾏数据清洗和整理。这包括去除⽆效数据、处理缺失值、转换数据格式等。在进⾏数据清洗和整理时,需要保证数据的准确性和完整性,以便后续的分析。因为数据本身是我们基于考试成绩修改后的数据,所以数据基本省掉了清洗治理的过程,本次分析中无法体现帆软BI对于数据清洗方面的功能。
(2)这些数据能够做什么
在完成数据清洗和整理后,开始进⾏数据分析。
⾸先,需要对成绩数据进⾏总体分析,了解学⽣的整体成绩⽔平。然后,可以根据题目知识点的关系,计算年级、班级知识点的掌握程度,了解年级、班级的薄弱知识点,为后续的教学教研提供科学依据。其次,根据题目和学科能力的关系,计算年级、班级学科能力得分情况,分析年级、班级学科能力指数,为后续的教学设计提供数据支撑。最后,通过从学业水平、学科能力、学科知识多个维度进行班级之间对比分析,掌握年级学生的整体学习情况,进而对未来一段时间内学校整体的管理、教学、教研做出下一步的规划,对个别班级进行重点关注,以实现优秀班级稳重求进,普通班级不断提升。
(3)围绕第二步中的思路,大家进行头脑风暴,最终得出如下分析模块
由于目标用户主要是学校管理者和老师,考虑到教师的信息化素养和数据阅读能力,因此本次分析中重点使用对比分析,更多地是通过A和B的对比帮助他们发现问题,以便于制定后续的解决方案。
2.4 数据处理
2.4.1 学生成绩汇总
第一步,选择学生作答明细表,使用分组汇总功能,选择班级名称、学生姓名进行分组,围绕题目得分进行汇总,得到学生成绩汇总表。
第二步,使用新增汇总列,对成绩进行排名,汇总字段选择成绩,排序选择降序;得到的数据会按照成绩从高到低进行排名;然后使用排序,对排名进行升序,数据将按照第1~n名排序。
第三步,使用条件标签列,根据区间划分优秀、良好、及格、不及格,给学生成绩打上标签;然后同理新增等级标签,根据200名学生的成绩排名,前30名为A、31~90为B、91~150为C、151~190为D、191~200为E。
注:学生成绩汇总表可以支持整体汇总指标、班级均衡图表、成绩分布(年级)图表、成绩分布(班级)图表、各班平均分图表、等级分布图表。
2.4.2 题目得分率汇总表
第一步,引用学生作答明细表,使用分组汇总,选择题目名称进行分组,围绕题目分数、题目得分进行汇总,得到每道题的总分数和总得分;
第二步,使用新增公式列,由题目得分/题目总分得到每个题目的得分率。
注:题目得分率汇总表可以支持题目得分率图表。
2.4.3 班级知识点汇总表
第一步,选择学生作答明细表,使用左右合并,选择题目维表进行左合并,获取每个题目关联的知识点信息。
第二步,使用分组汇总功能,得到每个班级、知识点的得分情况。
第三步,使用新增公式列功能,计算每个知识点在每个班级的得分率情况。
第四步,根据90%-已掌握、60%~90%-待加强、60%以下未掌握分类,使用条件标签列功能,给每个知识点打上掌握程度标签。
注:班级知识点汇总表支持各班级知识点掌握程度图表、各班级知识点掌握情况图表。
2.4.4 年级知识点汇总表
年级知识点汇总表和班级知识点汇总表前三步处理过程一致,直接计算得到年级下每个知识点的得分率。
注:年级知识点汇总表支持知识点掌握情况(年级)图表。
2.4.5 班级学科能力汇总表
题目关联知识点,同时题目也关联学科能力,因此班级学科能力汇总表和班级知识点汇总表前三步处理过程一致,没有最后第四步打标签的过程。
注:班级学科能力汇总表支持班级学科能力得分率图表。
2.4.6 年级学科能力汇总表
年级学科能力汇总和年级知识点汇总处理过程一致,直接计算得到年级下每个学科能力的得分率。
注:年级学科能力汇总表支持年级学科能力得分率图表。
2.5 图表说明
在决定要搭看板之前我们围绕看板的风格进行了讨论,考虑到帆软提供了一些可直接使用的样式,我们最终决定直接基于“科技”这一样式进行搭建,过程中大家觉得颜色不够突出,因此我们针对颜色向UI进行了请教,最终定下了我们的主题色蓝色(3069fa),其他色块颜色绿色(3fd2bf)、红色(f14e8f)、橙色(fca739)、浅蓝(30bdfa)、紫色(9e63fb),为了让颜色和深色主题看起来更柔和,看板图表所有颜色采用50%透明度。
整个报告排版从上到下采用总分总的方式:
第一个总是标题+指标性诊断结果,标题主要是直接引入主题,告知阅读人这个报告是什么,有什么内容,看完大概能得到什么,指标性诊断结果提前告知阅读人当前现状是什么,是本次报告的结果
分是成绩分析+能力分析+知识点分析,基于本次考试成绩,围绕成绩、学科能力、知识点展开分析
最后的总是诊断结果+整体建议,基于中间的各维度分析,我们得到了哪些结论,学业水平怎么样、学科能力怎么样、知识点又如何,结合教育学原理和教育专家理论在教育场景中的应用,尝试对出现的结果进行分析,发现出现了什么问题,大概是什么原因,为了修正我们可以做哪些事情和准备
最后的术语解释主要对报告中出现的一些专业名词进行解释,便于阅读和理解当前报告
2.5.1 报告标题
报告标题为“高一年级物理考试报告”,直接阐明本次报告的主题。标题下方通过一句话引入本次的分析内容、分析方向以及分析目标。
2.5.2 全年级诊断结果
(1)图表排版布局
三个大的结果性指标都选用了指标图表,通过直观的数字告诉阅读人当前年级的学业水平得分、学科能力得分和知识点掌握程度。三个指标图表下方使用文本组件,将指标结果再次描述了以便,加深印象。对文案中的指标采用橙色加粗,提醒阅读人,当前年级的学业水平得分、学科能力得分、知识点掌握程度均有待提升。
(2)指标释义
指标名称
指标释义
支持查看维度
备注
学业水平得分
年级学生整体学习水平,取对应年级的平均分直接记作该年级的学业水平得分。
年级
学科能力得分
年级学生在学科能力上的掌握情况,通过各学科能力的平均得分计算而来。
年级
知识点掌握程度
年级学生在知识点上的掌握程度,通过各知识点平均得分率计算而来。
年级
(3)数据结论
通过计算,高一年级在学业水平上得分68.3分,满分为100分;学科能力得分为67.0分,满分为100分;学科知识的掌握程度为70.5%。
2.5.3 成绩分析
成绩分析模块,整体上包含5个指标卡片+7个组件,顶部采用5个指标卡片,直截了当的告知阅读人,本次物理模拟考试中年级的平均分(和上次对比变化)、最高分、最低分、优秀率、达标率;为避免阅读人因信息化素养不高无法明白图表的含义,每个图表下方都有对应的图表分析结果,通过文案直观的描述出图表反映出的现状和问题。
2.5.3.1 班级均衡&各班级学业水平对比
(1)图表排版布局
希望展示各班级学生成绩分布情况,因此在这里选择箱型图展示各班级成绩均衡程度。图中每个“箱子“从上到下每条横线代表:最高分、上四分位数、中位数、下四分位数、最低分。
数据选择学生成绩汇总表,表里是本次考试每个班级每个学生的成绩
首先,将班级名称拖到横轴
然后,将学生成绩拖到纵轴
最后,将学生姓名拖到图形属性的细粒度下,至此班级均衡图就生成了
希望展示班级多个指标数据,包含数值和概率型指标,考虑到指标较多,因此选择表格展示各班学业数据。为了更好的展示各班级的最高分、最低分、平均分、优秀率、达标率等数据,使用图表的话,由于指标过多,可能导致阅读人无法获取有效信息,因此通过表格的形式,将各班学业数据按照平均分从大到小排列下来,帮助阅读人直观的了解各班级学业数据。
数据基于学生成绩汇总生成年级数据汇总,提前将所有指标计算出来。
首先,将所有班级名称拖到维度
然后,将其他指标数据挨个拖到指标,至此就得到各班业务水平对比表了
(2)指标释义
指标名称
指标释义
支持查看维度
备注
最高分
本次考试中班级成绩最大值。
班级
最低分
本次考试中班级成绩最小值。
班级
中位数
本次考试中,将班级所有学生成绩排序后,如果学生数是奇数则取正中间学生成绩作为中位数,如果学生数是偶数,则取中间两名学生成绩的平均值作为中位数。
班级
平均分
本次考试中,班级所有学生考试成绩的平均值。
班级
上四分位数
本次考试中,将班级所有学生成绩从低到高排序后,第25%位置的学生的成绩。
班级
下四分位数
本次考试中,将班级所有学生成绩从低到高排序后,第75%位置的学生的成绩。
班级
优秀率
本次考试中,学生成绩得90分以上的学生在全班学生中的占比。
班级
达标率
本次考试中,学生成绩得60分以上的学生在全班学生中的占比。
班级
临界生占比
本次考试中,学生成绩在【40,60)的学生在全班学生中的占比。
班级
(3)数据结论
班级均衡图中,各指标之间的间距表明了分数的集中范围。从班级均衡图和各班学业水平对比表可以看出,2班学生分布最均衡;4班学生成绩分布跨度最大,两极分化严重;1班学生成绩整体偏低。
2.5.3.2 成绩分布(年级)&成绩分布(班级)
(1)图表排版布局
成绩分布(年级)希望展示本次考试中年级维度不同水平的学生人数和占比,因此选择圆环图来进行展示。
数据选择学生成绩汇总,主要用到表里的学生标签(优秀、良好、及格、不及格)字段
首先,将学生标签字段拖到图形属性的颜色,给标签配置不同的颜色
然后,将学生标签拖到图形属性的角度下,根据标签数量确定角度大小
最后,在图形属性的大小下,调整内半径大小,这样就得到一个圆环了
成绩分布(班级)希望在展示本次考试中各班级不同水平的学生人数和占比的同时,能够展示下各班级之间的对比,因此选择堆叠柱形图来进行展示。
数据选择成绩汇总,主要用到学生标签字段
首先,将班级名称字段拖到横轴
然后,将记录数拖到纵轴,同时选择二次计算组内占比
然后,将学生标签拖到图形属性的颜色下,调整各标签颜色,此时一个基本的堆叠柱形图就出来了
最后,再进行一些微调,各班级的成绩分布就呈现在眼前了
(2)指标释义
指标名称
指标释义
支持查看维度
备注
优秀学生数
本次考试中,所选范围下优秀的学生的人数。
年级
年级+班级
优秀学生占比
本次考试中,所选范围下优秀的学生在学生总数中的占比。
年级
年级+班级
良好学生数
本次考试中,所选范围下良好的学生的人数。
年级
年级+班级
良好学生占比
本次考试中,所选范围下良好的学生在学生总数中的占比。
年级
年级+班级
及格学生数
本次考试中,所选范围下及格的学生的人数。
年级
年级+班级
及格学生占比
本次考试中,所选范围下及格的学生在学生总数中的占比。
年级
年级+班级
不及格学生数
本次考试中,所选范围下不及格的学生的人数。
年级
年级+班级
不及格学生占比
本次考试中,所选范围下不及格的学生在学生总数中的占比。
年级
年级+班级
(3)数据结论
从成绩分布(年级)图上可以看出,整体达标率达到了70%,仍有30%的学⽣没有达到及格线。从成绩分布(班级)图上可以看出,不及格学⽣中01班、03班、04班较多,后续教学过程中可以多加关注临界点学⽣,提升整体及格率。从班级成绩分布中可以看出,05班在本次考试中优秀学⽣占⽐最⾼,达到22.5%;01班优秀学⽣占⽐最低,仅有2.5%。
2.5.3.4 各班平均分
(1)图表排版布局
希望展示本次考试中各班级的平均得分情况,为了突出各班级的对比,选择柱形图来进行展示。
数据选择学生成绩汇总,主要用到学生成绩字段
首先,将班级名称拖到横轴
然后,将学生成绩拖到纵轴,计算方式选择平均
然后,为了突出各班级和年级平均分的对比,使用设置分析线功能,取年级平均分设定为横向警戒线
最后,使用图形属性的颜色,设定班级平均分高于年级平均分为蓝色,低于年级平均分为红色,依次来达到视觉上的直观效果
(2)指标释义
指标名称
指标释义
支持查看维度
备注
平均分
本次考试中,所选范围下所有学生成绩的平均值。
年级
年级+班级
(3)数据结论
从各班平均分图上可以看出,02班、05班平均分超过了年级平均分,01班、03班、04班平均分未超过年级平均分。本次考试中,05班平均分最⾼,为73分;01班最低,为65.2分。
2.5.3.5 等级分布(A/B/C/D/E)
(1)图表排版布局
希望展示本次考试中,各班级不同等级学生的人数和占比,采用堆叠柱形图进行展示。
数据选择学生成绩汇总,主要用到等级字段
首先,将班级名称拖到横轴
然后,将记录数拖到纵轴,同时选择二次计算组内占比
接下来,将等级拖到图形属性的颜色下,调整各标签颜色,此时一个基本的堆叠柱形图就出来了
最后,再进行一些微调,各班级的成绩分布就呈现在眼前了,为了视觉效果,这里将横轴纵轴进行了互换
(2)指标释义
等级评定采⽤教育部2014年颁布的《关于普通⾼中学业⽔平考试的实施意⻅》中设定的五等标准,将相应等级转化为对应的分数段。根据200名学⽣的成绩排序,按照15%、30%、30%、20%、5%划分为A、B、C、D、E,⼈数依次为30⼈、60⼈、60⼈、40⼈、10⼈。
指标名称
指标释义
支持查看维度
备注
等级人数
本次考试中,各班级各等级下的学生人数。
年级+班级+等级
等级人数占比
本次考试中,各班级各等级下的学生在班级总人数中的占比。
年级+班级+等级
(3)数据结论
反映了各班在各等级的⼈数分布情况,每个⾊块分别代表每班在该等级的⼈数占本班总⼈数的百分⽐。从图中可以看出,03班⾼分组平均分最低,A等级⼈数3⼈,B等级⼈数10⼈;05班高分组成绩最好,A等级10人,B等级13人。
2.5.3.6 题目得分率
(1)图表排版布局
希望展示本次考试中,每个题目的得分情况,采用折线图进行展示。
数据选择题目得分率汇总表,主要用到题目得分率字段
首先,将题目名称拖到横轴
然后,将题目得分率拖到纵轴
然后,使用设置分析线功能,取60%设定为横向警戒线
最后,使用图形属性的颜色,将低于及格线的题目标红,直观的告诉阅读人哪些题目需要多加关注
(2)指标释义
指标名称
指标释义
支持查看维度
备注
题目得分率
本次考试中,每个题目的得分率;
得分率=题目得分/题目分数×100%;
年级+题目
(3)数据结论
从图中可以看出,12、13、14、15、16题的正确率没有达到及格线,这⼏道题关联的知识点是曲线运动和恒定电流,在后续的教学过程中可以多加关注,围绕这些知识点开展更多的⼀些讲授,同时可以分享更多的⼀些学习资料给学⽣,提升这些知识点的掌握程度。本次考试中全年级题⽬得分率没有达到100%的;3道题⽬得分率达到80%,1道题⽬得分率达到90%,这些题⽬关联的知识点是机械运动,在后续的学习中要继续保持。需要进⼀步发展的知识点有相互作⽤、功和能、⽜顿运动定律、磁场、静电场。
2.5.4 能力分析
能力分析模块,整体上包含4个组件;为避免阅读人因信息化素养不高无法明白图表的含义,每个图表下方都有对应的图表分析结果,通过文案直观的描述出图表反映出的现状和问题。
2.5.4.1 年级学科能力得分率
(1)图表排版布局
希望展示本次考试中整个年级各学科能力的掌握情况,为了更好的展示整个年级的各项能力情况,采用雷达图进行展示。
数据选择年级学科能力汇总表,主要用到学科能力得分率字段
首先,将学科能力名称拖到横轴
然后,将学科能力得分率拖到纵轴
最后,做一些微调,就得到年级学科能力得分率掌握情况了
(2)指标释义
指标名称
指标释义
支持查看维度
备注
学科能力得分率
本次考试中,每个学科能力的得分率,学科能力得分率通过关联的题目进行计算;
得分率=题目得分/题目分数×100%;
年级+学科能力
(3)数据结论
从图中可以看出,整个年级需要紧急提⾼的能⼒是推理能⼒、分析综合能⼒;进⼀步发展的能⼒是理解能⼒、实验能⼒、应⽤数学解决物理问题的能⼒。
2.5.4.2 班级学科能力得分率
(1)图表排版布局
希望展示本次考试中,各班级每个学科能力的掌握情况,为了体现各班级之间的对比,采用多系列折线图进行展示。
数据选择班级学科能力汇总表,主要用到学科能力得分率字段
首先,将学科能力名称拖到横轴
然后,将学科能力得分率拖到纵轴
最后,将班级名称拖到图形属性的颜色中,就得到了各班级在各学科能力上的掌握情况对比
(2)指标释义
指标名称
指标释义
支持查看维度
备注
学科能力得分率
本次考试中,每个学科能力的得分率,学科能力得分率通过关联的题目进行计算;
得分率=题目得分/题目分数×100%;
年级+班级+学科能力
(3)数据结论
从图中可以看出,05班在低阶能⼒上得分率最⾼;05班在⾼阶能⼒上得分率最⾼。03班学⽣在低阶能⼒上和其他班级差距不⼤,但是在中阶能⼒和⾼阶能⼒上和其他班级差距较⼤,尤其是中阶能⼒远低于其他班级,说明该⾼分组学⽣在本次考试中可能⻢⻁,对中阶能⼒考查的重视程度较低,同时低分组同学也应该加强中阶能⼒的掌握。
2.5.4.3 考查能力分析
(1)图表排版布局
希望展示本次考试中,各学科能力的考查占比,因为学科能力名称较长,采用条形图进行展示。
数据选择题目维表,主要用到学科能力字段
首先,将学科能力名称拖到纵轴
然后,将记录数拖到横轴,选择二次计算占比
最后,做一些微调,就得到各能力的考查比例了
(2)指标释义
指标名称
指标释义
支持查看维度
备注
学科能力考查题数
本次考试中,每个学科能力考查的题目的数量,通过关联题目数进行计算,每关联一道题目考查题数+1。
学科能力
考查题目数
本次考试中,考查的题目的数量。
学科能力考查比例
本次考试中,各学科能力考查次数在考查题目数中的占比。
=学科能力考查次数/考查题目数×100%
学科能力
(3)数据结论
反映了所有能⼒的考查⽐例,条形图越⻓,考查⽐例越⾼。考查频率较⾼的能⼒:分析综合能⼒、推理能⼒、理解能⼒。考查频率较低的能⼒:实验能⼒、应⽤数学解决物理问题的能⼒。
2.5.4.4 知识点能力关系
(1)图表排版布局
希望展示本次考试中,每个知识点与能⼒之间的对应关系,采用桑基图进行展示。
数据选择题目维表,主要用到学科能力、知识点字段
首先,将知识点拖到图形属性的起点
然后,将科能力拖到图形属性的终点
然后,将知识点拖到图形属性的颜色
最后,将记录数拖到图形属性的大小,得到知识点和能力之间的关系图
(2)指标释义
当前模块暂无指标。
(3)数据结论
从知识点能力关系图上可以看出,左边代表知识点,右边代表能⼒,所对应颜⾊的柱的⻓度代表所占⽐例,⻓度越⻓,所占⽐例越⾼。知识点和能⼒之间的灰⾊连线代表对应关系,连线左右两端分别连有对应关系的知识点和能⼒,连线的宽度代表对应⽐例,宽度越宽,对应⽐例越⾼。机械运动和⼒主要考查理解能⼒;相互作⽤主要考查理解能⼒;⽜顿运动定律主要考查理解能⼒;静电场主要考查理解能⼒和推理能⼒;功和能主要考查实验能⼒和理解能⼒;磁场主要考查实验能⼒和应⽤数学解决物理问题的能⼒;曲线运动主要考查推理能⼒和分析综合能⼒;恒定电流主要考查应⽤数学解决物理问题和分析综合能⼒。
2.5.5 知识点分析
知识点分析模块,整体上包含4个组件;为避免阅读人因信息化素养不高无法明白图表的含义,每个图表下方都有对应的图表分析结果,通过文案直观的描述出图表反映出的现状和问题。
2.5.5.1 考查知识点分析
(1)图表排版布局
希望展示本次考试中,各知识点的考查占比,因为知识点名称较长,采用条形图进行展示。
数据选择题目维表,主要用到知识点字段
首先,将知识点名称拖到纵轴
然后,将记录数拖到横轴,选择二次计算占比
最后,做一些微调,就得到各知识点的考查比例了
(2)指标释义
指标名称
指标释义
支持查看维度
备注
知识点考查题数
本次考试中,每个知识点考查的题目的数量,通过关联题目数进行计算,每关联一道题目考查题数+1。
知识点
考查题目数
本次考试中,考查的题目的数量。
知识点考查比例
本次考试中,各知识点考查次数在考查题目数中的占比。
=知识点考查次数/考查题目数×100%
知识点
(3)数据结论
反映了所有知识点的考查⽐例,条形图越⻓,考查⽐例越⾼。考查频率较⾼的知识点:曲线运动、静电场。考查频率较低的知识点:功和能、机械运动和⼒、⽜顿运动定律、相互作⽤。
2.5.5.2 知识点掌握情况(年级)
(1)图表排版布局
希望展示本次考试中,各知识点的掌握情况,采用线柱结合图进行展示。
数据选择年级知识点汇总表,主要用到知识点、得分率字段
首先,将知识点名称拖到横轴
然后,将得分率拖到纵轴,选择使用右值
然后,将记录数拖到纵轴,选择使用左值轴
最后,对样式等细节调整完就得到了年级的知识点掌握情况图
(2)指标释义
指标名称
指标释义
支持查看维度
备注
知识点考查次数
本次考试中,每个知识点考查的次数,通过关联题目数进行计算,被关联的题目被作答一次,考查次数+1;
知识点
知识点得分率
本次考试中,每个知识点的得分率,知识点得分率通过关联的题目进行计算;
得分率=题目得分/题目分数×100%;
年级+知识点
(3)数据结论
反映了年级学⽣在本次考试中所有考查知识点上的掌握程度。本次考试共考查了8各知识点,分别是功和能、恒定电流、曲线运动、机械运动和⼒、⽜顿运动定律、相互作⽤、磁场、静电场。从整体来看⾼⼀年级掌握⾮常好的知识点是机械运动和⼒,掌握不够好的知识点是曲线运动和⽜顿运动定律。
2.5.5.3 各班级知识点掌握程度
(1)图表排版布局
希望展示本次考试中,每个班级不同掌握程度的知识点的数量,使用堆叠柱形图进行展示。
数据选择班级知识点汇总表,主要用到知识点掌握程度字段
首先,将班级名称拖到横轴
然后,将记录数拖到纵轴,选择记录总行数
然后,将知识点掌握程度拖到图形属性的颜色,给不同的掌握程度配置好颜色
最后,对样式等细节调整完就得到各班级不同掌握程度的知识点数量对比图
(2)指标释义
指标名称
指标释义
支持查看维度
备注
知识点数量
本次考试中,每个班级不同掌握程度的知识点数量;
根据知识点得分率将掌握程度分为【0,60%)未掌握,【60%,90%)待加强,【90%,100%】已掌握。
班级+掌握程度
(3)数据结论
从图中可以看出,本次考试中各班级掌握情况均不理想,各班级⼤部分知识点都待加强。其中02班表现较好,没有未掌握知识点;04班表现较差,出现2个未掌握知识点。
2.5.5.4 各班级知识点掌握情况
(1)图表排版布局
希望展示本次考试中,每个班级在每个知识点上的掌握情况,使用气泡图进行展示。
数据选择班级知识点汇总表,主要用到知识点得分率字段
首先,将知识点名称拖到横轴
然后,将班级名称拖到纵轴
然后,将知识点得分率拖到图形属性的大小,调整半径到合适大小
然后,将班级名称拖到图形属性的颜色,给每个班级配置上不同的颜色
最后,对样式等细节调整完就得到各班级每个知识点的掌握程度
(2)指标释义
指标名称
指标释义
支持查看维度
备注
知识点得分率
本次考试中,每个知识点的得分率,知识点得分率通过关联的题目进行计算;
得分率=题目得分/题目分数×100%;
年级+班级+知识点
(3)数据结论
图中圆圈越⼤,表明该知识点掌握的越好。本次考试共考查了8各知识点,分别是功和能、恒定电流、曲线运动、机械运动和⼒、⽜顿运动定律、相互作⽤、磁场、静电场。从图上可以看出,05班级的整体知识点掌握程度最⾼;03班整体知识点掌握程度较低。
2.5.6 诊断结果+整体建议
2.5.6.1 诊断结果
诊断结果模块是对上面所有模块分析结束之后的汇总,如标题中所示,我们通过从学业水平、学科能力、学科知识多个维度进行班级之间对比分析,来掌握年级学生的整体学习情况,进而对未来一段时间内学校整体的管理、教学、教研做出下一步的规划,然后对个别班级进行重点关注,以实现优秀班级稳重求进,普通班级不断提升。
最终诊断结果如下:
(1)在成绩上
05班整体表现优异;01班整体成绩不乐观,需要特别关注;04班学生成绩两极分化严重。
(2)在学科能力上
05班整体表现优异,在高阶能力最高、中阶能力第二、低阶的能力最高;整个年级需要紧急提高的能力是推理能力、分析综合能力;进一步发展的能力是理解能力、实验能力、应用数学解决物理问题的能力。
(3)在学科知识点上
整个高一学生在曲线运动和牛顿运动定律上掌握的不够好。
2.5.6.2 整体建议
针对当前现状,给出教学、教研、管理方面的建议。
(1)教学方面
通过本次分析,需要特别关注01班的教与学情况,可以组织年级组长或其他有经验的教师进班听课,与该班教师讨论交流,提出教学改进建议,在条件允许情况下实行共同备课,帮助该班教师快速成长,同时该班教师也应与学生深入交流,了解学生学习的难点与兴趣,进行有针对性的教学和教研。03班教师需要和本班高分组学生多进行交流,增强该部分学生对中阶能力考查的重视,同时增强中阶能力的训练。04班教师应着重关注本班低分组学生,了解他们的学习问题,并给予相应的帮助,或是学生之间相互帮扶、共同进步。
01班、03班教师可以多和05班教师交流学习,同时多于本班学生进行交流,了解他们的薄弱知识点。整体上,每个班级的教师需要重点关注本班低分组学生,帮助他们夯实基础知识,对于高分组学生,要让他们重视对低阶、中阶能力的考查。此外全校教师在曲线运动和牛顿运动定律上的教学要加以重视,分析学生在掌握该部分知识上的难处,调整教学策略,帮助学生改进学习方法,提升学习效果。
(2)教研方面
在备课阶段可以请05班教师或其他优秀教师参与试听并提意见,也可以进行协同备课或是同课异构,进行有针对性的教研。同时加强本校不同学科教师之间的联系,在知识点应用教学方面相互补充。
(3)管理方面
学校应配备教学所需资源,包含但不限于仪器、设备、教学材料等,鼓励教师多开展与教学相关的实验或实践活动。同时要组织教师间多交流,在教学上互相学习。也可以去其他优秀学校进行参观学习。
2.5.7 术语解释
为了降低报表的阅读门槛,对于一些专业词语和指标,我们统一把它们成为术语,在术语解释部分统一进行解释。
2.6 最终报告
仪表板地址:https://bisolutions.fanruan.com/webroot/decision/link/h9EG
三. 参赛总结
3.1 关于FineBI工具
3.1.1 小白视角的好
帆软功能的强大毋庸置疑,在使用过程中可以深刻体会大功能的完备性,以下是使用过程中感觉有趣的地方:
(1)数据处理模块
数据处理模块的条件标签列,当我们希望对数据打一些标签时,这个功能可以帮助与我们快速实现这一诉求,比如本次分析中希望根据学生成绩来给学生打上优良中差的标签,使用条件标签列,一分钟轻松搞定
数据处理模块的左右合并和上下合并功能,数据分析过程中我们经常需要将两个表甚至更多表的数据关联到一起,以前不得不写各种join语句来实现,现在通过左右合并和上线合并功能,可以快速实现这一诉求,比如本次分析中通过左右合并,快速将学生作答明细和题目维表进行关联,得到题目关联知识点的相关信息
(2)组件之作模块
组件制作模块,图表类型十分丰富,可以支持各种维度的数据分析和图表制作,比如本次我想制作班级学生成绩的箱型图,起初我还在想着先计算出四分位数,然后再选择对应的图表;制作过程中发现帆软不支持计算上四分位数和下四分位数,只支持计算最大值、最小值和中位数;在咨询完比赛知道教师后,了解到箱型图可以直接生成这些指标,无需对数据进行二次处理,直接使用学生成绩汇总数据即可
组件制作模块,所有数据表都自带了一个记录数指标,可以直接拿来使用,方便快捷,减少在数据处理阶段的步骤。
(3)仪表板制作模块
仪表板制作模块,系统提供了一些默认的仪表板样式,大大减少了我们在样式搭配上花费的时间,快速搭建出不同场景下的仪表板
3.1.2 小白视角的”不好“
在整个报告制作过程中,同样也遇到了各种各样的问题,有些通过帆软BI快速解决,而有些则不得以更换了方案,帆软BI功能虽然已经很强大了,但同样也存在一些问题,以下是我的一些想法和建议:
(1)数据处理模块
印象中数据处理流程之前是在左侧的,当前版本放到了右侧,整体使用起来会有一些不适,从视觉角度来说,左侧比右侧使用起来更方便,更能一眼知道当前数据有哪些处理步骤。
数据处理中的排序功能,页面显示添加排序列,给人第一印象就是会在数据表中新增一列,但是真正实现的时候只是对所选列进行了排序,并没有生成新的一列,最终通过新增汇总列实现了这一功能,建议这里可以点击排序时让用户选择是否新增一列排序,还是在原来字段基础上进行排序
(2)组件制作模块
同样是上面提到的箱型图,选择学生成绩之后,发现箱型图给出的最大值和最小值不在学生成绩中,搜了很多资料才发现,箱型图的计算结果不一定在原数据中,中位数和上四分位数、下四分位数不在我能够理解,最大值和最小值不在有点无法理解;我将同样的数据在excel中选择箱型图得到的最大值和最小值就是原数据中的最大值和最小值,因此建议箱型图生成最大值和最小值的地方可以优化一些,至少给用户一个选择是否直接取原数据中的最大值和最小值,毕竟学生成绩最大值超过满分,最小值是负分还是有点无法接受的
堆叠柱形图,鼠标移入柱子时,希望提示中显示每种类别的数量和占比,但是目前只能是移到哪一节,显示哪一节对应类别的数据。
表格无法调整背景色的透明度,目前只有图表类的颜色支持透明度的调整,希望表格类的也能支持
图例颜色,当图表颜色选择透明度时,图例只显示没有加透明度的颜色,建议和图表保持一致
指标目前无法实现环比或同比,比如平均分可以支持选择历史考试成绩的数据进行对比,自动计算出上升还是下降,变化比例是多少等等
如果不点击页面上方血缘视图按钮,无法快速知道当前组件使用的是哪个数据表,建议初始化打开组件时,左侧数据默认打开当前组件使用的数据表,或者能给对应的数据表加上标识(比如表名字标红)
(3)仪表板模块
文本组件功能太过简单,无法对文本样式进行一些复杂设计,比如支持给文本直接加前缀,支持添加一些表情或符号
3.2 参赛总结
写到这里,本次比赛内容基本告一段落,大家在这段时间里不断地讨论、修改,终于交出了一份让我们自己还算满意的答卷。因为大家都不是专业的教育专家,无法站在更加专业的角度对数据进行剖析和解读。在整个报表制作过程中,大家非常担心做出的东西不符合教育场景,同时也害怕报告中的概念或理论有误而影响到别人。在整个报表制作过程中,大家翻阅大量教育相关资料,从上上搜罗了很多关于考试报告的文章,加上我们自己的理解,终于做出了这份报告。不管结果如何,先给大家点个赞。
本次比赛我们选择了教育分析作为主题。这个主题涉及到如何利⽤数据分析技术来优化教育⾏业的各个⽅⾯,包括学⽣评估、教师课程设计、教师培训等。不同于其他行业,数据在教育这里不再是冷冰冰的数字,也不再是老板口中商业化变现的工具,在这里数据被赋予了更多的意义,它是学生学习的痕迹,它是教师教学的回忆。科技在不断进步,ChatGPT的横空出世再次推动了人工智能的发展,教育这个古老的行业再次被赋予了新的生命。国家不断推动教育数字化改革,随着教育数字化转型的不断深入,教育场景下的数据可视化是数字化时代下的必然趋势。可视化分析可以帮助学生更好地了解学习进度和掌握情况,帮助教师优化教学体验推动教育创新,为教育管理者提供更加准确、全面的数据支持和决策依据。
遥想当年,我们坐在课堂上上课的场景,那时候老师在黑板上奋笔疾书,我们在下面奋笔疾书,没有信息化的加持,没有大数据的助力,我们走的有点吃力。如今通过人工智能和大数据技术,根据学生学习行为和学习结果数据,我们可以生成学生学习画像、个人知识图谱,基于学生历史数据预测学生未来的发展,提前发现问题,及时进行干预,帮助学生持续进步,业内某公司的口号是“人工智能助力教育,因材施教成就梦想”,我想可能在未来的某天我们真的能够实现孔子的教学理念。
学业水平评价是保证和提升基础教育质量的重要途径之一,随着教育评价改革的深入,基于学业水平评价也成为国内外教育研究与实践探索的重要领域。传统的学生学业水平评价方法单一,主要以考试分数量化的形式来衡量学生掌握知识的程度,把分数看成是学生学习能力、学习态度的代名词,而对于学习过程中学生的行为表现、情感态度等关注较少,这种评价方式在一定程度上抹杀了学生的个性,抑制了学生的实践能力和创新能力。
今天我们的考试报告到此结束,但是教育大数据的进程才刚刚开始,在倡导教育实证研究的今天,大数据必将在教育评估中扮演重要角色。而我们作为数据行业的从业者,是否做好准备了呢?