【2023BI数据分析大赛】出行车祸分析与探索
【2023BI数据分析大赛】出行车祸分析与探索
一、选手简介
1、选手介绍
团队名称: 新时代bugBI
队长介绍:吕凯,帆软社区用户名 kenln,目前就读于金陵科技学院,计算机工程学院,22级数据科学与大数据技术。熟悉使用python、Java语言开发,参加过RAICOM智慧物流B比赛,且对机器人方面有一定的基础知识。
成员介绍:
成员一:周宋垒,帆软社区用户名养猪大师不卖猪,是一名数据科学与大数据技术专业的在校学生,未来想从事与数据分析相关的工作。在了解到此次FineBI大赛后,我便积极寻找有意愿一起参赛的队友,也如愿加入到了一个优秀的队伍,组成了“新时代bugBI队”
成员二:闫卫,帆软社区用户名幽谷,新时代bugBI成员,金陵科技学院大三学生,大数据专业,爱好篮球,因帆软和其余成员相识,共同努力,不断创新。
成员三:王粤,帆软社区用户名孙桐伊,新时代bugBI成员,现为一名在校就读的大学生。专业为大数据专业。从朋友那里了解到此次FineBI大赛,并产生兴趣,与朋友一同组队参赛。
2、参赛初衷
在这个比赛中,我们不仅可以竞争,还可以学习和交流。与其他来自不同背景的数据分析专家和业界同行相互切磋,我们可以从他们身上汲取经验和见解,拓宽我们的思路和视野。我们知道,这个比赛不仅是一场竞技,更是一个实现梦想的舞台。我们将努力充分发挥自己的潜力,用我们的作品和表现赢得评委和业界的认可。我们相信,通过参加FineBI比赛,我们将获得宝贵的经验和机会,不仅有机会赢得丰厚的奖品,还有可能获得职业发展的新起点。
二、作品介绍
1、业务背景/需求痛点
业务背景:当今社会,交通事故已经成为一个严重的社会问题,给人们的生命安全和财产造成了巨大的损失。每年都有成千上万的人在交通事故中失去了生命,许多其他人则因此受伤。根据数据统计,交通事故是导致世界范围内年轻人死亡的主要原因之一。在大多数城市和地区,交通事故频繁发生,无论是在高速公路上还是在城市道路上。这主要是由于日益增多的机动车辆数量、不负责任的驾驶行为、道路规划和设计的不完善、驾驶员的疏忽和高速行驶等因素造成的。在这种背景下,分析交通事故的业务变得至关重要。了解交通事故的发生原因、环境因素、司机行为和时间因素等信息,可以提供有关交通安全改进和措施的重要见解。这为政府部门、交通管理机构、保险公司和研究机构等提供了数据支持和决策依据。
需求痛点:数据分析的复杂性:交通事故数据通常包括大量的信息,如事故类型、地点、时间、天气、受伤情况等。分析这些复杂的数据需要进行统计分析、数据挖掘和机器学习等技术,而这些技术对于非专业人士来说可能过于复杂和困难。缺乏全面的综合分析:交通事故分析需要综合考虑多个因素,包括道路条件、车辆状态、行人行为等。然而,现有的分析方法往往只专注于某一方面的因素,难以达到全面的分析效果。
2、数据来源
自选数据:采用了中国统计年鉴的数据,以及阿里天池的“Accidents in France from 2005 to 2016”
3、分析思路
围绕着交通事故—车祸这个主题,我们把它拆解成了四个大点,分别是自然环境因素分析、道路因素分析、时间因素分析和人为因素分析。因为我国每年都有成千上万人因交通事故受伤或死亡,而自然环境因素、道路因素、时间因素和人为因素是交通事故的四个个重要影响因素,因此我们选了这四种因素为此次的研究对象,考察了这四因素对交通事故的发生起到了关键作用,以法国05—16年数据作为模板,希望从中得出的结论能够为中国交通事故预防做出参考,提供一些量化参考意见。
第一大点的自然环境因素分析,我把它们拆分为异常天气条件与事故分析,道路情况与事故数量分析,2005—2016年发生事故总量的四季分布分析和季节与碰撞类型分析。这些分析,主题便是帮助人们更好的认识到自然环境对车祸发生概率的影响,从而避免悲剧的发生,交通管理部门可以采取相应的措施,优化道路设计、增设警示标志、提高安全意识等,以降低事故的发生率。
第二大点的道路因素分析,我们将它分为碰撞类型与车祸发生场所分析,不同车祸场所在各时段发生的事故分析,碰撞类型与道路类型的关联分析和碰撞类型—追尾与闹市区的关联分析。道路类型因素是交通事故分析重要的一环,关系着人民的日常生活乃至整个国家的社会建设。这些主题希望交通部门优化道路设施和标志的合理性,能够减少驾驶员的困惑和错误行为,提高道路使用者的安全性,通过合理的交通管制和限速措施,可以减少事故的发生,并提高道路行驶的安全性。
第三大点的时间因素分析,我把它们拆分为不同时段发生事故的严重程度分析、不同道路在各时段内发生的事故分析、事故发生区域与时段的分析和节假日前后两天事故发生数量变化分析。这些分析,主题便是通过对时间因素进行分析,可以预测和识别交通高峰时段,并采取相应的交通管理措施,如交通信号优化、车道分配和交通管制等,以减少拥堵和事故的发生。通过分析历史数据和趋势,可以预测交通事故发生的热点时间段,如假期、节假日等。在这些时间段内,可以加强巡逻执法、加大路面巡查和交通管制力度,以及加强对驾驶员的宣传教育,提醒他们注意安全驾驶。
第四大点的人为因素分析,我把它们拆分为出行原因分析、事故频数与驾驶员性别分析和交通事故与行人行为的关联分析。这些分析,主题便是对不同出行原因进行分析和监测,希望交通管理部门可以针对性地制定相关的安全政策和宣传教育,提高驾驶员的安全意识和行为规范。通过加强对行人的宣传教育、改善行人设施和增加执法力度,可以提高行人的意识和行为规范,减少交通事故的风险。
4.数据处理
(1)原数据的出处与简单处理
本次分析主题为道路交通事故分析,所用数据来自中国统计年鉴的数据,以及阿里天池的“Accidents in France from 2005 to 2016”,因为阿里天池的部分数据是英文,所以我们参照文献,利用Excel将分表中可应用的数据合并,并进行汉化翻译以及注释,得到最原始的且能被我们所理解的总表格。
user.csv
place.csv
总表
数据导入以及数据分析处理(举例)
将总表数据上传到FineBI,进行过滤操作,去掉空值,得到图①。
以时间与事故发生数量的关系分析为例:首先进行字段设置(挑出所需字段) --> 过滤(去除空值)--> 分组汇总(分出上午、下午、晚上、傍晚等时间段) -->过滤(防止出现出现错误数据) -->字段设置(将时间的数据类型改为文本类型)
--> 行转列(将第一列转成行,图②) -->字段设置(重新命名各字段)--> 排序(按照时间排序),最终得到图③。
图①
图②
图③
数据处理结果
确定不同的研究方向,选取不同的字段数据,进行如上的数据处理,最终得到可以为我们所用的一张张表格。
5、可视化报告
(1)我们的图标布局排版采取的是总分的手法,在平行的结构中探寻深入的价值。蓝紫色系以及地图作为背景突出了主题:交通事故—车祸
(2)组件:2020年各省车祸死亡人数与财产损失,2005—2020年全国交通事故发生数,采用区域地图和折线图的形式,强调出我国在交通事故方面存在重大损失和较大隐患。
组件:异常天气条件与事故分析,道路情况与事故数量分析,2005—2016年发生事故总量的四季分布分析,季节与碰撞类型分析,采用折线图,柱状图,饼图的形式,展示出自然因素在交通事故中担当何种角色,并强调小雨和多云是异常天气事故中频率最高的两种天气,和潮湿地面是大多数自然因素影响事故的极大可能因素。
异常天气条件与事故数量分析
分析道路路面情况与事故数量的关系
组件:碰撞类型与车祸发生场所分析,不同车祸场所在各时段发生的事故分析,碰撞类型与道路类型的关联分析和碰撞类型—追尾与闹市区的关联分析,采用雷达图和柱状图,展示出十字路口是交通事故的重灾区,一天中的傍晚是事故最高发的时候,强调省道和市镇道路车祸高发。
不同车祸场所所在各时段内的事故分析
车祸碰撞类型与道路类型的关联
组件:不同时段发生事故的严重程度分析、不同道路在各时段内发生的事故分析、事故发生区域与时段的分析,节假日前后两天事故发生数量变化分析,采用雷达图,柱状图和多条折线图,着重展示出事故严重程度与事故时段的关联和节假日与事故发生的关联,强调傍晚事故发生率最高且省道市镇道路依旧事故频发,以及事故多发生在节假日前后两天。
道路类型与时间段的分析
节假日前后两天事故发生数量变化
组件:出行原因分析、事故频数与驾驶员性别分析,交通事故与行人行为的关联分析,采用词云和饼图等,着重强调休闲娱乐是人们发生交通事故时最大的出行原因,并展示出穿越马路是绝大交通事故中行人行为的最多情况。
出行原因分析
交通事故与行人行为的关联
最终分析总结:在小雨和多云天气下事故发生数量较多,而更为恶劣的天气条件下,事故发生数反而更少。在潮湿路况下,事故发生率高,而更恶劣路况下事故发生率反而很低。
由此,虽然有路面潮湿情况的基数要远远大于其他道路情况的原因,但我们不难分析出这种可能,在轻微不良条件下,人们可能会忽视这些不良情况,没有给予足够的注意和警惕,这导致了不小心犯错或鲁莽驾驶的可能性增加,从而增加了事故的发生率,而恶劣情况下,人会更加警惕,这可能有助于减少事故发生的可能性。
在车祸发生场所中,十字路口是车祸的重灾区,与此同时,在傍晚,两辆车侧面相碰概率最高,这不难发现,在十字路口的情境下,侧面相碰多半是一方违反交通法规,亦或者一方不当变道或转弯,也可能是驾驶员不当速度或距离控制。侧面碰撞与追尾也在省道和市镇道路多多发生,说明要多多加强在这两种道路的交通监管。
同样,民众在休闲娱乐的过程中容易放松警惕,从而导致事故发生提高,同样,民众穿越马路的时候也是事故高发,说明我国需要有更多手段提高人们穿越马路的安全性。
我们的建议:交通管理部门可以采取相应的措施,如优化道路设计、增设警示标志、提高安全意识等,以降低事故的发生率。优化道路设施和标志的合理性,能够减少驾驶员的困惑和错误行为,提高道路使用者的安全性,通过合理的交通管制和限速措施,可以减少事故的发生,并提高道路的安全性。
在事故频发时间段内,交通管理部门可以加强巡逻执法、加大路面巡查和交通管制力度,以及加强对驾驶员的宣传教育,提醒他们注意安全驾驶。可以针对性地制定相关的安全政策和宣传教育,提高驾驶员的安全意识和行为规范。也可以通过加强对行人的宣传教育、改善行人设施和增加执法力度,如增加摄像头抓拍、增加志愿者管理交通安全等,可以提高行人的意识和行为规范,减少交通事故的风险。
(3)最终结果呈现的页面布局(注:如下图片拼接无法展现大屏魅力,可点击链接查看动态大屏)https://bisolutions.fanruan.com/webroot/decision/link/LmK8
三、参赛总结
1、FineBI工具
FineBI提供了新增列,分组汇总,过滤,排序, 上下合并,左右合并等功能,让用户以极低的学习成本将数据处理成自己需要的结果。相比于Excel,FineBI在处理数据上缩短了一定的时间。FineBI提供可视化的数据分析,让我们能够用简单快捷的操作直观的了解数据,使数据的分析过程变得更加高效。除了基础的图表类型,FineBI的可视化图表还可以实现强大的地图功能,支持区域地图,热力地图,流向地图等丰富的地图效果。
2、参赛总结
这是我们第一次参加BI大赛,在对BI工具没有一定了解的基础上,我们花费了一段时间来对BI工具的用法以及作用进行了学习,跟随着几位老师的直播课程进行实操,再使用BI本地提供的数据进行了几轮实践,我们也得以略微熟练掌握了BI工具的用法。
仪表板的功能让我们可以将多个分析内容、分组组件融合到一个仪表板中去,在仪表板中我们可以通过筛选器对数据进行筛选,也可以将数据之间进行关联分析。我们还可以进行自定布局,使整张图表变得更加清晰、美观,从而更好的表达出数据分析的思路和结果。