一、选手简介
1、选手介绍
个人介绍:帆软社区用户名是创生之柱,目前第二个硕士在读,人工智能方面的毕业论文撰写中,同时在备考博士,个人感兴趣的方向和领域有商业智能,数据分析,数字化转型,计算引擎,视觉、自然语言理解方向的人工智能等。
2、参赛初衷
- 希望通过比赛提升自身数据分析能力
- 促使自己掌握FineBI的使用
- 向诸位数据分析能力者交流学习,进行数据可视化展现以及分析思维的精进
- 之前被销售顾问劝说报名过CDA一级了,这次奖品中包含二级
二、作品介绍
1、业务背景/需求痛点
- 业务背景:行政事业单位交通委负责交通行业企业、车辆、船舶、从业人员相关业务的审批办理工作,涵盖运政、路政、交通影响评价共三大板块的事项。运政审批事项及相关行政服务事项16项,子事项138项;路政审批事项13项;交通影响评价审查事项1项。
- 需求痛点:交通行业业务范围较广、行业较多、事项繁杂,数据量庞大,业务数据统计指标不完善,未建立常态化的数据分析机制,在缺乏数据分析的现阶段,无法准确按照实际需求建立相关数据报表。
2、数据来源
- 数据来源系统比较多,1)运政业务涉及运输局行政审批及电子监察系统、水运局海事系统管理平台、道路运输车辆动态信息公共服务平台三个系统,不同业务使用不同的平台办理。2)路政业务使用市投资在线审批监管平台对进驻事项中固定资产投资项目进行受理、告知、送达;城市道路、公路超限两项非固定资产事项全流程使用委路政局行政许可与执法系统进行办理。其他四项非固定资产事项使用市统一行政审批管理平台进行办理。3)交评业务涉及网上申报系统、交通影响评价审查系统及投资项目在线审批监管平台三个系统。
- 数据表:从功能归纳来说,主要使用三类表,这是个人将各系统表进行分类加工汇总总结的,三类表各司其职。1)acc账户表,账户表存有基础信息,如某事项受理完成后,账户表即增加事项对应的企业、车辆、人员等信息。以车辆账户表为例,有经营范围、运力指标、所属区县、车辆营运类型、燃料类型、运营状态、车辆厂牌、车辆使用年限、单双班、人员说明、从业资格类型等。2)audit审批表,存放事项办理环节,如事项名称、申办人、申报经济类型、受理时间、受理编码、各办理阶段的办理人、状态信息、处理和告知等时间3)node节点表, 以车辆办理事项为例,有受理、初审、现场勘验、复审、车辆查验、审查、审定、告知等环节。
3、分析思路
- 围绕分析主题,面对海量数据,根据数据分类、数据作用、事项办理规定等,我进行了拆解、分析方向主要有保有量变化情况、业务办理频率、业务办理效率、关联数据交叉分析、预测模型、决策模型六方面。
- 模型:用了行为事件分析模型、分布分析模型。结合数据分析主题和本次数据特点,我认为应该进行的工作依次为:1)识别统计需求。识别需求要利用哪些信息支持本可视化研究过程输入、过程输出、资源配置的合理性、过程活动的优化方案和过程异常变异的发现。2)收集数据及数据预处理。将识别的需求转化为具体的要求,将系统数据库中的数据按照需求进行提炼,将缺失值进行填充或替换,防止数据问题对工作的干扰。3)分析数据。对于基础数据,按分类进行描述性统计;对于办理数据进行描述性统计、交叉分析;对于预测数据,基于历史数据使用软件建立模型以及按年审时间推测。4)数据可视化展现选取各种图表类型反映适用的数据关系,研究设计多样化的交互式及可读性强的图表展现。
- 每个分析方向都能想到分析主题,我认为进行深度分析的话应该有1)保有量变化可以预测运政、路政、交评业务各数据类别的数量变化同比;2)业务办理频率可以按天、月度、季度、年度对三板块业务进行不同细粒度的指标分析;3)业务办理效率分析包括新企业办理情况、工作人员办理效率、待办业务超时情况;4)关联数据交叉分析可以研究事项咨询量与受理量的关联分析,运政业务的企业、线路、车辆、运力、船舶、从业人员的关联分析,路政业务的工程单位、地点、工期的关联分析,交评事项的阶段、用地性质关联分析;5)预测模型在运政业务的六个行业可以预测总事项受理量、年审事项受理量的滚动预测,路政业务的主要事项受理量及收取费用的滚动预测,交评业务的受理量及项目数量与建设规模的滚动预测;6)决策模型整体及三板块的受理量、业务办理时间时点、保有量等分布进行决策分析。
4、数据处理
- 进行的哪些数据处理:通过对原始数据字段进行分析,梳理出了业务脉络和关注重点。审批业务有其特点,是没有企业中的销售量或利润率等的达标要求,也不涉及公式计算。
- 数据质量一般,所有数据清理等处理手段都使用了。最终出于竞赛的数据量不能过于庞大的考虑,放弃了复杂的交叉分析,以简单的面貌呈现给大家。
- 使用自助数据集进行数据处理:需要进行数据清洗,字段抽取和字段拆分不多。用Pandas和Numpy包来进行数据清洗,如drop()函数来移除一个DataFrame中不想要的行或列,删除DataFrame 中的不必要 columns,改变DataFrame的index,使用DataFrame.applymap() 函数按元素的清洗整个数据集,重命名columns 为一组更易识别的标签,滤除CSV文件中不必要的rows。
5、可视化报告
(1)数据含义表达和图表排版布局
- 组件的业务含义:1)制作条形图、直方图以显示各业务受理量排名和收取占路费、掘路费、监理费分类比较数据关系。2)制作折线图、面积图以显示滚动预测趋势分析数据关系。3)制作柱形图、饼图以显示受理量等构成数据关系。4)制作环形图、堆积柱形图以显示事项办理情况与审批内容的关联等的数据关系。
- 关键指标制作步骤:我认为如果是正式的关键指标,应该按照指标体系名称、子体系工作目标、指标编号、指标内容、指标来源、工作相关度等维度形成指标可唯一对应的的指标体系明细。对于竞赛,为了减少观者的认知和记忆负担,我选取了部分内容(审批数据和预测数据)进行分析。
-
- 以下为举例说明
-
-
-
-
-
-
-
- 排版布局按照先已办理的数据、后预测的业务量情况两部分,该每部分分别按照运政、路政、交评的顺序排列组件;设置颜色:帆软内置颜色有很多种组合,总能找到满意的,我选了一组心中理想的颜色系列,也可以按危货行业用橘色、省际行业用翠绿色、旅游行业用灰绿色、出租行业用黄色、水运海事行业用海蓝色、外资行业用豆沙色等自己喜欢或认为合理或符合公众认知的组合。
(2)通过分析得出的结论
- 结论:在梳理了统计分析指标项及预测数据后,将各指标项归纳总结,建立了行政审批综合业务统计分析及决策分析框架,对体系整体情况进行描述。
- 结论对业务工作及决策产生的影响:我认为对审批业务开展过程中的相关审批过程数据、结果数据等进行分类梳理,提炼审批业务统计关键指标,同时按照“从整体到局部、从局部到细节”的分析层次构建行政审批综合业务统计分析体系,借助FineBI分析并可视化展现,将为开展综合性统计分析工作提供基础支撑。
- 提升效率:通过对业务数据、服务考核数据等相关数据深入分析,研究相关分析结果在行业管理中的应用,对日常运行数据的分析、挖掘,将可以为决策者、各级管理者提供经营决策依据,以全方位掌握审批服务中心业务运行情况,帮助管理层决策、监控各行业指标的运行情况,制定正确的经营决策。
- 影响决策:完善统计指标体系架构、统计分析数据报表和统计分析报告模板等相关内容进行,形成统计分析决策体系及业务评价机制,结合行业管理重点工作,通过对业务数据、服务考核数据等相关数据深入分析,研究相关分析结果在行业管理中的应用,对日常运行数据的分析、挖掘,为决策者、各级管理者提供经营决策依据,以全方位掌握审批服务中心业务运行情况,帮助管理层决策、监控各行业指标的运行情况,制定正确的经营决策。
(3)最终结果呈现的页面布局
三、参赛总结
1、FineBI工具
- 第一次使用,之前听说过帆软,没想到个人版是免费使用的,这点太好了。我觉得FineBI学习门槛低,报表设计器挺有意思的,数据联动、灵活的插件配置、权限复用等等功能都很优秀。看到一点点小问题不知道是不是360浏览器的配置——我设置组件时常弹出搜索网页。
2、参赛总结
- 克服的困难:如果只思考不动手,永远也不能实现,尤其是个人参赛,是一个人从头到尾完成所有工作,没有其他人督促也没人出建议和帮忙的情况下,非常辛苦更异常孤独。
- 感恩的事儿:通过这次竞赛,学会了使用FineBI,这技能太有价值,同时也调节了心情。(最近遇到一件事情是我一个人写了一本书的多半章节,出版之际发现好多章节被署了其他一些人的名字,这即使从较轻的程度讲也是稀释了我的工作量,心里立刻怀疑自己长时间熬夜写它的意义究竟是什么。本来是比较郁闷的,但正好看到帆软的夏季挑战赛,于是将时间和注意力投入到数据分析和可视化绘制中,心情差的时候就忙这次竞赛,心结也消散了不少)。
- 认知新感悟:这次帆软竞赛还好点,除了时间极其有限,乐趣还是不少的。但其他任务如一个人写几百页文档或者做个工作量大的设计真是挺苦的,我决定以后不论是写文章还是做设计敲代码都要多和其他人交流,所谓厚德博学也要敬业乐群。希望就是帆软公司当个百年企业,FineBI能够日臻完美,使更多数据相关从业人员、企业客户能够挖掘更多数据价值,大家互利共赢。
交通行业业务事项审批数据分析.pdf (1.1 M) |