【2023BI数据分析大赛】成都12345政务热线大数据分析
一、选手简介
1、选手介绍
大家好,我的帆软社区用户名为小王爱睡觉,目前就读于成都东软学院,很高兴能够参加此次帆软数据分析比赛。
2、参赛初衷
帆软是中国大数据BI和分析平台专业提供商,专注商业智能和数据分析领域,是国内大数据分析和商业智能领域中具有专业水准,且组织规模大、服务范围广、企业客户数量多的厂商。历经14年发展,帆软已成长为国内领先的大数据BI厂商,与11000多家客户建立合作,并长久服务。近年来,帆软业绩增速保持约50%,国内BI软件市场占有率连续三年蝉联第一,即使是受疫情影响的2020年销售额仍逆势增长20%。因此希望通过比赛实践提升BI工具的使用方法和技巧,并且和更多FineBI大神交流学习,进行数据可视化作品以及分析思维的激烈碰撞。
二、作品介绍
1、业务背景
大数据时代,数字信息技术涵盖了该国政治、经济和社会的各个方面。党的十九届四中全会表示,“建立健全运用互联网、大数据、人工智能等技术手段进行行政管理的制度规则。推进数字政府建设,加强数据有序共享,依法保护个人信息”。在这次新冠肺炎疫情防期间,突出了大数据、云计算等信息技术在国家治理中发挥的重要作用。能否深入把握大数据时代的社会运行规律、充分利用大数据等信息技术重组政府运营流程,这对加强国家治理体系和治理能力并使之现代化至关重要。因此,中共中央应实施科学化的数据分析手段,高度重视大数据在政府行政中的应用和发展,分析大数据与政府行政之间的关系,创新政府管理模式,提高政府管理效率。目前,各地政府开展了许多关于政府管理手段和模式的改革与创新,以此优化政府职能,把政府治理能力推向智能化、现代化、科学化的发展方向,并越来越向“用数据说话”的智慧政府模式转变。
2、选题意义
通过搜集不同社会阶层不同人群的民情民意,形成了一个庞大的数据库。本研究使用了一系列大数据分析方法,以加强信息网络的建设和共享,实现政府信息资源的公开性和透明度,并加快数字政府的建设进程,这对于加强国家治理体系和治理能力并使之现代化至关重要。
本研究着重探究了成都12345热线问政平台中,人民对于社会问题的呼声和意见、其背后存在的数据挖掘价值以及基于大数据在公共领域特性之间的关系,以此为基础进行数据分析,能够以人为本、关注民生,它清楚地反映了人们在生活和生活中面临的困难和许多实际问题,进行科学合理的数据可视化,为政府治理建设和决策提供合理性建议。
3、数据来源
本研究使用jupyter进行数据采集,主要爬取了成都市人民政府网络理政平台中首页的回复公开板块及12345热线中的电话回复公开板块数据133027条。数据的主要字段包括一级页面的标题、办理单位、类别、访问量、时间,二级页面的来信(电)时间、办理部门、办理结果。部分代码如图3-1,数据展示如同3-2。
图3-1 网络爬虫部分代码展示
图3-2 数据展示
4、分析思路
通过搜集不同社会阶层不同人群的民情民意,形成了一个庞大的数据库。本项目着重探究了成都12345热线问政平台中,人民对于社会问题的呼声和意见、其背后存在的数据挖掘价值以及基于大数据在公共领域特性之间的关系,为了更好的反映政府在大数据治理方面的巨大潜力以及以人为本的执政理念,本项目从政府和市民两个角度出发,着重探究了在城市治理过程中成都市政府如何依据这两个角度的数据进行改善。
基于政府角度,政府更加看中数据的整体,包括每年的工单数量以及四类民生不同工单属性类别的数量。因此基于这部分使用了指标卡的形式进行不同年份的筛选。各区来电的数量也反映了各区政府治理中出现的大大小小的问题,因此制作了区域地图,用颜色的深浅代表来电数量的多少。
其次来电时间反映了市民大多在什么时间反映问题,因此通过四类民生不同年份、年内各月、月内各星期、日内各时段的来电数量的4个范围面积图来展示。
基于市民角度,市民更注重于政府的办事效率,因此回应时长就成为政府办事效率的衡量指标。而诉求工单的属性、类别、办理单位各不相同,自然回应时长也大不相同,因此本项目分别分析了不同区政府的平均回应时长、四类民生工单的平均回应时长、不同属性类别的平均回应时长。其次诉求工单来电时间也各不相同,正所谓春困秋乏夏打盹,因此又分析了各年份平均回应时长以及不同季节的平均回应时长。
而访问量则直接反映了市民对哪类社会问题关注度更高,政府依据的市民关注方向,能够根据事件的轻重缓急更好地解决社会问题。因此在第四部分分析了四类民生问题中不同属性类别的平均访问量、四类民生问题中不同年份的平均访问量、成都市各区工单的平均访问量以及市民关注工单类别TOP10。
图4-1研究思路
5、数据分类
国际社会通常认为,衡量民生问题最基本的两大维度就是生存权和发展权。所谓生存权,就是人活下去的权利;所谓发展权,就是人还要获得智力和体力上发展的权利。由于成都12345市民服务热线数据中事件类别种类很多,因此在数据分析过程中,为突出热线问政为民服务的本质特征,本研究根据发展权和生存权两大基本维度将数据分成基础民生、基本民生、发展民生和优质民生四大类,如图5-1。
图5-1 四种理想类型划分
在具体的数据分析过程中,本研究参考热线工单的二级分类标签,如图5-2所示。
图5-2 热线工单的二级页面
表1是数据分类的结果。最终分得基础民生数据2809条,基本民生数据21723条,发展民生数据39879条,优质民生数据1054条。
表1 四类民生划分图
基础民生
基本民生
发展民生
优质民生
供电、供暖、供气、供热水、供水、公租房、群租房、廉租房、有线电视、网络与通信、路灯照明、地下通道、中水
食品安全、药品安全、两限房、物业管理、小区配套、修缮、交通安全、交通管理、城市交通、治安事件.消防安全、殡葬、法律援助、工伤及职业病、户籍管理、残疾人社会服务、残疾人政策维权、公交、固体废物、管井线、轨道交通、市政道路、市政管线、市政配套、救灾工作、长途客运.住房安全、价格波动
城市绿化、出租汽车、大气污染.低频噪音、优生优育、辐射污染、福利待遇、光污染.环境保护、环境污染与生态破坏、劳动保护、劳动合同、生态环境、市容环卫、室内污染.就业、劳动就业、教育、教育问题、卫生、卫生安全、烟花爆竹、医疗废弃物、医疗问题、噪音污染、职业培训.养老、养老机构、婚姻、市场管理、消费纠纷、工资.规划设计
房屋交易、房屋权属、宠物管理、大型活动、第三方理财、航空运输、家政、体育.投资咨询、野生动物、网络借贷.商品房、房地产中介、司法事项、司法咨询、股权投资.证券、便民服务信息咨询、电子商务.非金融机构支付、工作方法、公园管理、节目互动、旅游、民办高校、民俗旅游管理、融资及非融资租赁.住房公积金
6、数据处理
本次数据爬取下来格式较规整,因此预处理大多使用Excel进行。首先以来信(电)时间作为依旧使用Excel中的删除重复项功能,共删除重复数据65576条,剩余数据67451条。然后进行时间数据的处理,先将来信(电)时间列中的年份和月份单独分列出两列,方便后续以年和以月为单位进行数据分析。接着使用Excel将日期对应的季节、星期和时段计算出来,最后使用Excel计算出来信(电)时间与反馈时间之间的间隔天数与小时。
由于本项目大多进行分类分析,因此在帆软中使用做多的是结果过滤器。比如我想分析发展民生中的工单都有什么类别,但是民生类型中有基础民生、基本民生、发展民生和优质民生四类,因此可以民生类型拖到结果过滤器中并添加过滤条件即可筛选出想要的民生类型。如图6-1、6-2所示。
图6-1 过滤过程
图6-2 添加公式
7、可视化报告
7.1 热线问政市民诉求的整体性分析
(1)诉求工单数量整体分析
首先添加年份的过滤组件,由于只分析2017-2022年的数据,因此将过滤字段设置为2021年到2022年。如图7-1所示。
图7-1 过滤组件过程
接下来制作工单总数量指标卡,只需将记录数拖到文本中,并重新命名即可。如图7-2所示。
图7-2 指标卡过程
制作四类民生工单数量指标卡时,则需要将记录数复制,并重命名为对应民生类型,进行明细过滤并添加公式,随后将其拖至文本中即可。如图7-3、7-4所示。
图7-3 明细过滤过程
图7-4添加过滤条件
最后,可以选择年份查看当前年份的工单数量。由图7-5我们可以看到发展民生的工单诉求最多,优质民生的工单数量最少,那这两类民生中分别对应什么社会问题,接下来我们可以使用词云图分析四类民生中那些类别的工单数量最多。
图7-5指标卡最终成果展示
(2)四类民生类别词云图分析
在制作词云图时,我们需要将民生类型进行过滤,然后将类别拖到文本和颜色中,就出现了不同颜色的类别文字,但是大小相同无法区分那些类别出现的次数多,因此将记录数拖到大小中,即可反映出哪些类别出现次数最多。如图7-6所示。
图7-6词云图过程
由基础民生的工单类别词云图可知,水电气问题在基础民生中的诉求工单最多,对家庭用户而言,水电气的内容如下。
水:饮用水和生活用水及其产生的使用费用、维修费用等。
电:照明电和生活用电及其产生的使用费用、维修费用等。
气:燃气和煤气及其产生的使用费用、维修费用等。
图7-7基础民生词云图
由基本民生的工单类别词云图可知,占道停车、占道经营、交通安全管理、交通信号、交通标识管理等文字最突出。这几类都与交通道路等社会问题相关,说明此类问题影响了市民的生产生活,因此政府应重视这类问题的解决和改善。
图7-8基本民生词云图
由发展民生的工单类别词云图可知,噪音污染、环境卫生综合整治、油烟污染、大气污染等问题在发展民生中的诉求最多。说明政府在城市环境污染等问题上重视不足,并影响了市民的生产生活。因此为了更好的发展民生,提升市民的幸福指数,政府应加大力度对环境污染等问题进行治理。
图7-9发展民生词云图
由优质民生的工单类别词云图可知:对商品房、二手房、税收征管、住改商保障性住房等类似问题的工单诉求较多。可见,在优质民生中,人们对税收与住房方面的诉求较多,政府应重视此类问题的管理和解决,提升市民的生活品质。
图7-10优质民生词云图
(3)成都市各区来电数量分析
我使用了区域地图来分析成都市各区来电数量。首先选取办理单位的地理角色,由于分析的是成都市各区,因此选择区/显进行匹配。如图7-11。然后将办理单位的经纬度分别拖进横轴纵轴,将记录数拖进颜色,用颜色的深浅来表示数量的多少。
通过图7-12可知,分析工单数据,发现成都市中心地区来电数量最多,两边地区的来电数量较少。武侯区市民的来电数量最多,其次是成华、区金牛区、青羊区等地。说明成都中心地带市区所存在的时会问题较多,成都市政府应重视这几个地区的问题解决。
图7-11区域地图过程
图7-12成都市各区来电数量
(4)诉求工单属性类别占比
用饼图来反映占比情况再合适不过了。因此,为了反映诉求工单中不同属性类别的占比情况,将属性类别拖到颜色中,将记录数拖到角度中,最后加上标签,占比图就呈现在大家面前了。
由图7-13可知,投诉举报占比最高,达到了93.9%,而征集建言、表扬、求助、意见建议都不到1%。表明投诉举报属性类别的工单诉求是最多的,可见在社会生产生活中,还存在许多亟待改善的地方。人们可通过投诉举报维护自己的合法权益,打击违法犯罪等活动。人们对12315直转、表扬、征集建言等类型关注较少,有关部门可加大宣传力度,完善奖惩措施,提高公民参与公共事务的热情与信心,增强公民的社会责任感,共建和谐美好社会。
图7-13诉求工单属性类别占比占比饼图
(5)总结
从整体来看,2017-2022年成都12345平台接受市民来信(电)工单中,属性类别分别有:投诉举报、咨询、意见建议、求助、表扬、征集建言、12315直转中投诉举报的工单数量最多,直转数量的工单数量最少,需加强有关部门可加大宣传力度,完善奖惩措施,提高公民参与公共事务的热情与信心。同时2017-2022年成都12345政务热线平台的市民诉求大致呈橄榄形,呈现两头小中间大的情况。发展民生和基本民生占比最高,基础民生其次,优质民生最少。从管理者的角度来说城市治理工作取得了显著的成效,工作量也相对减轻;从公民的角度来说社会生产生活中的很多问题得到了解决,提升了幸福指数。从四类民生诉求反映情况来看,水电气问题在基础民生中的诉求工单最多,水电气是人们生活的基本需求,做好水电气的相关工作是保障基础民生的基础,因此政府应加强对于水、电、气等社会问题的有效治理和保障。占道停车、占道经营、交通安全管理、交通信号、交通标识管理等在基本民生中最突出,政府应重视这类问题的解决和改善。交通出行是人们日常生活中的重要部分,及时解决交通出行问题,保证基本民生。噪音污染、环境卫生综合整治、油烟污染、大气污染等问题在发展民生中的诉求最多,政府应加大力度对环境污染等问题进行治理。商品房、二手房、税收征管、住改商保障性住房等问题在优质民生中的诉求较多,政府应重视此类问题的管理和解决,提升市民的生活品质。
图7-14 热线问政市民诉求整体性分析
7.2 热线问政市民诉求的时空性分析
(1)四类民生诉求数量年份变化
由于探究来电数量的年份变化,因此将年份拖入横轴,来电数量拖入到纵轴,为了区分四类民生,将民生类型拖入到颜色中。
由图7-15可知,基础民生和基本民生的总趋势以及变化年份、程度大体是一致的,但是基本民生的来电量明显高于基础民生。说明人们对基本民生中的交通、食品安全、物业等方面存在的问题较多。在2017年,基础民生和基本民生的来电数量均达到最高值,然后呈现逐年递减的趋势,到2022年来电量达到最低值。由此可见,政府对市民所反映的诉求工单解决效率高,治标治本,人民生活幸福感和归属感也因此而有所提升。在观察了四种类型中的基础民生和基本民生之后,本研究开始分析发展民生类型的数据。从整体年份来看,发展民生和优质民生的来电量趋势都在逐年递减,优质民生在递减过程中略有起伏。优质民生来电数量在2018年有所回升,达到了六年中的最高值。发展民生与优质民生类型的诉求数量都在减少,但是发展民生减少的速率要更快,并且不会出现反弹的状况。总体来说,通过数据可视化分析我们可以得知成都市民生诉求工单数量在逐年减少,说明在政府的不断努力下,成都市人民的幸福指数在不断提高。
图7-15四类民生诉求年变化情况面积图
(2)四类民生诉求数量年内各月周期性分析
年内各月的来电数量同理,只需将横轴时间的分组改为月份即可。如图7-16所示。
从图7-17中可以看出,2-6月和8-9月的四类民生都趋于增长的趋势,并且持续大幅上升,而10-1月四类民生处于持续降低的趋势,6-8月也趋于平缓下降,四类民生的整体幅度都是一致的,但是最多的是优质民生,最少的是基本民生。
图7-16月份分组
图7-17四类民生诉求月变化情况面积图
(3)四类民生诉求数量周内各日周期性分析
从图7-18中可以看出,周一到周五四种民生的来电数量都是呈上升趋势的,发展民生的变化幅度较大,在周五达到峰值。周六周日四类民生的来电数量均迅速减少,可以推测诉求工单数量也根据工作日和节假日而变化。
图7-18四类民生问题中的星期的周期性分析
(4)四类民生诉求数量日内各时段周期性分析
由图7-19可以看出,发展民生诉求工单的来电量是最多的,其次是基本民生,优质民生和基础民生诉求工单的来电量较少。四种类型的来电高峰基本集中在一天中的上午9时至11时,下午14时至18时。在经过峰值后,数量开始下降,直至次日凌晨。
图7-19四类民生问题中一天内时间段的周期性分析
(5)总结
从热线问政四种类型市民诉求的时间周期性特征来看,成都市民生诉求数量在逐年减少,且来电时间多集中于春秋两季工作日中的工作时间。
图7-20热线问政市民诉求的时空性分析
7.3 热线问政的政府回应时长分析
(1)成都市各区平均处理时长
此区域地图同上,由于分析回应时长,因此将处理天数拖到颜色和标签中,即可通过颜色的深浅表示回应时间的长短。
由图7-21可知,蒲江县、邛崃市、青白江区、青羊区、温江区等地颜色较浅,说明区政府回应时间短,一周内即可得到回复,解决效率高,而都江堰市、东部新区、金堂县等地颜色较深,需要一周以上才回复,解决效率相对较低。因此颜色较深的地方区政府应提高办事效率,优化解决流程,更好的为人民服务。
图7-21 成都市各区平均处理时长
(2)四类民生平均回复天数
由于分析四类民生的平均回复天数,因此将平均回复天数拖至横轴,民生类型拖至纵轴。
由图7-22可知,基础民生的平均解决天数较短,一周以内即可得到回复,而优质民生则需要一周以上才可得到回复。因此可以推测,基础民生中的诉求工单贴近市民生活,解决难度低,解决效率高,而优质民生中的工单则大多为提高生活水平的诉求,解决的难度较高,效率较低。各区政府在处理优质民生的诉求工单时,可以及时向市民说明情况,回复办事进度,提高回复效率。
图7-22四类民生平均回复天数
(3)不同属性类别的平均回复天数
由图7-23可知,咨询、征集建言、表扬的诉求工单平均处理天数较少,而投诉举报、意见建议、求助的诉求工单平均处理天数较多。
图7-23不同属性类别的平均回复天数
(4)不同年份的平均回复天数
由图7-24可知,政府回应天数在逐年减少,说明政府也非常重视问题解决效率。
图7-24不同年份的平均回复天数
(5)不同季节的平均回复天数
由图7-25可知秋季的回复天数最短,夏季的回复天数最长。说明季节因素也会对政府回复时长造成影响。
图7-25不同季节的平均回复天数
(6)总结
从整体来看,在四类民生问题中,优质民生工单和基本民生工单处理的时间较长,在季节性方面,秋季政府回应的平均时间最少。区政府可以互相监督,提高回复效率。
图7-26热线问政的政府回应时长分析
7.4 热线问政的市民关注度分析
(1)市民关注工单类别热度top10
市民访问量直观地反映出了市民对某些社会问题的关注程度,因此这部分使用矩形树图来进行分析展示。首先将类别拖进颜色中,然后将平均访问量拖入大小中就得到了不同颜色、不同大小的矩形树图。
由图7-27可知,市民最关注噪音污染、环境卫生整治、占道经营等与我们生活息息相关的事情,因此,政府可根据此数据着重解决以下10大热点问题,从市民角度解决市民在生产生活中遇到的实际问题与困难,提升市民幸福指数。
图7-27市民关注工单类别热度top10
(2)成都市各区工单平均访问量
由图7-28可知,成都市民对东部新区和浦江县的关注度较高,因此两地区政府可以根据市民关注情况调整工单处理的先后顺序。
图7-28成都市各区工单平均访问量
(3)四类民生中不同属性类别的平均访问量
由于分析四类民生中不同属性类别的平均访问量,因此将属性类别拖至横轴,平均访问量拖至纵轴,民生类型拖至颜色。
从图7-29中可以看出基本民生、发展民生、优质民生中征集建言的平均访问量较高,而在基础民生和优质民生中表扬的访问量最高。
图7-29四类民生中不同属性类别的平均访问量
(4)四类民生中不同年份的平均访问量
从整体上看,四类民生不同年份的访问量相近,整体呈上升趋势。2022年访问量达到峰值,可以推测市民越来越关注成都12345政务热线。
图7-30四类民生中不同年份的平均访问量
(5)总结
依据访问量可知,噪音污染的访问量最多。可见,在社会生产生活中,人民群众通常利用12345市民服务热线来反映社会问题、维护人民群众合法权益。
图7-31热线问政的市民关注度分析
8、意见与建议
成都12345政务热线在运行中不断发现和改进问题,运行体系越来越完善,获得了公众的一致认可。然而,在大数据的背景下,在促进政府能力现代化方面仍有相当大的改进空间。从这个角度来看,将提出以下措施来改善目前政府成都12345热线的运行。
8.1 重视微信、APP及门户网站的宣传与普及
通过对成都12345政务热线的分析得知,热线数量自2018年来就呈现下降趋势,直至2022年,热线数量仅406个。说明拨打12345服务热线的市民数量大幅减小。这很有可能与热线接通率和接线员服务态度有关。通过调查问卷本研究得知,拨打一次热线的接通率仅为66.7%,接线平均等待时间30秒以内的仅为33.2%,且接线员态度良好的概率仅为36.2%。根据《市民服务热线服务规范》规定,应在热线接通后15秒之内接听,连续24小时的通话率应超过或等于95%。然而事实上,随着公众对拨打12345政务热线认识的提高,诉求工单话务量加大、接通时长长、员工和办公成本高等问题已成为政务热线平台面临的现状。因此,随着互联网技术的发展和移动终端的普及,热线是解决市民诉求的主要渠道。政府应强调微信、网站以及应用程序等渠道的“自助服务”,来提高政务热线平台的工作效率。首先,政府可以改善与媒体的联系机制,门户通过门户网站、微信服务号、手机应用程序等渠道的宣传,并鼓励公众使用热线以外的渠道。其次,增加对微信、门户网站、应用程序等渠道的投资。随着越来越多的市民愿意通过非热线渠道获取有关政府政策的信息、建议以及寻求诉求的解决方案。因此政府要努力满足公众需求,坚持非热线渠道平台的优化,使这些程序和设备能够“简单”、“好理解”、“高效率”的使用。最后,详细留存非热线渠道市民诉求记录,让微信服务号、网站、APP后台与数据库项互关联,在解决相似市民诉求时能自动调取相关数据来智能解决问题,同时积累新数据并定期更新到数据库中。
8.2 助外界力量,建设专业人才队伍
通过政府回应时长来看,不同地区的各民生回应周期不均,一些民生问题得不到解决,这也与机关部门工作效率有关,所以应当加强绩效考和核督查督办。更加完善的绩效考核体系,重点关注公众意识率、通话率、按时办结率、问题解决率、及时回访率、公众满意率等指标,对“12345”平台运行情况和成员单位办理情况进行定量评估。建立和完善服务承诺、首接负责、联办会审、限时办结、过错问责的督查督办机制,定期公布督查督办结果,并纳入年终综合考核。智能运营热线平台离不开人才的建设,如果热线带来大量数据但平台没有专业的技术人员进行分析处理,那么将很难发挥热线作用。因此,政府需要加强对现有工作人员的培训,邀请大数据领域的专家教授进行授课,也可以让员工进入大数据型公司进行学习实践,其次积极与“大数据”相关专业的大学进行合作,与大学相关专业人才建立热线平台的混合团队,并在大学实验室收集和分析数据。
8.3 推动热线中心向数据中心转变
成都12345市民服务热线在运行过程中已经成为“第一时间听取群众呼声,第一时间回应群众关切,第一时间解决群众难题”的便捷渠道,形成了良好的政府与公众互动氛围。通过热线平台采集的庞大数据,具有真实性高、可靠性强、覆盖面广、时效性强的特点。因此成都市政府可以建立以成都12345政务热线平台为核心的大数据管理中心,并从成都12345政府热线平台收集实时数据并汇集到热线中心,广泛地运用大数据技术,由专业技术人员对数据进行有效挖掘和分析,这样才能在紧急情况下寻求更多解决方案并进行预警。因此,成都12345热线平台应通过有效的挖掘和数据分析,明确数据分析的应用方向,以制定政府政策,提供令人信服的意见和建议,帮助政府部门做出决策,最终实现科学和高效决策。使用基础数据统计可以灵活地定制统计分析模板,对工单、坐席人员、成员单位、市级平台、县(市、区)平台等数据进行分析。使用12345大数据可视化:应用大数据分析技术,针对不同的用户对象和不同的业务需求,提供专题的数据可视化服务,并可在大屏上展现。
最终结果呈现
https://bisolutions.fanruan.com/webroot/decision/link/sE6M
三、参赛总结
参加了两次帆软的比赛,在这两次的经历中,不仅帆软平台在不断地进行升级优化,我自身数据分析的能力也在不断进步。感谢帆软提供的平台让我有机会在一次次实操中发现不足,克服困难,让我有机会锻炼、展示自己、提升自己的能力!