【2023BI数据分析大赛】山东省济宁市出租车市场分析

楼主
我是社区第1941193位番薯,欢迎点我头像关注我哦~

一、选手简介

       1、选手介绍

    • 团队名称:山能数科数据探索队
    • 队长介绍:孙庆波,帆软社区用户名youwant,目前就职于山东能源数字科技有限公司。山东能源数字科技有限公司为云鼎科技权属公司,按照市场化的经营管理模式,对内主要承担山东能源集团业财一体化经营管控平台的实施、运维、优化等工作,对外提供企业数字化转型从规划咨询、软件研发、技术实施到运维优化等完整的端到端服务。目前担任数据分析经理职位,个人感兴趣的方向是数据挖掘和商业智能分析。
    • 成员介绍:

        李昌进,帆软社区用户名静水流深7,目前就职于山东能源数字科技有限公司,主要从事数据分析工作。

        惠紫薇,帆软社区用户名咕咕咕,目前就职于山东能源数字科技有限公司,主要从事数据分析工作。

        陈昆,帆软社区用户名cjy0804,目前就职于山东能源数字科技有限公司,主要从事数据分析工作。

        孙晓璐,帆软社区用户名sunxiaolu,目前就职于山东能源数字科技有限公司,主要从事数据分析工作。

    • 团队照片:

 

 

2、参赛初衷

    • 希望通过比赛提升BI工具的使用方法和技巧
    • 通过比赛培养和锻炼分析思维

 

二、作品介绍

1、业务背景/需求痛点

出租车行业是城市交通系统中不可或缺的一部分。随着科技的发展和城市化的加速,出租车行业也面临着许多新的趋势和挑战。

(1)  网约车与私家车占有率:近年来,随着网约车平台的崛起,网约车在城市交通领域的市场占有率不断增加。网约车提供了更灵活、便捷和实惠的交通选择,对传统出租车行业产生了竞争压力。随着私家车的普及度不断提高,私家车拥有量持续增长,出租车需求也随之减少。

(2)  环保和可持续发展:在环保和可持续发展的背景下,出租车行业也受到了影响。城市政府和社会对减少尾气排放高度关注。出租车行业逐渐向新能源车转型倾斜,以降低环境影响。 

(3)  数据分析和智能化应用:出租车行业积累了大量的数据,如乘客行程数据、交通流量数据等。通过对这些数据进行分析和利用,可以提供更精准的定价策略、路线优化和服务改进,以满足乘客需求并提高运营效率。

这些趋势和需求背景推动了出租车行业的发展和变革,同时也提供了商机和挑战。

 

2、数据来源

采用山东公共数据开放网上的公开数据《济宁出租车GPS数据》,链接如下所示:

https://data.sd.gov.cn/portal/catalog/592246aea00a4d1fb9b151210f9cbd21

该数据集主要描述济宁市出租车GPS数据,包含车牌号、出租车公司、车型、设备编号、运营开始时间、运营结束时间、方向、GPS经度、GPS纬度、速度、运营状态、GPS时间等信息项,数据量为12亿。数据项如下所示:

 

 

参考数据:

 

3、分析思路

拿到数据后,我们先对数据的每一列的业务含义和数据特征都进行分析。通过分析发现设备编号和车牌号是一一对应的,设备编号这一列也没有明显数据特征,就直接排除掉。对有分析价值的列,我们也尽可能做了延伸,扩展出更多的分析角度。例如对于车牌号,我们通过车牌号的规则来区分是不是新能源车。对同一辆车(同一个设备)按照GPStime来进行排序,发现GPStime的时间间隔都是30S,就可以由速度计算出路程,根据出租车收费规则可进一步计算收入。对于经纬度数据需要转换成行政区域信息,这样可以带来更多的分析维度。GPStime既包括日期也包括时间,可以按照日期来区分,也可以按照时间来区分。按照日期区分的时候,还可以进一步区分是否是工作日和周末。对数据分析的思维导图如下所示:

在对数据分析维度有基本的认识之后,经过讨论,我们细化了对济宁出租车市场的分析角度,形成了如下的思维导图:

 

4、数据处理

1)数据抽取技术验证

按照官方给出的接口对接方式,用kettle进行技术验证,估算后发现整体的抽取时间太长,需要换成效率更高的Python抽取方式。

使用Python进行数据库连接,设置request请求的请求头,编写request请求的核心内容

设置方法getInfo(pagenum)。其中传入的pagenum为获取数据所对应的页码数量。

request请求中发送的params数据除pagenum(页码)外均为严格按照第三方api所提供的规则生成的数据。

由于服务器数据接收和影响可能会存在一定的延迟和其他不确定因素,有时候会导致在数据获取的时候存在一定的丢失。因此我们在数据获取异常的地方对此次数据获取的行为进行了重复执行的操作从而确保了数据不会丢失。

在成功的获取了request后使用forMes()方法进行数据的处理。

request请求所获取数据进行处理

从上图中可以看到request请求后我们所获取到数据为一个数组格式。此数据类型并不是我们最终所需要的数据类型,因此我们还要对数据进行了一个的二次处理。具体处理方式如下图:

将通过request请求获取的数据进行一个循环的赋值处理。编写sql语句。

将数据处理之后,插入到编写好的SQL更新语句中。并且通过Python执行词条语句并提交将对应的数据保存到数据数据库中。

因为request所返回的数据为数组类型,所以要对数组中的数据进行循环处理操作。以保证数组中所有返回的数据都可以正常保存到数据库中。

在前面代码的基础上,使用python多线程编程的方式加快数据的抽取进度。

2)数据抽取

此次的数据总量达到12亿以上,时间跨度为1年。由于发现总数据量较大,我们团队最终决定筛选其中一个月的数据进行分析使用。

为保证所选数据能够更加贴近实际情况,避免其他因素影响导致数据偏差,我们排除国家法定节假日的时间。为更能反映现在的情况,经过综合考虑我们选择了2023-05-082023-06-08的数据进行最终的分析。按照条件对数据库数据进行抽取,最终抽取到数据1亿条。

3)数据处理

a.经纬度

在获取的原始数据中,我们可以获取到每个记录的经纬度坐标如下图所示:

由于目前主流的定位服务都是使用真实经纬度的小数点后两位来进行判定的,故此我们对经纬进行截取,转换后如下图所示:

通过高德地图提供的逆地理编码方式,我们将对应的经纬度转换成对应的地点名称。转换代码和所获数据如下所示:

 

 

此番操作后我们成功的将经纬度的表示转化成具体的地点。

 

b. GPStime(区分工作日和周末)

根据已有GPStime新增是否工作日字段,作为后续分析的一个维度。

 

c.车牌号(区分是否新能源车型)

参考下面的规则对已有车牌号进行分析,判断是否新能源。

 

d.载客状态

分析数据的时候我们发现,每条数据记录中都有一个独立的车辆状态。此字段能够反映该车辆当前的运营情况,判断是否有乘客乘坐。理想状态下我们所获取的该车辆一段时间内的状态。应该是连续的,如下图所示:

从上图中,我们可以得出当车辆从A时刻(空车状态)到B时刻(载客状态)中间的某一个时间有乘客上车了。同样,我们也可以得出当车辆从C时刻(载客状态)到D时刻(空车状态)中的某一个时间有乘客下车了。

由于在此前数据初次筛选的时候我们确定了GPSTIME(每条记录产生的时间)频率为30 s一次。因此我们可以将B时刻(连续出现载客状态时的第一条载客记录时间)和D时刻(连续出现载客状态后的第一条空车记录)记录为乘客的上下车时间。由此我们便可以获取每次载客的明细记录数据。

 

e.里程

数据采集的频率是30S一次,因此瞬时速度可以近似看作30s的平均速度,所以路程的计算公式为路程 (公里数)=sd*30/60/60

 

f.收入

济宁出租车收费标准参考 http://m.jining.bendibao.com/mip/6399.shtm

通过里程和收费标准即可计算出收入。

4)异常值处理

a.连续空车(载客)突然间出现一个载客(空车)

(a) 在连续空车的序列中,突然出现一个载客。用上面判断乘客上下车的处理逻辑,会导致乘客上下车点连续的两条记录,如果我们没有剔除,后续的分析中则会表现为在同一地点上下车。

(b) 在连续载客的序列中,突然出现一个空车。我们不排除某些出租车司机生意火爆,上一个订单结束后来不及休息就可以马不停蹄地开始下一单。但考虑到数据30s的采样间隔,要在30s的时间内实现一个乘客付钱、下车、另一个乘客上车、关上车门、开始打表的一系列过程,对两个乘客来说可能是难度系数较高的操作,可以认为这是一种小概率事件。

这种两种情况的产生都极有可能是采集设备的突发异常造成的,在数据清洗中,应将这两种情况都予以剔除。

 

b. 运营开始时间和运营结束时间

根据已知数据,发现在运营结束时间之后的GPS时间里,运营状态仍为载客, 表明此数据存在异常。通过求证官方渠道,与数据提供平台官方技术人员电话沟通得知,该数据是出租车平台开放的数据,无法保证运营结束时间的准确性。故不继续使用运营开始时间、运营结束时间数据进行分析。

 

5、可视化报告

5.1 行业概况

 

 

5.1.1  数据整体情况

1)对数据整体进行统计,以指标卡的形式展示。

2)结论:本次分析数据量为105458346条数据,数据时间范围是2023.05.08-2023.06.08,时间跨度为一个月。共统计到10家出租车公司的1423辆车,其总收入为856.0599万元,总载客次数为674406次。

 

 

5.1.2  新能源车型占比分析

1)以车型和是否新能源为维度,统计其数量及占比情况。

2)结论:在1423辆车中,新能源车辆占比为12.72%,最常用车型为比亚迪秦,占9.14%;油车占比为87.28%,最常用车为新捷达,占40.90%

 

 

5.1.3  公司新能源车型分析

1)以公司和是否新能源为维度,统计其数量情况。

2)结论:在10家公司中,交运的车辆最多为300+台,华擎科技车辆最少,只有一台。其中新能源车型最多的公司为新交运,最少的公司是汇通。

通过上述数据可以看出,济宁新能源出租车的占比很少,出勤车辆还是以油车为主。如果之后想要在济宁大力推行新能源出租车,可以从交运公司入手。

经过上述分析发现有311辆车连续33天一直为空车状态,且存在行驶记录,推测可能为设备故障或者其他原因导致,为避免对结论产生影响,故将其判断为脏数据进行过滤,后续分析数据为剩余的1112辆车及9家公司。

 

 

5.1.4  公司收入分析

1)不同颜色的方块代表不同的公司,方块的大小与公司收入有关,收入越多,方块越大,反之亦然。

2)结论:在9家公司中,交运的收入最多为201.56万元,新交运的收入最少,为42.72万元。

 

 

5.1.5  公司收入及数量对比

 

 

1)横坐标为公司,右纵轴为车辆数,左纵轴为收入,通过组合图分析收入与车辆数之间的关系,柱(点)越高,收入(车辆数)越多。

2)结论:通过进一步分析我们发现,整体上来说公司收入与车辆数成正比,交运车辆数最多收入也最多。在上述分析中我们发现唯一例外的是新交运,车辆数不是在最少的而收入却是最少的。

 

 

 

5.1.6  公司出勤率分析

1)横坐标为公司,纵坐标为出勤率,反应不同公司间整体出勤率的对比情况。

2)结论:我们分析了公司车辆的出勤率,通过出勤率对比我们发现新交运收入少的原因是因为出勤率比其他公司低很多。

 

5.1.7  车辆载客、里程分析

1)横轴分别为每天平均的行驶里程、载客里程、载客时长、载客次数,纵坐标是对应车辆数。反应不同数据段的车辆个数情况。

2)结论:通过分析出租车的行驶里程、载客里程、载客次数、载客时长,我们发现其符合正态分布,大多数司机每天行驶里程在200-260之间,载客里程在90-130之间,载客时长在230-300之间,载客次数在17-21之间。

5.2 行业收入情况

 

 

5.2.1  平均收入分析

1)选取不同维度的日平均收入、单车日平均收入作为KPI指标,进行整体展示。选取指标卡作为表达图形,数值通过计算收入的平均值算出。

2)结论:对数据进行过滤后,平均日收入为26.7518万元,其中工作日平均收入为25.6573万元,周末平均收入为30.0354万元,工作日平均收入明显小于周末平均收入。平均单车日收入为272.21元,其中工作日平均单车日收入为259.84元,周末平均单车日收入为309.43元,仍旧是工作日平均收入明显小于周末平均收入。

 

 

 

5.2.2 日收入分析

 

 

1)将每天的收入按照气泡图进行展示,观察其趋势,并设置趋势线辅助分析。横坐标拖入日期,纵坐标拖入收入,颜色拖入周末,浅色气泡为工作日,深色气泡为周末。

 

 

添加四个趋势线用于辅助观察。

2)结论:通过对日收入进行趋势分析,我们可以看出周末收入明显高于日常收入,因此我们建议周末可增加出车时间。我们在图中使用了指数、线性、对数、多项式进行拟合分析,发现近一个月收入都呈下降趋势。

 

 

5.2.3  日里程分析

 

 

1)将每天的行驶里程按照气泡图进行展示,观察其趋势,并设置趋势线辅助分析。横坐标拖入日期,纵坐标拖入行驶里程,颜色拖入周末,浅色气泡为工作日,深色气泡为周末,并添加四个趋势线用于辅助观察。

2)结论:我们对出租车载客里程进行进一步分析,同样使用各种方式进行拟合,发现近一个月总的里程数也是呈现下降趋势,说明整个行业处在一个下降趋势。

 

 

5.2.4  空车率分析

1)出租车的每日总行驶里程和每日空车行驶里程分别计算出来,用每日空车行驶里程/总行驶里程进行比较,加以辅助线参照分析。

2)结论:我们计算空车状态的里程数占总里程的占比,发现车辆的空车占比为53.30%,其中空车占比日趋势基本都在50%以上,因此我们推断空车时间过长是导致司机收入难以提升的原因之一,从这个指标也能看出出租车行业的现状。周末更多的人出行,所以周末的收入、载客里程都比工作日高,同时空车率也更低。

 

 

5.2.5  每日载客情况分析

1)将车辆的每日载客里程和载客次数进行计算统计,通过载客次数和载客里程可以得出每日平均载客里程,将每日平均载客里程和载客次数进行对比分析。

2)结论:通过观察日平均载客里程与平均载客次数,我们发现周末平均载客里程较低而载客次数较高,人们出行以短程为主。

 

 

 

5.2.6  24H客流量分析

1)统计每个小时的载客数量,反应24H客流量变化趋势。

2)结论:在24小时客流量对比中,18点、21点客流量最多,4点客流量最低,运营时间建议包含18-21点。

 

 

 

5.2.7  24H收入分析

 

 

1)统计每个小时的收入金额,分析其小时分布趋势,分析周末与平时每小时收入是否存在差异。将横坐标设置为小时,纵坐标设置为收入,颜色拖入周末/工作日字段,深色气泡代表周末,浅色代表工作日。

2)结论:在按照24小时分析平均收入时间时,我们发现不管是工作日还是周末567点的平均收入反而是最高,前一个客流量分析的图中可以看出,这几个时间点的客流量并不多。我们推测可能是这几个时间点打车的人不多,但是每个打车的收入都很高,因此会出现平均价格最高的现象。运营时间建议包含5-7点。

 

5.2.8  24H速度方差分析

1)将横坐标设置为小时,纵坐标设置为方差,统计每个小时的速度方差。

2)结论:夜间开车的速度方差更小,说明夜间速度变化更为缓慢,原因可能是夜间车少行人少,出租车车速比较均匀,出租车司机开车比白天更平稳。

5.3 行业MVP

 

 

5.3.1  载客速度方差分析

 

 

1)通过对司机载客速度方差的统计,分析每个司机的驾驶速度变化情况。

 

 

通过注释标注方差最大和最小的车牌号。

2)结论:通过载客速度方差,可以看出司机开车的平稳程度,通过图中可以看出方差最大,也就是速度变化最大的车辆为鲁H12**,我们称其为最猛司机,如果有需要赶火车或赶飞机的需求,可以联系这位司机。方差最小,也就是速度最平稳的司机为鲁HT18**,我们称其为最稳司机,如果家里有容易晕车的人,可以联系这位司机。

 

 

5.3.2   最佛系司机

 

 

1)选择未连续出勤天数最长的10辆车,不同颜色的气泡代表不同的车辆,气泡越大未连续出勤天数越多。

2)结论:在所有司机中,有几个司机只出勤了1-2天,具体原因不好分析,我们称其为最佛系司机。

 

 

5.3.3  收入最高车神收入分析

 

 

(1) 首先找出收入最高的司机,然后其每天的收入与所有司机每天平均收入做对比,分析其收入变化情况。

2)结论:我们分析了收入最高的司机和平均收入之间的对比发现,收入最多的司机每天都远高于平均收入,其收入约为平均收入的两倍。

 


 

5.3.4 出租车轨迹分析

 

 

1)根据收入最高的司机,选取他在济宁市内,收入最高的10次出车轨迹,每一个行程经纬度点组成一次轨迹路线,并编号。使用线图,数据使用经纬度、线路编号,实现轨迹地图。

2)结论:我们从收入最多司机的 10条行驶轨迹,可以分析出收入最多的司机载客以任城区以及跑长途为主,行驶轨迹大多分布在任城区域,该区域包含一些商业中心、游览观光区、娱乐场所、医院和医疗机构等。

 

 

5.3.5  收入top5司机各区域出车收入分析

 

 

1)根据收入最高的五位司机,汇总他们最常跑的街道,并且求得各街道的收入金额。使用桑基图,把起点设为司机,终点设为街道名,大小使用收入金额,可直观的看出各司机在各街道的收入情况。

2)结论:我们分析了收入TOP5的司机,发现经常跑的街道是阜桥街道、观音阁街道以及李营街道。

 

5.3.6  白天与夜间速度方差分析

1)各选取了白天夜间方差最大、最小的5个司机,对比其速度方差情况。

2)结论:我们对车辆白天和夜间的速度方差进行了分析,发现鲁HT15**HT11**HT06**的白天与夜间速度方差最大,推测可能是晚上将车换了不同司机,导致白天和夜间速度方差差距很大。

5.4 行业热门区域

5.4.1 上车密集区域

1)将乘客每次上车的经纬度展示到热力地图上,颜色越深,说明该点上车的人越多。

2)结论:通过热力图打点,我们发现上车密集区域分别为万达广场、济宁医学院及运河城附近,分别对应济宁的热门商圈、医院和学校区域。

5.4.2 各区域车流量分析

1)使用条形图,把车次流量按照区域划分,并按照车流量由高到低排序,可直观看出各区域车流量情况。

2)结论:济宁客流量最多的区域为任城区、兖州区,最少的为泗水县,原因可能是任城区为济宁主城区,兖州区存在多个火车、汽车站,因此客流量较多;泗水县人少客运中心少,因此乘车人较少。

5.4.3 早晚高峰各区域空车载客情况分析

1)将时间选取后转换为早高峰、晚高峰类型,并针对各个街道区域的出车数量,进行早晚高峰类型、空车载客情况等维度进行划分。如何排版布局,设置颜色。最后使用线图,展示,横轴为街道与早晚高峰类型,纵轴为车数量,细粒度按照空车载客状态划分,可看出,不同街道的早晚高峰空车载客情况。

2)结论:通过对早晚高峰各街道空车载客情况分析,我们发现阜桥街道早晚高峰及李营街道晚高峰载客次数多并且载客大于空车,因此推荐早晚高峰可提前到对应街道进行载客。

而南苑街道、洸河街道地区的晚高峰期间空车载客比率远远超过早高峰时期,表明,乘客在这些地方的晚间更容易打到车。相反古槐街道早高峰期间更容易打到车,晚高峰更不容易打到车。

总体来看,热点地区,晚间的载客车次,普遍比早间车次多,表明客户更喜欢晚间活动,更有打车的需求。

 

 

5.5 结论 

1)济宁出租车行业仍以油车为主,后期想要提高新能源车占有率可以从交运、联运、北城三家公司入手。
2)周末比平时收入更高,建议周末适当增加工作时间。
3)司机空车率较高,平均一半里程都在空车跑,建议司机可提前进行预约接单或提前前往人多区域进行蹲点。
4)客流量最多的时间为早晨8-11点,下午18-21点,建议司机在此时间段进行工作。
5)收入高的司机更喜欢去阜桥、仙营、观音阁街道载客,拉客少的司机也可以尝试改变载客地点。
6)医院、商圈客流量更大,建议司机前往类似区域进行揽客。
7)早高峰期间建议前往阜桥、观音阁、金城街道进行揽客,晚高峰建议前往阜桥、李营、仙营街道进行揽客。

 

 

5.6 最终结果呈现的页面布局

 

三、参赛总结

1FineBI工具

    • FineBI集成了简单的数据抽取工具,并且支持图形化操作实现左右连接,并且给出了样例和演示的结果,有利于非IT人员快速掌握。
    • FineBI支持对方差和标准差的计算,拓宽了自助分析的应用场景。
    • FineBI可以方便的进行多种方式的数据拟合,便于发现隐藏在数据背后的趋势性信息。
    • FineBI可以转化企业数据分析模式,从被动式变为主动式,有利于更深层次探索数据价值。

2、 参赛总结

在我们团队中,每个成员都有自己独特的技能和专业知识。通过参赛,大家并肩作战,积极主动的发挥每个人的特长去为团队的作品添砖加瓦。在紧密的合作中,大家互相支持,将个人优势转化为团队前进的动力。在项目的不同阶段,我们遇到了各种挑战和困难,我们通过相互支持和协调,积极解决问题,高效地分工合作,并及时调整策略,最终克服了重重困难。如果每个人都独自行动,我们的成果将无法如此出色。想要走得快,就单独上路,想要走得远,就结伴同行。

 

 

分享扩散:
参与人数 +1 F币 +2000 理由
兔子酱 + 2000 恭喜荣获“最具社会意义奖”

查看全部评分

沙发
发表于 2023-8-15 21:04:52

恭喜通过大赛初审!!

1、建议参考作品模板(https://shimo.im/docs/l6QXA2Hq3k83tcjd),补充必要内容,比如附上“最终结果呈现的页面布局”

2、如果使用本地BI制作,请确保提交的附件resources.zip内容完整(附件如有更新请微信发送苏茜);组委会将在8月16日后统一进行作品资源迁移,将您的作品导入大赛公共平台,形成在线模板查看链接,方便评委查看。

截止8月16日20:00仍可继续修改完善,期待选手完善之后的作品~~

 

板凳
发表于 2023-8-16 10:29:33
严禁数据出中台,
安规考试安排上。
地板
发表于 2023-8-21 14:28:57
数据量竟然上亿了,666,最终能把数据展示成这么多维度和指标,看来是花了不少时间
5楼
发表于 2023-8-21 16:19:59
老司机,nuibility,
6楼
发表于 2023-8-22 10:50:48
分析逻辑非常好,整体的排版布局也不错,感觉配色还有一定提升空间
参与人数 +1 F币 +1 理由
兔子酱 + 1 打卡奖励

查看全部评分

7楼
发表于 2023-9-7 14:00:53
打卡:数据质量高,分析框架合理,分析思路明确,不过报告前后色系不太一致,给人一种前后拼凑的感觉。
参与人数 +1 F币 +1 理由
兔子酱 + 1 打卡奖励

查看全部评分

8楼
发表于 2023-9-7 22:34:19
打卡:楼主在数据抽取和清洗将了很多高深的知识(虽然看不懂😅),后续的仪表盘分析感觉,前后差异太大了,建议梳理下逻辑重新排下版
参与人数 +1 F币 +1 理由
兔子酱 + 1 打卡奖励

查看全部评分

9楼
发表于 2023-9-14 16:00:59
打卡:
一份非常详细的关于城市交通行业的报告。这篇报告给我印象最深的莫过于数据处理阶段,不仅使用FineBI数据清洗功能,同时也运用了python,sql等工具进行数据处理,还有数据字段的延伸,以便得到更多的分析维度。无奈目前面对亿级以上的数据,FineBI显得吃力,所以选择了一个月的时间数据。但是总感觉最后的可视化呈现有点偏弱了,前面能看出非常深厚的技术功底,后面的组件布局略显普通。
参与人数 +1 F币 +1 理由
兔子酱 + 1 打卡奖励

查看全部评分

10楼
发表于 2023-9-15 12:01:58
打卡:感觉前面的分析做得很用心,但是看板的颜色搭配好像有一点怪,可以考虑一下调整一下颜色?
参与人数 +1 F币 +1 理由
兔子酱 + 1 打卡奖励

查看全部评分

11楼
发表于 2023-9-16 17:25:57
打卡:
工具运用的很多,整体的分析思路很棒,值得实际业务的借鉴,UI设计的整机很舒服。让人觉得挺不错的,整体故事化的讲解,逻辑贯穿始终
12楼
发表于 2023-9-23 08:27:24
打卡:数据量充足,时间跨度合理,覆盖面广,保证了分析的全面性。对数据进行了充分的预处理,包括坐标转换、异常值处理等,保证了分析的准确性。分析角度丰富,包含行业概况、运营情况、热点区域等方面,视角全面。采用的图表形式多样,如散点图、热力图、组合图等,呈现效果出色。挖掘出行业收入高的驾驶员,进行个案分析,发现了行业规律。
参与人数 +1 F币 +1 理由
兔子酱 + 1 打卡奖励

查看全部评分

13楼
发表于 2023-9-26 17:15:02
打卡:出租车是很多人出行工具选择之一。作品基于济宁出租车GPS数据进行市场分析,数据处理过程中利用到了Python,团队的数据处理能力很强,分析思路清晰,从行业概况、行业收入、行业MVP、行业热门区域依次展开分析,并且最终给出分析结论和建议。可视化仪表板内容丰富,图表组件排版及配色应该还有优化空间。
参与人数 +1 F币 +1 理由
兔子酱 + 1 打卡奖励

查看全部评分

14楼
发表于 2023-10-6 10:37:51
照片中的大屏可真令人羡慕,嘿嘿
能利用网上的公开数据gps实现,挺不错的,特别是数据量比较大,是12亿,选一个月,那差不多也是1亿了。
先能把经纬度转换为地名,对出租车车型、公司收入、出勤率、里程分析;对日收入、日里程、空车率、载客情况、客流、行驶速度分析;
通过分析得出一些有趣的最猛老司机、最稳老司机、最佛系老司机、最高收入车神的称号,并且发现了收入高的老司机跑的线路都是这三条街(阜桥街道、观音阁街道、李营街道)最多,揽客可以去万达广场、济宁医学院及运河城附近。
参与人数 +1 F币 +6 理由
兔子酱 + 6 打卡奖励-最走心评论

查看全部评分

15楼
发表于 2023-10-12 17:59:02
打卡:出租车主题,完整的数据分析过程,从背景,数据处理,数据建模,展示,分析,结论,不愧是最佳社会意义奖,学习了
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

19回帖数 4关注人数 8167浏览人数
最后回复于:2023-10-12 17:59

返回顶部 返回列表