找回密码
 立即注册

QQ登录

只需一步,快速开始

请上传宽度大于 1200px,高度大于 164px 的封面图片
    调整图片尺寸与位置
    滚轮可以放大缩小图片尺寸,按住图片拖动可调整位置,多余的会自动被裁剪掉
取消
小尾巴(uid:1127349)
新人一枚 职业资格认证:尚未取得认证
【2022BI数据分析大赛】全国酒店分析简报
一、选手简介 1、选手介绍 团队名称:跟着大佬学数据分析 队长介绍:社区ID:小尾巴。目前是XX企业员工,主要负责包装设计方面的研究工作,本次比赛中主要担任学习和实践工作,毕竟有大佬带,学习提升方面走的弯路很少。 成员介绍: 社区ID:晕晕cc,和我是同事关系,其在2021年finebi比赛中成绩优异,故本次邀请作为指导顾问,全程指导可视化比赛数据分析思路、清洗、建模、美化。   2、参赛初衷: 希望通过本次比赛,学习数据分析思维能力,结交到优秀的朋友 希望跟随大佬的步伐,弥补自己的不足 边学习帆软还给发奖金,这点很不错   二、作品介绍 1、业务背景 没啥业务背景的,所选取的数据和自身企业没有半毛钱关系,纯粹是想验证下大佬的真实水平,   2、数据来源 选取了推荐1:八爪鱼采集器部分已采集的数据供参考: 链接:https://pan.baidu.com/s/1eLkwXAjKf1opWEqur8l4Xg 提取码:fsad 【交通】酒店信息   3、分析思路 作为初学者拿到这份数据的时候我十分迷茫,不知道该如何下手,毕竟数据中的相关内容和我的本职工作相差甚远,故在开展分析的时候,我遇到了恨到坑,不过本次报名参赛是以小组的名义,队里有位大佬,在他的帮助下,让我走了很多弯路。 如:酒店ID,在开展分析的时候,我没有很关注这个指标,但是队友细心指导下,通过对数据的仔细核对后,发现同一ID大部分信息基本都相同,但是城市、价格相差较大,百度酒店地址都是同一个地方,感觉诧异,故对于此类数据,我采取了过滤处理,避免干扰因数影响最终的分析。 过滤掉频数大于1的值 当然,队友也细心的给我讲解了什么是文本型、数值型和日期型,让我数据分析中最基本的几个条件有所了解,因为这个在后续的建模中十分关键。 我们的整体思路是这样的,通过对数据的展示,我们首先要了解全国有多少家酒店,其酒店星级的分布情况。全国酒店分别可以利用地图、酒店星级分布可以用直方图。 接下来,对评论数进行分析,作为经常逛淘宝、美团的我来说,假如我要选择一个好的酒店,我首先要看的是他的销量,而不是推荐指数,毕竟,评论的人越多,这个指标会被明显的拉低,故我们可以选择评论数较多,且集中的几个城市展开分析。同步对比了酒店品牌及评论数 其次再看评论的内容,毕竟好与坏在这里面有明显的体现,将这种思维逻辑转换,酒店这张表中,刚好环境、服务、设施、卫生,刚好就是好与坏的衡量指标。这个几个指标刚好可以通过雷达图,展示其好坏。 最后对比价格情况。 通过以上的研究方向,我们找到了比较集中的几个酒店品牌,同时对比评论数,让我们感到差异的事,全国酒店数量排名不在前三的7天酒店,其评论数全国排第二,针对这个特殊的原因,我们逐一对这个差异点展开了分析,发现了其背后真正的原因。就是7天连锁酒店的低价位吸引了大多数客户。 结束部分,简单展示了排名前三城市,7天酒店的明细表。   作品公共链接:全国酒店分析简报 (fanruan.com)   三、参赛总结 大佬还是有一点真才实学的,对于我这个初学者来说。 通过本次的学习,让我明白了看似简简单单的一份数据分析报告,涵盖了很多知识。我一直以为建模做的好就是牛,但是真正在实践时,却卡壳了,原因是什么呢?主要还是不清楚需求是什么,这点很重要,因为这会导致你所做的分析都是浪费时间,毫无逻辑可言。 当然,我还有很多的不足,未来我将努力提升自己的不足,让菜鸟的自己的变得不是那么菜鸟。
个人成就
内容被浏览2,641
加入社区173天

联系社区管理员|联系帆软|《帆软社区协议》|手机版|帆软社区|Copyright © 帆软软件有限公司 ( 苏ICP备18065767号-7 )

GMT+8, 2022-10-3 02:33 , Processed in 0.464766 second(s), 44 queries , Gzip On.

返回顶部