请上传宽度大于 1200px,高度大于 164px 的封面图片
    调整图片尺寸与位置
    滚轮可以放大缩小图片尺寸,按住图片拖动可调整位置,多余的会自动被裁剪掉
取消
陈泓坤01(uid:2249644)
职业资格认证:FCP-FineBI V6.0
BI学习班之小小的结业
BI学习班-结业总结 我幸运的已经学完BI数据分析从入门到精通课程。 因个人的兴趣爱好,刚开始认识BI是从朋友和同事那里了解到了BI数据分析从入门到精通课程,在BI推广的企业里,也鼓励大家伙互相学习进步,为了让自己能力得到提升,在不同程度的方面,让BI数据分析到更多场景的运用,所以选择了FineBI数据分析从入门到精通课程。 在这学习过程中,平时工作是挺繁忙的,刚好遇到了考试和比赛期间,本想推迟到下一个课程开始,但是也已经迈入了同步的步伐,作业也总是提前一天拼命的在赶作业,在做作业过程中,也是有遇到了许多问题在和同事同学之间互相探讨,在得到解决之后的提升感,群里也有很多优秀的同学在提问在解答,(因本人总是在做完作业后在看直播回放和刷视频,想着体会1.5的倍速,节省一些时间,算是小小的懒),同时非常感谢各位老师、助教老师在学习过程中的学习指导和批改作业。 通过学习让我了解到为什么选FineBI     (1)完善的数据准备管理策略。从数据采集,到数据处理,再到数据的存储和管理,FineBI完善的数据管理策略为前端的业务自由探索数据分析提供了强大的数据支持。   (2)灵活的自助数据处理。FineBI重点打造的自助数据集,提供了新增列,分组统计,过滤,排序,上下合并,左右合并等功能,让用户以极低的学习成本将数据处理成自己需要的结果,也让信息化和数字化更专注于基础数据的准备,将真正对数据的分析处理交还于我等更熟悉业务的分析人员。 (3)可视化探索式分析。FineBI的可视化探索分析,是面向分析用户,让他们能够以最直观快速的方式,了解自己的数据,发现数据问题的模块。用户只需要进行简单的拖拽操作,选择自己需要分析的字段,几秒内就可以看到自己的数据,通过层级的收起和展开,下钻上卷,可以迅速的了解数据的汇总情况。 课程所学内容暂时还未应用到工作中去,因为本人的专业不是数据分析类的,学习纯属是个人的兴趣爱好,通过课程里面的商品销售、地区维度、用户信息、推广等等,都可以通过清晰整理后的数据,其中举个例子:商品价格销售额是我们最基本的研究因变量,而其他指标是能够对价格产生影响的因素,就是我们研究的自变量。当然在对数据进行可视化时,我们需要特别注意选择正确的图形,以及组件的配色和仪表板的布局的规范性、合理性。 学习总结  数据分析的思路、方法和工具的熟练应用,总是需要花费大量的时间和熟悉练习,很多时候,我自己做过的作业,别人问的时候,却突然间忘了。甚至很多基础的功能实现,还是需要去翻这些入门到精通的视频,好的是也可以不断的观看。其中、如果说哪一点不好的,可能不是做数据类的,对于许多函数公式的表达不是特别好,更多愿意在图表的展现上面去花功夫。最后,感谢帆软提供的学习平台,感谢各位老师!!学习受教了。  
【2023BI数据分析大赛】马尔代夫旅游团价格影响因素分析
你是不是觉得,节假日去旅游会更贵?你是不是会觉得,有早餐的住宿、有赠品的旅游会比没有的更贵?然而,本作品的结论却是恰恰相反的,若你不信,请往下看!若想知道背后原因,也请往下看!   摘要:当下的旅游业正在蓬勃发展,近年来岛屿众多、环境优雅、天蓝水清的马尔代夫异常火爆,随着旅游行业规模的不断扩大,随之也出现了各种各样的旅游团,以旅游团形式出游的市场交易规模在不断地扩大,如何选择自己并且品质有保障的旅游团成了人们出行前需要解决的一个重要问题。 本作品基于马尔代夫旅游团数据,从商品属性、住宿属性和游客反馈3个角度为自变量,研究影响旅游团价格因变量的因素,期望以此来为游客选择旅游团时提供有效参考。 关键字:验证性数据分析 价格分布 因变量 自变量 箱型图 对比分析   一、背景介绍 因受疫情影响,可能会对分析结果会造成较大误差,故本作品采用了之前之前2019年的数据进行分析。 随着人民对生活水平要求的越来越高,旅游逐渐成为了大家摆脱繁忙工作、家庭压力和放松心情的主要方式之一。中国旅游研究院数据显示:2019年春节期间,全国旅游接待总人次高达4.15亿,同比增长8%左右,实现旅游收入5139亿元,同比增长超高8%。数据背后,是中国旅客旅游观念的变化,随着互联网的发展,通过网络报名参加旅游团前往世界各地旅游逐渐成为了一种普遍的选择方式。 以上这么大个数字,可不是我等月薪3200敢想象的。疫情之后,大家都说大环境不好了,可依然各地旅游业爆满人,笔者严重怀疑只是我们个人的经济不好了,别人依然不受大环境影响。(插曲:本段与作品无关,但不知道是否能引起大家的共鸣呢?) 旅游团形式的旅游项目发展飞快,2014-2018年中国跟团旅游市场交易规模逐渐扩大,截止至2018年已经达到了474.6亿元。在跟团旅游市场份额占比重,大家收悉的携程和去哪儿两大旅行社占据了整体跟团旅游份额的50%以上,众多旅行社相互竞争、抢占市场,推迟众多的跟团旅游路线。 马尔代夫是非常受人们青睐的海岛旅游目的地,其众多岛屿加上优美的自然环境,吸引了世界各地的人们前往这个坐落在印度洋的“世外桃源”游玩。在国内的各大旅行社里,关于马尔代夫的旅游团项目丰富多样,但其价格却相差悬殊,可供人们根据自己的需求进行差异化选择。对于没有去过马尔代夫却对这里充满向往的游客来说,如何选择一个合适的旅游团项目则变成了旅游前准备中非常重要的部分。 本作品将基于马尔代夫旅游团数据来对该问题进行研究,找出影响价格的主要因素,建立一种分析体系,希望能为前往马尔代夫旅游的游客们在选择旅游团时提供参考,使得游客能够根据自己的需求,更快更好地选择适合自己的旅游团。 二、分析思路 本作品根据清晰整理后的数据,可以用来更好的表达分析结果的组件包括价格分布情况的面积图,是否节假日对价格影响的分组箱型图,行程天数对平均价格影响的矩形数图,以及柱形图和条形图等。具体分析思路如下: 出去旅游,“小白”最关心的肯定是“价格”,所以我们将“价格”作为了研究的因变量,而其他指标是能够对价格产生影响的因素(行程、店铺、上岛方式、住宿、是否节假日等),就是我们研究的自变量。 在对数据进行可视化时,我们需要特别注意选择正确的图形,以及组件的配色和仪表板的布局的规范性、合理性。 对于单个定性变量,一般用柱形图、条形图、饼图等,反映的是定性变量的哥哥水平的频数分布或占比;对于单个定量变量,一般用直方图(面积图)、箱型图,反应的是数据的分布情况,包括对称性、是否有异常值等。 在数据分析过程中,我们所要体现的是自变量对因变量的影响,所以一般情况下,除了对因变量的展示外,我们使用的组件是能够反应两个变量之间关系的图形。 对于一个定性变量和一个定量变量,一般使用的是分组箱型图,用于对比不同组(类)对某个定量变量上的平均水平、波动水平等的差异。为了更直观的比较,本作品还对相关组件加了平均线。 三、数据加工 (一)数据说明 本作品从马蜂窝网站获取了马尔代夫旅游团数据,以此探究分析马尔代夫旅游团价格的相关影响因素。相关影响因素分为3个属性维度,具体如下: 商品属性:行程,店铺,上岛方式,出发日期,是否节假日 住宿属性:住宿,是否有赠品,是否含早餐 游客反馈:评论数 (二)数据整理 第一步:删除重复值,保证数据的唯一性。 第二步:填充空缺值,保障数据的完整性。 ①有无赠品 ②是否含早餐 ③评论数 ④上岛方式 第三步:派生字段处理 四、分析过程 1、因变量:价格 本作品关心的因变量是马尔代夫旅游团的价格,从下图可以看出,马尔代夫旅游团的价格是呈右偏分布的。 具体地,最小值和最大值分别为0.82万元和3.92万元,平均价格为1.6万元,大部分价格集中在1-2.2万元范围内。 这一现象符合我们的基本认知,即少数高价旅游团拉高了旅游团的评价水平。 2、自变量:商品属性 商品属性包括是否为节假日、行程、店铺、上岛方式等。 由下图可知,旅游时间是否为节假日对于马尔代夫旅游团价格几乎没有影响,中位数和平均价格均为1.5万左右。这与我们平时的认知不一致,需要进一步论证结果。(认知:节假日更贵,平时便宜) 参考其他文献获知,马尔代夫的旅游旺季是1-4月,平季是10-12月和8月,淡季是5-7月和9月。按照常理,当然是旺季最贵,平季次之,淡季最为便宜。但这里的旺季、平季、淡季也主要是按照影响马尔代夫酒店价格来划分的。对于中国游客来说基本上无淡旺季,因为基本上整年都有去马尔代夫的客人,而且数量也无明显的差异。(中国人还是很真有钱的,只是我穷而已!) 从行程安排影响来看,行程安排为10天的旅游团价格最高,随着天数的减少,价格也依次降低,即不同行程天数对旅游团价格几乎呈正相关的影响(行程天数越多,价格越高)。 从不同店铺对价格的影响来看,携程的旅游团价格最高,一路行的旅游团价格最低,其余旅游团价格差异不大。即不同店铺对旅游团价格有一定影响,但影响不大。 从不同上岛方式对价格的影响来看,水路前往价格<航空出行价格,但差距较小。即不同上岛方式对旅游团价格有一定影响,但影响程度不大(<2000)。 初步结论:游客在选择马尔代夫旅游团时,不用担心因为节假日而担心价格上涨过高;行程天数与价格呈正相关关系,行程天数越多,价格越高;选择水路前往的价格低于航空出行的价格。 建议:对于预算有限的游客,可以选择水路前往的旅游团,在行程上需要选择天数不多的旅游团,但是游玩的时间可能有所压缩;对于预算充足的游客,可以选择航空出行的旅游团,在行程上也可以选择天数较多的旅游团,这样游玩的时间就可以更加充裕一些。 3、自变量:住宿属性 住宿属性包括住宿、是否含早餐和有无赠品三个字段。 从下图可知,是否含早餐(有无赠品)对价格产生一定的影响,但与咱们平时的认知(含早餐贵,不含早餐便宜;有赠品越贵,无赠品越便宜)是相反的,不含早餐的旅游团的价格反而略高。 这是因为马尔代夫餐饮服务的基本趋势是越高级的岛屿包含的餐饮服务越少,三餐在大多数岛屿上均为额外收费。 从住宿方式来看,其不同方式对价格有较大的影响,选择【1沙+3水】的住宿条件的旅游团价格最高,其次是水屋的旅游团价格,其余住宿条件的价格差异不大。 初步结论:游客在选择马尔代夫旅游团时,并不太在意是否含早餐或者有无赠品;在马尔代夫旅游住宿情况中,水屋更能吸引游客,故含水屋多的旅游团价格更高。 建议:对于游客来说,住宿的首选是水屋,水屋的优势是面朝大海,但大海晚上波涛汹涌,睡眠比较浅的游客,可能会导致难以入眠。相对而言,别墅式的沙屋私密性更强,且沙屋大多配有私人泳池。推荐喜欢游玩拍照的旅客选择水屋,留下美化回忆,希望放松的游客可选择沙屋。 另外,若想拥有更实惠的价格,可选择含早餐和有赠品的旅游团,可减少一些餐费等额外的开支。 4、自变量:游客反馈 游客反馈主要参照评论数,处理评论数时,对评论数采取如下人气等级定义。 评论数 0-19 20-29 30-39 >=40 人气等级 低人气 一般人气 高人气 ,超高人气 从下表可以看出,低人气的旅游团价格最高,高人气的旅游团价格最低,这说明大部分游客们还是比较喜欢低价格的旅游团。即人气等级对价格呈现负相关关系。 这给预算较低的游客提供了第二种参考:评论数越多、价格越低看得旅游团不失为一个好的选择。 五、结论建议 本作品通过对马尔代夫旅游团数据(价格与影响价格的因素)的描述性分析,得到以下结论: 自变量 是否有影响 影响程度 影响方向 与认知一致性 是否节假日 否     不一致 行程天数 是 较大(明显) 正相关   店铺 是 一般(明显)     上岛方式 是 一般(明显)   一致 是否含早餐 是 一般   不一致 有无赠品 是 一般   不一致 住宿方式 是 较大(明显)     游客反馈 是 一般 负相关   (1)行程、店铺和上岛方式会对价格产生较为明显的影响。其中,提供 10 天行程的旅游团价格最高;在店铺中携程的旅游团价格最高,一路行的旅游团价格最低;在上岛方式中,选择水路前往的价格低于选择航空出行的价格。游客可根据自身需求和价格预算去选择适合 自己的行程和上岛方式。 (2)结合住宿和行程来看,如果游客想要在“1沙+3 水”的住宿条件下省钱,可以选择行程为7天。 本作品变量个数较少,因此仍存在一些不足需要完善。另外,若大家想要更加深入研究,可以更全面地考虑一些宏观经济因素(如 GDP、CPI等)对旅游团价格带来的影响,从而开展更多的研究。 六、报告(仪表板)展示
个人成就
内容被浏览9,125
加入社区306天
返回顶部