请上传宽度大于 1200px,高度大于 164px 的封面图片
    调整图片尺寸与位置
    滚轮可以放大缩小图片尺寸,按住图片拖动可调整位置,多余的会自动被裁剪掉
取消
何大小姐(uid:676487)
职业资格认证:尚未取得认证
【2022BI数据分析大赛】Airbnb运营数据分析报告
作者:何国花   一、分析背景与目的 1.1分析背景       Airbnb成立于2008年,短短9年时间成为了短租民宿行业的巨头,并且仍在不断的冲击着传统酒店行业,抢占着这一市场。       目前Airbnb作为一款社区平台类产品,其业务遍布了191个国家,我们的分析主要以探索为主,旨在发现airbnb在做好了产品体验、房源美感、民宿共享服务之后,其务是否存在可以改进的地方。       airbnb目前的市场背景:短租民宿行业的绝对巨头;业务布局区域极广,和Facebook有的一拼,当时airbnb的业务遍布全球191个国家;产品和业务发展成熟,无论是客户端还是后端供应链系统,其研发的成熟型在当时可谓屈指可数。   1.2提出分析问题       探索airbnb产品的业务存在哪些可以改进的地方?       在实际工作中很少有探索业务改进的项目机会,基本是先发现问题,然后查找原因;如果完成既定工作,则会有一些时间用来探索业务中的数据特征,从而探索发现业务机会       在常见的AARRR模型中,第一个A(即获客)至关重要,因此提高新用户获取的数量和质量是不断监测并优化的一个工作,哪些渠道的效果更好,企业就要及时调整和增加此渠道的投入,哪些渠道的效果很差,就要及时查找原因并给出解决。       针对分析的目的,提出以下三个方向目的:       ①airbnb的目标用户群体具有什么样的特征,以便于在付费投放获客时,精准的圈定出产品用户画像的人群,使获客的ROI变得更好。       ②airbnb获客阶段,哪些推广渠道是优质的,优质的条件 = 量大+转化率高。       ③在转化漏斗中哪里哪一个环节的流失率高,或者说哪一环节存在可提升的潜在机会。   二、分析维度       根据以上设定的三个问题,提出来2个分析维度:       将着重从airbnb的用户画像、推广渠道分析2个方面进行分析,去探索和分析airbnb在产品和业务上有哪些可以改进的地方,并给出实际性的建议,以提升和改进airbnb的渠道推广策略和产品设计。       用户画像分析:用户性别的分布特征、用户年龄的分布特征、用户地区的分布分布、中国地区去国外预定的地区占比。       推广渠道分析:每月新增用户、不同用户端的注册量、不同推广渠道的注册量、不同营销内容的注册量、不同推广渠道的转化率、不同营销内容的转化率,注册用户占比、活跃用户(非僵尸用户)占比、下单用户占比、实际支付用户占比等。   三、数据表理解与预处理 3.1数据集描述       Airbnb顾客预订数据下载(下载后导入本地数据库操作,计算出相关的运营指标直接使用),下载地址:www.kaggle.com/c/airbnb-recruiting-new-user-bookings/data。       此数据集是kaggle上的一个竞赛项目,官方目的主要是用来制作目的地信息的预测模型。此数据聚集包含两张数据表,其中train_user表中为用户数据,sessions表中为行为数据。   3.2字段理解       原数据表的字段是英文的,所以在做仪表板和数据分析前,需要先翻译理解每个列名称的含义。 1、数据表名称:train_users 字段名称   id 用户ID date_account_created 帐户创建日期 date_first_booking 首次预订日期 gender 性别 age 年龄 signup_method 注册方式 signup_flow 用户注册页面 language 语言偏好 affiliate_channel 渠道方式 affiliate_provider 渠道供应商 first_affiliate_tracked 渠道广告内容 signup_app 注册来源 first_device_type 注册设备 first_browser 注册浏览器 country_destination 目的地国家 2、数据表名称:sessions 字段名称 字段含义 user_id 主键;与users表中的“id”列连接 action 埋点名称 action_type 操作事件类型 action_detail 操作事件描述 device_type 设备类型   3.3数据预处理 1、重复值处理       train_users:作为用户信息表,未避免重复用户影响统计,需要检验ID是否有重复值。       sessions :为用户会话记录表,存在一个用户多条记录,无需处理。       按照业务理解,用户表中的id应当是唯一非重复的,所以只需要排查train_users中是否存在重复值。执行SQL后得出:count_id = 0。说明train_users数据表中不存在重复值。 2、缺失值处理       数据缺失数量较多,以下为存在缺失值的列及处理办法。字段缺失值说明:       ①date_first_booking 首次预定时间:存在缺失值数量124544个       ②gender 性别:存在缺失值数量95688个       ③age 年龄:存在缺失值数量87991个       ④first_affiliate_tracked 注册渠道:存在缺失值数量6065个       ⑤first_browser 注册浏览器:存在缺失值数量27266个       ⑥action_type 操作类型:存在缺失值数量1126204       ⑦action_detail 操作详情:存在缺失值数量1126204个。       缺失原因推测及处理:date_first_booking(首次预定时间)数据如果缺失,在业务上可以理解为此用户为“未预定用户”,也就是没有下单的用户。性别、年龄由于客户端中这部分信息选填,空值为用户未填写。其他四个数据是由于前端统计时数据没有统计到。       处理:多数空值不需要处理;如果使用到字段如果出现空缺,可以简单的在where条件排除掉空数据,或者在制作仪表板的过程中做针对性的过滤,再进行分析。 3、异常值处理       date_account_created异常值处理:date_account_created中最小值为‘0000-00-00 00:00:00’;因为此异常数据只有1条,所以删除此条数据。       age(年龄)异常值处理:age(年龄)的异常数据非常多;0~150之间的数值都有,并且包含了2014、2015等数值。推测这些"脏数据"产生的原因是用户在客户端随意填写造成,分析时剔除这些异常数据。   四、用户画像分析 4.1用户的性别分布特征 女性用户数量=63041(占比53.53%)、男性用户数量=54440(占比46.23%),其中女性用户多于男性用户。   4.2用户的年龄分布特征 airbnb的用户主要为“中年群体”(30岁~40岁),其次为“青年群体”(20岁~30岁),然后再到40岁~50岁。   4.3用户不同地区(根据语言)的分布 使用最多的语言排名前5的分别是英文、中文、法文、西班牙文、朝鲜文。airbnb的产品真的很国际化,用户遍布多个地区。 有超过90%的用户是英语国家(欧美);airbnb是2013年开始进入中国市场的(此数据集止于2014年),所以此时中文用户数量虽然排名第二,但是占比却非常小。   4.4中国用户去国外预定的地区占比 从数据结果可以看出(国家=DNF已剔除),中国人去国外预定民宿最主要集中在美国、然后是法国,除了这两个国家外,样本中其他国家的数量非常少。 中国用户去国外预定,占比最多的是美国。其余国家占比很小,总和不到20%。   五、流量渠道分析   5.1每月新增用户 airbnb用户增长呈几何倍数,并且从2012年2月之后开始快速增长。 此产品新用户的增加存在季节性规律:每年的7~10月,产品都会迎来用户增长的高峰,推测为夏季(北半球)是旅行的旺季,而短租本身就是旅行消费的一种。   5.2不同用户端的注册量 此数据为2014年之前的数据,当时智能手机还没有像现在一样普及,用户的注册设备PC大于移动设备,而苹果设备数量大于其他设备数量。   5.3不同渠道供应商的注册用户量 除direct直接下载之外,google是其主要的下载来源,注册用户量也比较多(51693)。   5.4注册用户转化率 craigslist、bing虽然注册用户量少,但是转化率高,尽可能的扩大规模这两个渠道的获客规模。 特别提示:实际在选择渠道时,不同渠道的ROI(收入/获客成本)也是需要考虑的核心指标,ROI越高则说明此渠道价值越大。   5.5用户转化率分析 搜索房源-->申请预约是流失率最高的一个环节。 申请预约-->支付有43%的流失率,远高于其他电商类产品。   六、分析结论及建议 6.1、用户画像总结 1、结论       ①用户性别中,女性偏多,差距并不明显。       ②用户年龄以中青年为主。       ③截止2014年,用户分布地区最多的为欧美地区,其次是中国。       ④中国用户预订的最多的其他国家是美国,占比高达90%以上。 2、建议       据年龄分布特征,建议SEO或者付费广告投放时,投放广告的流量结构要尽可能的接近airbnb的用户人群,例如青年女性群体。   6.2流量渠道总结 1、结论       ①2012开始快速增长,并且速度很快。       ②7~10月是旅行旺季、此时也是airbnb用户增长的旺季。       ③某些虽然注册用户量少,但是转化率高;需要综合ROI判断选择哪个渠道扩大规模。       ④和其他电商产品类似,用户主要在搜索房源-->申请预约中流失,产品和运营需要更多的在此环节投入更大的精力,另外产品申请预约-->支付的流失率远高于其他电商类产品。 2、建议       综合考虑ROI表现最好的渠道,同时要结合市场战略和多哥指标综合考虑;某些渠道虽然注册用户量少,但是转化率高,可以尽可能的尝试扩大规模。   最终作品展示:
个人成就
内容被浏览10,303
加入社区3年217天
返回顶部