【2023BI数据分析大赛】亚马逊用户行为分析

yzm159928

一、选手简介

1、选手介绍

- La vie：帆软社区用户名 wJ26t2187873 ，个人自学对数据分析和数据挖掘都很感兴趣，主要是关注电商方面，希望以比赛更好落地自己的技能，也想挑战自己，了解自己水平。

2、参赛初衷

- 希望通过比赛实践提升BI工具的使用方法和技巧
- 检验个人的数据分析能力
- 提升自己的数据敏感度及分析思维，培养数据洞察的能力
- 希望通过比赛实践提升自己的数据分析能力和可视化工具的使用展现能力，提升自己的数据敏感度及思维和培养数据洞察的能力
- 通过比赛实践了解自己数据分析能力的水平，发现思维和思路或分析方法使用等可能的欠缺的地方和漏洞

二、作品介绍

1、业务背景/需求痛点

简述业务背景：
- 亚马逊，是美国最大的一家网络电子商务公司，也是全球商品品种最多的网上零售商和全球第二大互联网企业。
- 公司把“最以客户为中心的公司”确立为努力的目标，打造以客户为中心的服务型企业成为了亚马逊的发展方向。
- 以下为网上零售商关于市场及潜力的矩阵分布图，亚马逊处于较大市场空间但是发展潜力欠缺的位置，因此更应该深度发掘用户的潜在价值

简述需求痛点：
- 公司希望通过印度加达格的2023年6月4号-16号期间的用户行为数据进行分析，深入了解客户偏好、购物习惯和决策过程，更深入地了解消费者行为、识别趋势、优化营销策略并改善整体客户体验。

2、数据来源

- 自选数据（数据来自于Kaggle）：

https://www.kaggle.com/datasets/swathiunnikrishnan/amazon-consumer-behaviour-dataset

这是一个为分析亚马逊消费者的行为而收集的数据集，由亚马逊生态系统内的客户互动、浏览模式的全面集合组成，包括广泛的变量，例如客户人口统计、用户交互和评论。

亚马逊用户的交互数据，字段包括

字段名称	字段含义
Timestamp	时间戳
age	年龄
gender	性别
Browsing_Frequency	浏览亚马逊网站或应用程序的频率
Purchase_Frequency	购物的频率
Purchase_Categories	通常购买哪些商品类别
Personalized_Recommendation_Frequency1	收到个性化商品推荐的频率
Rating_Accuracy	推荐的相关性和准确性评分说明:评分1~5，代表高分~低分
Personalized_Recommendation_Frequency	曾经根据个性化商品推荐是否进行过购买
Product_Search_Method	搜索商品的方式
Search_Result_Exploration	搜索倾向于单页搜索还是多页搜索
Add_to_Cart_Browsing	浏览时是否将商品加购
Cart_Completion_Frequency	商品加购后是否完成交易
Saveforlater_Frequency	是否使用过“保存以供稍后使用”功能
Review_Reliability	商品评论依赖度
Review_Helpativity	是否从其他用户的评论找到有用信息
Recommendation_Helpativity	建议是否有帮助
Customer_Reviews_Importance	用户评论在决策过程中的重要性评分说明:评分1~5，代表高分~低分
Cart_Abandonment_Factors	放弃加购后商品的影响因素
Review_Left	是否留下过商品评论
Shopping_Satisfaction	整体购物体验满意度说明:其中 1 最满意而 5 最不满意
Service_Appreciation	最欣赏服务的哪些方面
Improvement_Areas	建议可改进的领域

3、分析思路

- 明确分析问题>分析线索>分析视角>应用场景
  - 核心需求在于了解消费者行为、优化营销策略并改善整体客户体验
  - 由于是用户行为分析，核心变量在于用户，所有的分析都需要围绕用户进行展开
    - 思路1:
      - 从用户自身属性出发，分析用户自带的社会属性及历史行为属性
      - 参考使用AISAS模型中的中的”AI”部分:引起注意及引起兴趣，区分出两种选择模式，被动选择(个性化推荐)及主动选择(主动搜索浏览)
      - 参考使用AISAS模型中的中的”SAS”部分:进行搜索-购买行动-进行分享相对于的是用户行为模块(含搜索)及用户反馈模块
      - 对数据标签进行分块排列
    - 思路2:
      - 对核心用户标签与其余标签进行相关探索性分析
    - 思路3:
      - 对非核心用户标签外的标签有选择性的进行相关探索性分析(时间不够尚未完成)
  - 注意:重点以与业务需求是否相关进行判断分析必要的依据，对分析内容深挖和广度进行收敛控制

4、数据处理

数据预处理，构造新列，剔除无用列，调整列间位置

1.在excel中进行预处理
- 对timestamp进行了处理，使用excel的分列功能，修改单元格格式，
- 将timestamp拆分成Date，Time，AM/PM及Time zone
2.结合Time和AM/PM把Time整合全时段时间
- New time=B2+TIME(IF(C2="PM"，12，0)，0，0)

数据导入&finebi中的预处理
- 1.finebi加入数据后，进行字段设置，剔除Time，AM/PM等过程列，将Date的数据类型改为日期类型

写公式补充年龄段新列及位移

补充新列”星期几” FORMAT(${Date}，"MM/dd/yyyy") WEEKDAY(${日期})

补充新列”小时” HOUR(Date)

剔除Date列，日期和星期几位移

数据预览:

5、可视化报告

（1）数据含义表达和图表排版布局

数据含义表达(由于未有足够时间进行调整，图形选择上较为单一)
- 以用户自身属性+个性化推荐为出发点，结合AISAS模型的顺序进行展开分析，其中模块内基础的统计分析+核心标签关联分析(部分实现)+非核心标签的关联分析(未足够时间实现)业务需求:主要说明业务需求及痛点，以及所需达成的目标

业务需求:主要说明业务需求及痛点，以及所需达成的目标
用户自身属性模块:用户自身社会属性及历史行为属性
- 除了timestamp时间戳衍生出来的时间标签外，只有age是数值标签，其余剩下标签均为文本标签，因此多采用柱形图或者条形图的方式进行横向对比或者纵向对比，age和gender标签则使用圆环来体现各个不同类别占据总体的情况
个性化推荐模块:个性化推荐营销的效果分析及用户对个性化系统的评价
- 除了Personalized_Recommendation_Frequency为文本标签外，剩余Personalized_Recommendation_Frequency1 以及Rating_Accuracy 均为数值标签，由于Personalized_Recommendation_Frequency1的得分与实际是反比，因此以柱形图加值轴说明情况来展现，剩余则选用圆环来说明各个类别占据总体的比例情况
用户决策模块:了解用户关于商品评论重视度及趋势
- 本模块中标签均为多类别的文本标签，在小于6个类别的情况下可采用圆环或者柱形图/条形图(类别标签过长时候)进行说明各个类别占据整体的比例情情况
用户行为模块:了解用户搜索行为等其他行为信息以及购买的情况
- 本模块中标签情况均为文本标签，且主要需要的是不同的深浅程度，因此均以圆环图进行展示(虽然较为单一，但是由于时间有限未来得及调整)，其中补充说明Always，Often及Sometimes这三者的程度情况:Always的频度为100%，Often的频度为50%左右，Sometimes的频度为20%左右
用户反馈模块:了解用户的UGC内容沉淀，整体了解用户评价及优缺点
- 本模块所选图形的逻辑同上面的一致，其中考虑到前面分析到本平台主要用户为女性，因而额外分析不同性别下的整体购物服务满意度情况

排版布局，设置颜色(暂未具体设置，只根据类别进行区分颜色)
- 排版布局
  1. 以总分总的形式进行布局，先说明业务需求，再根据AISAS模型顺序展开分析各个模块，最后汇总得出结论
  2. 具体模块内细分图表布局，根据所要表达的内容及内容相关性结合展示的可阅读性综合考虑，进行布放各种细分的表格
- 设置颜色
  - 颜色考虑其实是需要考虑突出想展示内容的，同时考虑展示内容的观感及颜色搭配，甚至于警戒线等辅助线标识进行突出表现内容，还需和总体背景相吻合，是个整体的系统的工程，本次由于时间不够仅仅以系统默认的颜色根据不同类别进行设置，也并未加太多的辅助线以说明重点内容

（2）通过分析得出的结论

用户自身属性模块
- 用户主要集中于周一到周五浏览亚马逊平台，且主要是发生在14~15，17~19及22~23这三个时间段内
- 用户年龄接近80%在20~40岁间，且接近60%为女性
- 接近80%的用户浏览亚马逊平台每月多次或者每周多次，且每月购买多次的情况较多，主要购买品类为美容美体和服装时尚两大类
个性化推荐模块
- 个性化推荐推送的频率控制在经常和正常范围内，用户对个性化推荐的评价相对中等，但接近有60%的用户因为个性化推荐购买过商品，个性化推荐商品还是一定程度上影响用户购买行为的发生的
用户决策模块
- 90%用户对商品评论有着中等甚至重度的依赖度，同时普遍认为具有中等偏高的价值，超70%用户认为商品评论对自己有所帮助
用户行为模块
- 用户以类别及关键字形式来搜索所需商品，并且超7成用户搜索多页
- 用户浏览商品加购的概率至少35%以上，接近有30%多的概率会加购后完成交易
- 用户对使用"保护以供稍后使用"的功能接受程度接近80%
用户反馈模块
- 近半数用户是会下商品评论的，近8成用户对在亚马逊平台的购物体验满意度还是中等偏上的，且女性满意度稍高于男性
- 用户最喜欢亚马逊服务的点是商品评论，竞争性价格及广泛的商品选择空间
- 用户希望亚马逊改善的点是客户服务响应，产品质量及准确性以及减少包装时浪费
最终结论
- 消费者行为
  - 用户多以类别和关键字形式来搜索所需商品，注意优化SOP，排名顺序及类别分类精准性，多页搜索结果注意优化商品间差异以提供更多选择
  - 用户浏览商品加购概率为35%以上，但是仅有30%多的概率会加购完成交易，注意加购后优惠卷或其他优惠服务，引导用户完成交易，提供交易完成度
  - 用户接受 "保护以供稍后使用"的功能程度较高，可继续提升优化此功能
- 识别趋势
  - 用户集中于周一到周五,且浏览购买发生时段在14~15，17~19及22~23这三个，建议在此时间段进行个性化商品推荐的推送服务
  - 用户年龄80%集中在20~40岁且接近60%为女性，可以以20~40岁的女性用户群体进行精准化推送个性化商品的推荐，主要推送品类为美容美体和服装时尚两大类
- 优化营销策略
  - 个性化推荐推送的频率建议控制在正常到经常的水平，用户对个性化推荐的效果还是比较认同，建议提升个性化商品推荐的精准度及保证更高的商品质量
  - 建议对未曾对商品进行评论的用户进行鼓励，同时注意过滤商品评论的信息，控制好商品评论的高价值度，提升商品评论的建议有效性
  - 用户最喜的点为商品评论，竞争性价格及广泛的商品选择空间，注意持续提升用户喜闻乐见的点，发扬优势
  - 用户希望改善的点是客户服务响应，商品质量及准确性以及减少包装时浪费，注意控制客户服务响应的时间及服务质量，采购的商品质量及准确性应控制好，采用可环保再生的材料进行包装

（3）最终结果呈现的页面布局

三、参赛总结

1、FineBI工具

对BI工具的看法：
- 亮点:
  1. 组件和仪表板灵活拖动功能很好，而且软件的顺畅很多
  2. 就算较长时间未使用上手学习成本也较低，学习起来速度也较快
  3. 界面显示优化，页面更加美观立体了
  4. 软件自带自适应功能默认开启，不再需要加载额外的模块了，好评，常用功能集成的更加周全
- 缺点:

- 1. 对没有进行预处理的离散数据无法高效的进行区间分类打标，处理方式较为单一不够灵活
  2. 社区帖子编辑与实际展示效果存在偏差，实际展示效果更加乱，就算在编辑模式下调整好在帖子模式下仍然出现换行不对格等格式错误，使人头大，且缺少调整字体大小及字体样式的功能按键，格式刷也没有，编辑修改起来很困难，缺少表格左右移动的操作按键，实际是很不方方便
- 对数据分析的价值的思考. :
  1. 数据分析核心价值还是得根据业务需求及痛点，否则毫无价值，目的导向才是唯一的
  2. 大数据时代,数据虽然很多但并非所有数据都具有价值,数据分析就是发现出有价值的信息
  3. 帮助公司解决很多业务问题,通过数学模型,可以预测公司未来的走向,指导公司的战略方向,调整公司的运营策略以及执行方案

2、参赛总结

总结谈谈在这个过程中的克服的困难、感恩的事儿、认知新感悟等等：
- 克服的困难：在短暂十五天赶工参加比赛，每晚甚至于在路上也时常考虑数据集选择和如何分析，还是刚好在作品结束上传前几分钟完成上传
- 感恩的事儿：经过几次数据分析比赛历练，感觉对数据分析认知有所改变，更多以目标导向为主导，以解决问题为重点进行分析，不再像是过去那样不控制深度及广度那样探索性分析了
- 认知新感悟：随着数据分析经验以及社会生活阅历的积累，看待事物的态度及分析过程手段均有所改变，逐渐从理想主义走向现实实用主义，解决业务问题才是数据分析的价值，其他都是白搭的自娱自乐，同时以目标导向的数据分析效率也更高，也更加符合数据量爆炸且数据流不断的今时今日，切时满足解决目前的业务需求问题即可，想的太多太深还不如切实落于实处直接开展分析工作，真是忌讳想太多做太少，而且要注意时间上的安排，方法再多也要具体落于实处才好发力

yzm159928 · 发表于 2023-8-17 01:32:44

帖子下编辑模式真实的不好用希望能有所改善就好了

帆软苏茜 · 发表于 2023-8-17 10:29:59

恭喜通过大赛初审！！

1、图片模糊，建议优化排版和图片，可点击文末“编辑”按钮重新上传图片，或者选择“导入Word”按钮，重新导入全文；

2、如果使用本地BI制作，请确保提交的附件resources.zip内容完整（附件如有更新请微信发送苏茜）；组委会将在8月16日后统一进行作品资源迁移，将您的作品导入大赛公共平台，形成在线模板查看链接，方便评委查看；

评审优先看此社区文章，请选手确保内容完整、排版清晰。截止8月17日20:00仍可调整排版问题，作品其他内容不可再修改。

F小美吖 · 发表于 2023-9-8 21:44:31

哈哈哈，主打一个饼图+柱状图的方式呈现，最后得出了相对应的结论，简约而不简单，不错诶~

晕晕cc · 发表于 2023-9-10 22:22:23

打卡：单纯用饼图和直方图没什么，颜色都差不多，就真的很让人提取兴趣了，建议楼主适当的优化组件

流年的你我 · 发表于 2023-9-16 18:16:18

打卡：
工具运用的很多，整体的分析思路不错，UI设计的整机很舒服。整体故事化的讲解，逻辑贯穿始终

chenliang · 发表于 2023-10-2 13:25:27

打卡：
分析框架解读清晰，具有完整的数据分析过程体现，图表类型选取合理，能够恰当的表达相关的数据分析场景。

宝矿力不加冰 · 发表于 2023-10-13 10:33:09

打卡：完整的数据分析过程，配色统一，布局合理美观，图表类型选取合理，故事化表达相关的数据分析场景，值得学习。

11回帖数	4关注人数	11415浏览人数
最后回复于：2023-10-13 10:33

提问

【2023BI数据分析大赛】亚马逊用户行为分析