最近,小九收到了一条来自电商行业的求助留言:
「需要求本地400多万条数据的客单价,但数据源太大,Excel根本打不开怎么办?」
下面小九就来讲讲给几十万甚至上百万行数据求平均数如何处理才最省时省力!
进行客户价值分层分析时,一般会用到RFM模型。进行RFM分析时,绝大部分人会使用Excel来实现客单价、客户平均频次和最近消费平均间隔等指标的计算。
诚然,在处理少量数据时,Excel凭借其强大的基础功能在数据分析领域占有绝对的统治地位。
但Excel的处理性能是有限的,面对海量数据就会失去优势:Excel处理的单表最大数据量为1048576行,超过10万行就会产生卡顿现象,更不用说对400多万条数据进行数据分析了。
为了解决使用Excel处理庞大数据时出现的问题,九数云在线秒级分析百万数据的强大功能应运而生。
电商平台对用户进行分析常会用到RFM模型,在进行RFM分析时常常需要求平均数。
RFM 分析三个重要指标是:
-
最近一次消费时间(R):客户距离最近的一次采购时间的间隔。
-
最近一段时间内消费频次(F):指客户在限定的期间内所购买的次数。
-
最近一段时间内消费金额(M):客户的消费能力,通常以客户单次的平均消费金额作为衡量指标。
下面小九就以RFM分析中计算三个重要指标的环节为例,给大家详细展示下如何用九数云1秒搞定平均数。
导入400多万行的某电商平台2020年2月到8月份的部分用户购买数据,点击「创建分析表」。
全选字段后,利用「字段重命名」功能修改字段名称。
添加「公式」,新增字段“时间标准化”。如图所示输入公式,修改字段类型为日期。
重新选择需要的字段后添加「分类汇总」分析步骤,将所有字段如图所示拖入“分类”,达到删除重复值的效果。
1. 计算每个客户消费频次(F)
由于一条记录代表该用户购买了一次,所以拖入一个「用户编号」求「计数」即可。
以 [ 商品编号 ] 为分类,汇总 [ 用户编号计数 ] ,[ 价格求和 ] ,[ 时间标准化最晚时间 ] 。
2. 计算每个客户最近一次消费距离时间(R)
添加「公式」,新增字段“最近消费间隔”。如图所示,使用 DATEDIF( )和 TODAY( ) 两种函数计算,修改字段类型为数值。
3. 计算每个客户平均消费金额(M)
添加「分类汇总」,拖入[ 价格求和 ]字段,选择平均值。
4. 计算「总消费频次平均数」和「最近消费间隔平均值」
继续拖入 [ 最近消费间隔 ] ,[ 用户编号计数 ] 字段,选择平均值的汇总方式,再点击「合并上一步数据」。
以上就是计算RFM三个指标的全过程
通过九数云的秒级计算百万级数据功能,用户可以对海量数据进行丝滑的数据分析,完全不会出现任何卡顿。
同时,九数云一劳永逸的数据分析模式也是可圈可点的功能:用户只需进行一次全过程操作,就能解放双手。换句话讲,后续用户只需简单点击鼠标更新数据,就能实现想要的分析,从而节省了大量时间成本,将更多精力投入更深层的分析之中。
|