第一种方法,采取均值的方法。我个人是不太建议用均值作为阈值的。因为现实情况经常有一些异常值,会影响均值的计算。而数据清洗的时候很难都排掉异常。
第二种方法,是采取中位数(或者其他分位数,比如20%分位)的方法。这种方法直接将排序后的用户按照数量进行划分,中位数可以将人群一分为均等两份,其他分位数也可以有合理的业务解释:20%的用户贡献了80%的作用,等等。
第三种方法,也是市面上看到比较多的方法,就是打分法。
所谓的打分法,就是先将原始的R、F、M数值划分为1~5的分数,然后求分数均值,作为划分阈值。
建议使用第二种。