使用FineBI绘制相关矩阵图

这个人不太懒,写了一点东西
大家好,好久不见我又来刷存在感了。
有一阵没出周历图系列了,哎,最近实在太忙(lǎn),深陷一起离奇的法庭纠纷(画外音:滚!不就玩个逆转裁判吗)
好了,话不多说,来看我们今天的主角——相关矩阵图:
截图202005131403222479.png
—嗯?不就是矩形块吗?就这都敢来招摇撞骗?
—且等等,这个图里还有玄机啊……
相关系数矩阵图常用于多变量的数据分析,当变量较多时,我们很难从一堆庞大的数字中快速获取信息。正因为如此,相关阵的可视化应运而生。图中的横纵坐标表示不同的变量,而中间的值表示两个变量间的相关度,位于对角线的值等于1。从矩阵图中,可以快速地看出不同变量的相关性,便于我们快速地了解数据集中的关联。

这个图在FR里有个付费的插件,嗯,就是付费的。叫马赛克图:https://help.finereport.com/doc-view-3173.html
我们使用BI学习班中最经典的案例之一:超市购物篮分析的数据集。还不熟悉这个案例的朋友可以去了解下,听听@bear9939 老师的精彩讲解,如何计算置信度、提升度、支持度。


不过,我们今天计算的是相关度,步骤有些不一样:
第一步,我们打开数据集,这是个超市购物篮数据集,每个订单id表示一笔订单,我们的目标是要找出订单内商品出现的关联性:
截图202005131131269918.png
第二步,跟学习班的方法一样,我们把这个数据集复制一次,跟自身进行左右并集合并,连接字段为“订单ID”
截图202005131134056118.png
第三步:将商品维度拖入分组,把“订单ID”求去重计数(嗯,是不是跟BI学习班的一模一样):
截图202005131134481906.png
第四步:相关矩阵中一般要求数据显示百分比,我们需要将数据归一化(normalization)处理,在这我们采用最常用的归一化算法,将所有数据缩放至[0,1],计算公式为:
  1. (观测值 - 最小值)/ (最大值 - 最小值)
复制代码

我们分别新建一列求关于商品维度的最小值、最大值
截图202005131140468207.png 截图202005131141168293.png
然后新增一列取名为归一化值,输入公式 (订单ID-最小)/(最大-最小)
截图202005131143398365.png
第五步:后面就很简单了,新建仪表板,安装制作矩形块图的方式,把商品的两个商品维度分别拖入横纵轴,并都按商品名称降序排列,然后把归一化值拖入颜色和标签,这样就大功告成啦:
截图202005131402419446.png

最后,本案例没有涉及负相关的情况,矩阵颜色因而略显单调,实际中我们碰到的数据集通常都比较复杂,构建的矩阵图往往是这样的:
截图202005131151058421.png
照例附上数据集文件 超市购物篮.xlsx (10.83 KB, 下载次数: 25)
参与人数 +1 F豆 +150 理由
Leo.Tsai + 150 太棒了,给你32个赞,么么哒

查看全部评分

发表于 2020-5-13 13:25:51
大佬,你最后一步算的是区间缩放吧,一般是用来数据预处理标准化的。相关系数最少自身与自身得是1呀
发表于 2020-5-13 13:50:45
hotfog119 发表于 2020-5-13 13:25
大佬,你最后一步算的是区间缩放吧,一般是用来数据预处理标准化的。相关系数最少自身与自身得是1呀

抱歉,平时习惯看右斜的啦。一时恍惚
发表于 2020-5-15 23:15:58
楼主威武。感谢分享。赞一个。
www.beiheib.com
发表于 2020-5-18 08:57:53
发表于 2020-5-20 08:41:57
膜拜了
发表于 2020-5-27 19:21:09
发表于 2020-5-30 16:08:13
发表于 2020-6-2 10:47:30
方法不错。学习了。谢谢!
发表于 2020-6-8 11:41:09
我也要上方坐标轴
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

12回帖数 1关注人数 16447浏览人数
最后回复于:2020-6-8 11:41

返回顶部 返回列表