质量管理中最常遇到的连续型分布是正态分布,很多质量特性X都可以用正态分布来描述其取值的规律性。数学理论上可以证明,如果某项指标受到很多项随机因素的干扰,而每项干扰都很小的话,则所有干扰影响的综合结果将导致此项指标的分布为正态分布。
一般正态分布的概率密度函数为:
μ是正态分布的均值,σ²是正态分布的方差,π和e都是常量
e是自然数大约为2.718
上两章节我们讲解频数直方图和频率直方图,不难发现正态分布只是在其基础上多了一条正态分布的曲线,结合曲线我们可以更好的观察分布情况。
示例:
某地区连续50年中四月份平均气温资料如下(单位:℃):
某地区连续50年中四月份平均气温资料如下(单位:℃):
6.9 |
4.1 |
6.6 |
5.2 |
6.4 |
7.9 |
8.6 |
3 |
4.4 |
6.7 |
7.1 |
4.7 |
9.1 |
6.8 |
8.6 |
5.2 |
5.8 |
7.9 |
5.6 |
8.8 |
8.1 |
5.7 |
8.4 |
4.1 |
6.4 |
6.2 |
5.2 |
6.8 |
5.6 |
5.6 |
6.8 |
8.2 |
6.4 |
4.8 |
6.9 |
7.1 |
9.7 |
6.4 |
7.3 |
6.8 |
7.1 |
4.8 |
5.8 |
6.5 |
5.9 |
7.3 |
5.5 |
7.4 |
6.2 |
7.7 |
解:
样本观测值中最小值min=3,最大值max=9.7,取整,最小为3,最大为10,将区间[3,10]等分为7个小区间,区间长度为(10-3)/7=1,计算样本观测值落人各小区间的频数
区间 |
频数 |
频率 |
[3,4] |
1 |
1/50 |
(4,5] |
6 |
6/50 |
(5,6] |
11 |
11/50 |
(6,7] |
15 |
15/50 |
(7,8] |
9 |
9/50 |
(8,9] |
6 |
6/50 |
(9,10] |
2 |
2/50 |
ps:
-
集中和记录数据,求出其最大值和最小值。数据的数量应在100个以上,在数量不多的情况下,至少也应在50个以上。 我们把分成组的个数称为组数,每一个组的两个端点的差称为组距。
-
将数据分成若干组,并做好记号。分组的数量在5-12之间较为适宜。
-
计算组距的宽度。用最大值和最小值之差去除组数,求出组距的宽度。
结合上章的案例数据,我们只需在其基础上新增密度曲线,其可以结合一般正态分布的概率密度函数计算得来
效果图如下:
在线效果展示
数据来源:百度
注:此栗子使用的是6.1 版本,其它版本未进行测试,理论上适用于V5.0 、V6.0以上版本,大家可自行进行测试。
本次结合上两章分享的质量管理中常用的直方图,在其基础上绘制了正态分布的概率密度函数用于直观展现数据的分布情况。
访问:https://www.finebi.com/product/download,进行下载体验吧!
当然,你也可以进行线上练习
没有服务器,个人电脑BI运行卡慢?
本地安装,做好的看板无法分享?
FineBI在线版开放,提供个人独立分析账号!
登录地址:https://pcdemo.finebi.com/webroot/decision
|