2024年1月9日发(作者:丰田锐志2017款)

Minitab使用

1 预处理

数据转置

从excel里面导入的数据有时候是横向的,在minitab中要转成纵向。

“数据”->“转置列”。

将数据列选择到“转置以下列中”,将变量列选择到“使用列创建变量名”中。

转置后结果如上所示。

数据列合并

以上三列数据分属三种条件下的数据,可以用minitab合并成一列。

选择“数据”->“堆叠”->“列”

把要合并的列选入“堆叠以下列”,然后在“当前工作表的列”中写入列的名称,以及列的分类下标。

合并后的数据就如上所示

数据置换

如果有坏点,则可以用“数据”->“编码”将坏点置换成*。

用“:”表示数据的范围。

BOX-COX变换

某些非正态分布的数据,可以通过BOX-COX变换成正态分布。

D1, D2, D3 的概率图正态 - 95% 置信区间99.99995902010510.1变量D1D2D3均值标准差NADP2.8332.23550014.076<0.0055.3363.4751253.682<0.0050.10040.010215002.628<0.005百分比-10-505数据10152025

上面三组数据都不是正态分布。采用BOX-COX变换可以变成正态分布的数据。

T1, T2, T3 的概率图正态 - 95% 置信区间99.99995902010510.1变量T1T2T3均值1.1971.48510.06标准差NADP0.23785000.5740.1360.62521250.2820.6330.99335000.2420.771百分比0246数据8101214

上面是转换的结果。

Johnson变换

还可以用Johnson变换进行正态变换。

D1 的 Johnson 变换原始数据的概率图选择变换N500AD14.076P 值<0.00599.99990百分比0.71AD

检验的

P

值0.480.360.240.120.000.20.40.61.01.2参考 P501010.108160.8Z 值(P 值 = 0.005 均值 <= 0.005)已变换数据的概率图99.99990百分比N500AD0.326P 值0.521501010.1-2024最佳拟合的 P 值: 0.520622最佳拟合的 Z: 0.71最佳变换类型:SB变换函数相等1.79779 + 1.03549 * Ln( ( X + 0.192247 ) / ( 15.9282 - X ) )

变换的结果。

个体分布标识

采用这个统计工具将数据拟合为各种概率分布。

2 分析

2.1 数据描述

数据描述是给出样本数据的中心趋势和分离趋势的统计量。中心趋势统计量包括均值、中值、众数、四分位数,分类趋势的统计量包括极差(R)、标准差(s)、方差、四分极差。

这些描述都只能描述样本数据的静态性能,而对样本数据沿时间轴的分布无法描述。

Minitab在“统计”->“基本统计量”->“显示描述性统计”中计算描述性统计。

将要统计的列选入“变量”,在“统计量”中选择具体的统计量指标。

minitab用文字形式给出统计量的计算结果。

2.2 图形

对静态特性进行描述的图形包括:直方图、点图、箱线图。对动态数据进行描述的图形包括:时间序列图、控制图

直方图

直方图是最常用的图形,可以直观地判断样本数据的分布。

在“图形”->“直方图”中。

将需要分析的样本数据列选入“图形变量”

多个数据列可以类似操作

在特定的条件下,大多数样本数据都应当满足正态分布。为了判断样本数据是否符合正态分布,有如下的三种方法:

1)图形化汇总

在“统计”->“基本统计量”->“图形化汇总”。

将要统计的样本列选入“变量”,在“按变量”中可以选择样本的分组列。同时可以设置检验的置信水平,默认为95%。

默认是按照Anderson-Darling进行检验。如果P值低于0.05(1-0.95),则表示样本数据在

95%的置信水平下不符合正态分布。同时这个检验还给出了数据的描述性统计以及在95%置信水平下的均值、中值和标准差的分布区间。

2)正态性检验

在“统计”->“基本统计量”->“正态性检验”中。

给出概率图和p值,根据p值可以判断是否接受样本数据分布为正态分布的假设。

3)概率图

概率图也可以在图形中绘制。

对于满足正态分布的数据,如果已知整体的均值和标准差,

箱线图

箱线图是用图形的形式形象的给出数据的描述性统计量。

在minitab的“图形”->“箱线图”

其中方箱为Q1到Q3部分的数据,横线为中值,而上下端线为上下25%的数据。由此可见,箱线图可以形象的表示出数据的中值、四分位数以及极差、四分位极差。

时间序列图

为了研究样本数据与时间的关系,可以采用时间序列图。

在minitab“图形”->“时间序列图”

控制图

对于单组数据,可以采用“单值的变量控制图”

炉膛压力_x1 的单值控制图12.510.07.5单独值851UCL=8.555.02.56_X =3.640.0666222LCL=-1.2639:0131:0

-9130:3635:020-096

-7138:0

-7230:0220-09620-097

-632:0

-7030:0

-7032:0020-09620-09620-097

-634:0

-7030:6620-09620时间-09

-9020099

--620-09620-09

-91

在控制图上显示了数据的平均值以及3倍标准差的范围,其中红色点是异常的不稳定的数据点。

如果有不同阶段的数据,可以在“单值控制图选项”中选择“阶段”

压力 按 阶段 的单值控制图1009080单独值R11R2R3R4R5UCL=92.055R6R7R8UCL=92.26UCL=87.63UCL=84.42UCL=83.0834UCL=86.166UCL=88.7987060_____7__X =70.83_X =70.62X =69.54X =70.36X =70.88X =68.60X =69.34X =68.50222UCL=77.545LCL=59.66LCL=57.33LCL=55.99LCL=55.50LCL=53.0950LCL=49.89LCL=48.995LCL=44.94481观测值

可以比较不同阶段的数据。

对于分组数据,可以采用“子组的变量控制图”。如果组内数据量超过8个,选用Xbar-S(均值-标准差),如果数据量不超过8个,选用Xbar-R(均值-极值)

X 的 Xbar-R 控制图UCL=74.0155274.01样本均值74.00__X =74.001773.991357911样本13151719LCL=73.987880.0480.036样本极差UCL=0.050680.0240.0120.样本13151719_R=0.02397LCL=0

其中Xbar是每组的均值,可以看出组间的波动情况。而R是每组的极差,表示了每组组内的波动情况。

对于离散数据,采用“属性控制图”。其中p图用于控制不良品发生率,与每组的抽样数有关,np图用于控制不良品发生数,这两种图的总体应当符合二项分布;而c图用于控制缺陷发生数,u图用于控制每个单元的平均发生数,这两种图的总体应当符合泊松分布。

属性控制图的p图

不良品数 的 P 控制图0.35UCL=0.33240.300.250.20比率10.150.100.050.001357911样本13151719_P=0.1685LCL=0.0047使用不相等样本量进行的检验

不良品数的控制图。由于每组抽样样本量不同,造成每组的控制限范围不同。

2.3 过程能力分析

供应商A 的运行图600.5600.0供应商A599.5599.0598.5598.0597.5.060.3440.6564050观测值60707066.330.8100.1908090100关于中位数的游程个数:期望游程个数:关于中位数的游程最大长度:检验聚类性的近似 p 值:混合的近似 P 值:向上或向下的游程个数:期望游程个数:向上或向下的游程最大长度:检验趋势性的近似 p 值:检验振动性的近似 p 值:

用“质量工具”中的“运行图”检验数据独立性。四种p值都应当大于0.05。

供应商A, 供应商B 的概率图正态 - 95% 置信区间99.99995902010510.1变量供应商A供应商B均值标准差NADP599.00.56891000.5490.154600.21.8741000.2870.615百分比595.0597.5600.0数据602.5605.0607.5

进行用“概率图”进行正态检验。对非正态分布数据追查原因。

供应商A 的单值控制图601UCL=600.694600单独值599_X =598.975598LCL=597.256597观测值61718191

用“控制图”检验数据的时序稳定性。

供应商B 的过程能力LSL过程数据LSL目标USL样本均值样本 N标准差(组内)标准差(整体)595*605600.231001.704991.87388USL组内整体潜在(组内)能力基准Z值2.68规格下限 Z 值3.07规格上限 Z 值2.80Cpk0.93整体能力基准Z值规格下限 Z 值规格上限 Z 值PpkCpm2.412.792.550.85*595.5实测性能PPM < LSL0.00PPM > USL0.00PPM 合计0.00预期组内性能PPM < LSL1079.43PPM > USL2573.67PPM 合计3653.10597.0598.5600.0601.5603.0604.5预期整体性能PPM < LSL2627.23PPM > USL5455.68PPM 合计8082.91

用“质量工具”中的“能力分析”分析过程能力,其中包括正态分布的分析和非正态分布的分析。实测性能中没有超过上下限的,但是预测短期和长期有超过上下限的。统计得到超过上下限的Z值和PPM值

供应商B 的过程能力LSL过程数据LSL目标USL样本均值样本 N标准差(组内)标准差(整体)595*605600.231001.704991.87388USL组内整体潜在(组内)能力Cp0.98CPL1.02CPU0.93Cpk0.93整体能力PpPPLPPUPpkCpm0.890.930.850.85*595.5实测性能PPM < LSL0.00PPM > USL0.00PPM 合计0.00预期组内性能PPM < LSL1079.43PPM > USL2573.67PPM 合计3653.10597.0598.5600.0601.5603.0604.5预期整体性能PPM < LSL2627.23PPM > USL5455.68PPM 合计8082.91

也可以得到Cp、Cpk、Pp和Cpk值。

在“选项”中可以选择输出的是Cp值还是Z值。如果没有下限要求,则还可以将下限去掉。

如果目标值不是在上下限的中间,则在“选项”中选择“目标”(Cpm)。

如果有自然限制,则选择“边界”。

对于非正态的数据,某些可以用BOX-COX转换或Johson转换为正态分布。

D3 的过程能力使用 Box-Cox 变换,Lambda = -1USL*过程数据LSL0.06目标*USL0.15样本均值0.100398样本 N500标准差(组内)0.0100122标准差(整体)0.0102148变换后LSL*目标*USL*样本均值*标准差(组内)*标准差(整体)*16.6667*6.6666710.06030.9895180.993301LSL*已变换数据组内整体潜在(组内)能力Cp1.68CPL2.23CPU1.14Cpk1.14整体能力PpPPLPPUPpkCpm1.682.221.141.14*7.5实测性能PPM < LSL0.00PPM > USL0.00PPM 合计0.00预期组内性能PPM > LSL*0.00PPM < USL*302.25PPM 合计302.259.010.512.013.515.016.5预期整体性能PPM > LSL*0.00PPM < USL*317.13PPM 合计317.13

以上是采用Box-Cox变换计算的D3过程能力。

或者用“个体分布标识”先判断其符合什么分布,然后再使用非正态分布进行计算。

D3 的概率图最小极值 - 95% 置信区间99.999050百分比百分比最大极值 - 95% 置信区间拟合优度检验最小极值AD = 15.010

P 值 < 0.010最大极值AD = 0.663

P 值 = 0.087GammaAD = 1.425

P 值 < 0.0053 参数 GammaAD = 0.166

P 值 = *999050100.05D3Gamma - 95% 置信区间0.100.150.010.080.12D33 参数 Gamma - 95% 置信区间99.999990百分比1010.1699.99990百分比501010.1501010.080.10D30.120.140.01D3 - 阈值0.10

D3的分布近似可以用最大极值分布来拟合。

D3 的过程能力基于 最大极值 分布模型的计算LSL过程数据LSL0.06目标*USL0.15样本均值0.100398样本 N500位置0.0955687尺度0.00874207实测性能PPM < LSL0.00PPM > USL0.00PPM 合计0.00USL整体能力Pp1.21PPL1.97PPU0.94Ppk0.94预期整体性能PPM < LSL0.00PPM > USL1974.67PPM 合计1974.670.06250.07500.08750.10000.11250.12500.13750.1500

以上是采用非正态分布计算的D3过程能力。

对于二项分布,minitab中有专门的二项能力分析方法。二项能力分析中没有Cpk值,而是直接给出Z值。

不良品数 的二项过程能力分析P 控制图0.3比率1缺陷率UCL=0.3324_P=0.168530%缺陷0.20.10.01357911样本1315171920LCL=0.0047二项符合程度105075样本数量100使用不相等样本量进行的检验累积 %缺陷21.019.5%缺陷直方图

摘要统计(95.0% 置信)%缺陷:置信区间下限:置信区间上限:目标:PPM 缺陷:置信区间下限:置信区间上限:过程 Z:置信区间下限:置信区间上限:16.8514.9418.900.441890120.96000.88151.0388Tar6.04.5频率18.016.515.0510样本15203.01.50.28%缺陷

从二项过程能力分析中可以看到p图,可以看到缺陷率随着时间的变化等。

2.4 仪器测量分析

在“质量工具”中的“量具研究”中,用“创建量具R&R研究工作表”生成研究记录表,其中包括部件的数量、操作员数和测量次数。一般来说,应当要求三个值乘积大于15。部件应当覆盖公差范围。

测量时,按照表中的“运行序”进行测量。

如果是连续变量,对于不同操作员重复测量同一个部件的,选择“量具R&R研究(交叉)”。

在选项中可以选择公差范围,也可以选择公差上下限的差。变异系数默认为6,而在早期研究中为5.15。

结果 的量具 R&R (方差分析)量具名称:研究日期:

水杯

变异分量100百分比% 贡献% 研究变异% 公差报表人:公差:其他:

结果 × 部件805075070量具 R&R重复再现性部件间110234部件56789这是每个测量员测量每个部件的极差,应当在1控制线范围内样本极差R 控制图(按 操作员)23UCL=2.614所有操作员的测量平均值应当一致80结果 × 操作员210_R=0.8LCL=075701Xbar 控制图(按 操作员)178样本均值23平均75UCL=76.371__X =74.867LCL=73.362要求样本点尽量覆盖公差范围,范围不能78太窄7572110如果是平行线,则不同部件对操作员 操作员 乘 部件 交互作用没有影响操作员1232操作员3722345部件6789

研究变异和公差两个数值应当小于30%,最好小于10%。可区分类别应当不小于5。

结果 的量具 R&R (方差分析)量具名称:研究日期:

水杯

变异分量100百分比% 贡献% 研究变异% 公差报表人:公差:其他:

结果 × 部件805075070量具 R&R重复再现性部件间110234部件56789这是每个测量员测量每个部件的极差,应当在1控制线范围内样本极差R 控制图(按 操作员)23UCL=2.614所有操作员的测量平均值应当一致80结果 × 操作员210_R=0.8LCL=075701Xbar 控制图(按 操作员)178样本均值23平均75UCL=76.371__X =74.867LCL=73.362要求样本点尽量覆盖公差范围,范围不能78太窄7572110如果是平行线,则不同部件对操作员 操作员 乘 部件 交互作用没有影响操作员1232操作员37223

R控制图是同一个测量员测量同一个部件时的极差,反映了同一个测量员的技能,应当受控制,但是又要有至少5个区分度。Xbar控制图反映了同一个测量员测量同一个部件时的平均值,要求尽量落在控制线外面。结果×部件表示了不同部件的测量结果分布,每个部件的分布应当比较小。结果×操作员反映了同一个操作员测量所有部件的分布,应当比较一致。操作员×部件反映了部件对操作员的影响,理想情况是所有部件时平行线,也就是部件对操作员的影响没有明显区别。

45部件6789

对于离散型的变量,对于不同操作员重复测量同一个部件的,选择“属性一致性分析”。

选择检验员、人数、试验数以及主标准。

这是每个检验员自身的一致性,要求超过95%。

每个检验员与标准一致性应当超过80%。对评估不一致的判断,包括三种不一致:将不合格判为合格(?错误);将合格判为不合格(?错误);以及自己几次判断不一致。

检验员之间的一致性应当超过80%。

所有检验员与标准的一致性。

评估一致性研究日期:

报表人:产品名称:其他:

检验员自身100908070百分比百分比95.0% 置信区间百分比检验员与标准.0% 置信区间百分比62检验员312检验员3

更多推荐

数据,样本,部件