minitab计算变异系数,minitab怎么算数据的相关系数

首页 > 机动车 > 作者:YD1662023-11-01 03:46:31

minitab计算变异系数,minitab怎么算数据的相关系数(1)

泰莱 (Tate & Lyle) 是食品和饮料行业的全球领导者,通过将玉米、木薯和其他原材料转化为能为食物增添味道、质地和营养成分的“让食物与众不同”的悠久而令人印象深刻的记录证明了这一点。他们在美国最知名的产品之一是甜味剂 SPLENDA三氯蔗糖。

当他们在精炼玉米糖的过程中遇到挑战时,Tate & Lyle 转向 Minitab 软件寻求帮助。

minitab计算变异系数,minitab怎么算数据的相关系数(2)

挑战:平衡结晶粒径

当 Adam Russell 开始在 Tate & Lyle 担任全球运营黑带大师时,他遇到了一个挑战:保持玉米糖的颗粒大小相同。

“一个结晶过程的质量特征的关键之一是粒度分布,”Russell 说。“为什么这很重要?好吧,当我们在 20-30 年前为消费者开发这些产品时,他们希望玉米糖具有与普通食糖或蔗糖相同的味道和质地。你必须达到一定的粒度那种情况下的分布是真实的。”

Tate & Lyle 正面临着那些落在可接受范围之外的颗粒的困扰,他们无法确定原因。该公司列出了他们确定的影响粒径变化的传统因素:

●温度

●压力

●流量

●酸碱度

●电导率

而这样的例子不胜枚举。

Minitab 如何提供帮助

minitab计算变异系数,minitab怎么算数据的相关系数(3)

Minitab(现为 Minitab Engage ? )在 Companion 中创建的流程图 Tate & Lyle 的简化版本。在玉米糖结晶过程中,糖浆从炼油厂进料,然后结晶(需要很多天),然后离心、干燥并装入袋中供客户使用。

他们首先使用 Minitab 的 Companion (现为 Minitab Engage? )创建一个流程图,该流程图显示了结晶过程的高级视图(了解有关流程图的更多信息)。他们无法可靠地达到严格的粒度分布,因此他们想了解导致变化的原因以及如何控制它。

“一切都在化工厂进行测量,”Russell 说,“每个可能的点都有一个发射器,可以将信息反馈给数据历史学家。这是一件好事,但它带来了挑战,因为我们有太多我不知道的信息怎么办呢。”

为了直观地了解粒度数据,Russell 和他的团队随后使用 Minitab Statistical Software 创建了 如下所示的Xbar 图 。

尽管变量之间的许多关系是非线性的,因此很难确定任何一个变量对另一个变量的影响。此外,在将其放入袋中供消费者使用之前,颗粒大小是未知的,因为它处于干燥阶段,呈介于液体和固体之间的凝胶状形式,称为“浆液”。

像这样的模型有超过 1,000 个可能的输入。单靠多元回归模型无法得出答案。

minitab计算变异系数,minitab怎么算数据的相关系数(4)

关键过程指标是成品的变异系数 (CV),此处显示在使用 Minitab Statistical Software 创建的 Xbar 图表中。

由于众多预测因素以无限复杂的方式相互作用,他们需要一种有组织的方法来确定哪些预测因素对粒度分布的影响最大。他们需要 Salford Predictive Modeler (SPM) 中的 TreeNet。

“仅仅使用传统的建模技术,这很难,”拉塞尔说。“我们很难理解变量和结果之间的关系。幸运的是,SPM 的 TreeNet 使我们能够非常简单地研究关键预测变量,并能够制定能够有效处理这些变量的策略。我相信 Minitab 和 SPM 的 TreeNet 算法可以非常有效地协同工作。SPM 当然不能替代 Minitab 或其他统计程序,但当我们一起使用它们时,我认为我们迟早会找到答案。”

Russell 使用了 TreeNet 中的默认设置,并调整了树的数量。当他开始剔除预测变量时,他开始了解它对测试 R 平方值的影响。

minitab计算变异系数,minitab怎么算数据的相关系数(5)

这个用于粒度控制的模型只有 8 个预测变量,但解释了测试样本中大约一半的变化。

为了找到这些关键变量背后的真正含义,Russell 使用了 SPM 的部分依赖图。某些变量落在部分依赖曲线的陡峭位置,这揭示了它们的重要性。如果没有 SPM 部分依赖曲线,就永远不会发现这些变量的重要性。

然后他使用了一种直接的、循序渐进的方法。他一次一个地取出变量,观察 R 平方发生了什么。直到他拿出第四个最重要的变量,它才发生显着变化。他将这个变量带到了制造团队,并要求提供更多相关信息。

结果

Russell 使用 SPM 的可变重要性排名迅速将 1,000 多个预测变量缩小到仅 8 个。仅这 8 个预测变量就造成了测试样本中近一半的变异。

使用 SPM 的“从顶部剃须”功能,Russell 可以很快看到一个变量对 R 平方的影响明显大于其他任何变量。事实证明,这是与结晶系统的进料流相关的变量,但直到 Russell 创建 SPM 模型后才清楚地了解它对最终产品的影响。

然后,通过 SPM 的部分相关图,Russell 可以看出为什么这个变量在粒径的不可靠性方面如此重要。SPM 的部分依赖图显示了该变量可能如何随着它们“在分布曲线上运行”位置的变化而变化。

“我们正处于这条分布曲线的陡峭部分,”拉塞尔说。“在幸运的日子里,变异系数会很低,但在不幸的日子里,变异系数会很高。没有 SPM,我永远不会知道这一点。”

Russell 对自己的目标已经实现感到满意,他找到了几种方法可以减少玉米糖晶体最终尺寸的变化,并帮助食品制造商使用这些成分为消费者改进产品。

*此案例研究是在 2021 年 Minitab Engage 简介之前使用 Minitab 的 Companion 创建的。

栏目热文

文档排行

本站推荐

Copyright © 2018 - 2021 www.yd166.com., All Rights Reserved.