在实际的质量改进、产品研发、工艺优化、六西格玛和科学研究工作中,我们经常需要通过建立定量的模型来研究输入因素和输出因素之间、或者自变量和响应变量之间的关系,例如研究太阳能电池板的光电特性和其光电转换率之间的关系,化学材料的成分和加工工艺对其化学特性如溶解度、抗氧化性的影响等等。研究这类问题最好的方法就是我们特意地改变输入因素或者自变量,然后观察输出因素或者响应变量发生了怎样的变化,而如果对输入因素或自变量的改变是根据一个事先设计的科学方案(而不是盲目操作或仅凭经验)来积极地进行的,那将是帮助我们获得和理解有用信息的最好方法。
然而,在大多数实际问题中都存在两个或以上个输入因素或自变量,那种一次只改变一个变量的试验方案本质上是没有任何用处的。为了用合适的方法揭示多个输入因素或自变量是如何共同对输出因素或响应变量产生影响的,我们就需要使用试验设计方法(DOE: Design Of Experiments)。试验设计方法就是以合适的方案来科学地规划试验,在尽可能节省试验成本的情况下获得关于输入变量如何影响输出变量的尽量多的信息。它通常包括试验方案设计和试验结果分析两个部分。
下面,我们以SAS公司的JMP软件为例,简单介绍一下试验设计方法及其关键工具。JMP软件的试验设计平台堪称目前最先进、最全面、最灵活的试验设计方案,它集成了下述所有试验设计方法。关于JMP的具体情况可以参考JMP官方网站: www.jmp.com/china,这里不再赘述。
试验设计方法群中有多种经典试验设计方法,但同时也具备多种创新的试验设计方法,最重要的是需要在不浪费宝贵资源的情况下,能按照特定的实际问题定制试验设计方案。一旦试验和数据采集工作得以完成,工程技术人员需要能够非常便利地开展数据分析和建模工作,了解响应变量的模式、锁定活跃的关键因子并对响应变量进行优化,进而预测优化的效果和稳健性。
经典试验设计(Classical Design)
Ronald Fisher最早提出了试验设计的四个基本原则:阶乘原则、随机化、重复试验和划分区组。但直到不久以前,生成和分析一个试验并拓展这些原则的应用主要还依赖手工计算。尽管如此,实践者80多年的智慧结晶已经创造了一系列广泛使用的试验设计方法,它们可以满足特定的试验条件和试验目标的要求。这些经典的试验设计方法主要包括完全因子设计、筛选设计、响应表面设计、混料设计和田口设计等。如果决定选用经典试验设计方法,各种试验评估工具(例如预测方差刻画器和FDS图等)也是不可缺少的,它们可以帮助在开始消耗试验资源之前对所选择的试验方案进行评估。
定制试验设计(Custom Design)
举个简单的例子,当有两个因子的时候,完全因子试验设计会在一个正方形区域内安排试验点,但有的时候我们可能已经知道需要探索的区域并不是正方形的。这种情况下,如果工程技术人员仍然需要使用完全因子试验设计,就必须让实际问题向这种方法本身做出妥协,必要时需要对实际问题做一定的修正。定制试验设计(Custom Design)可以说是JMP软件的独创,在这种设计中类似的妥协不存在,它可以根据实际问题的需要创新地构建出合适的试验设计方案,这样就能最有效地利用试验资源。这种方法可以在统一的试验设计框架中应付各种各样的试验挑战:可以在同一个试验中既包含过程变量、又包含混料因子;可以用“难改变”或“极难改变”的因子来应付随机性受到限制的情形;可以定义只在“如果可能”的情况下才能被估计的模型变量;可以进行样本量计算,以确保在试验上的投资是有值得的。
其他试验设计(Other Design)
即使响应变量没有固有变异性,试验设计方法仍然能够帮助技术人员高效地探索高维因子空间,JMP中的空间填充设计(Space-Filling Design)就是其中的一种方法,这种方法一般用高斯过程平滑器(Gaussian Process smoother)进行分析,以获得一个具备较低的预测偏倚和方差的替代模型。
选择设计(Choice Design)是另外的一种试验设计方法,这种方法被广泛地用于消费者偏好研究;在选择设计中,消费者将被问及他们对可选商品的偏好情况,而且如果需要的话,价格也可以作为其中的因子之一。选择设计能构建科学的向消费者提问的方案,以使得消费者能够真实、准确地反映他们的心声(偏好情况),这对于指导企业开发出受市场欢迎您的产品非常重要。
加速寿命试验(Accelerated Life Tests)是可靠性(Reliability)研究中非常有效、也十分常用的一种方法。它可以帮助合理地安排试验,以获得关于产品可靠性的关键信息,可以对失效和保修风险进行预测。
优化和模拟(Optimization an d Simulation)
试验方案的设计虽然至关重要,但还只是试验设计工作的一半。
不论使用何种试验设计方法,在获得实际的试验结果后,我们都需要对试验结果进行分析,以建立输入因素(或自变量)和输出因素(或响应变量)之间的关系模型——有时输出因素(或响应变量)可能不止一个,这种情况下可以通过设定的停止规则用逐步求精法拟合不同的模型。建立好有用的模型后,就需要利用这个模型来对输出因素(或响应变量)进行优化,以确立可行的操作模式和因子水平。这时要用到的工具包括多种刻画器(Profiler)工具以及其他相关的多种数据可视化工具等。以JMP软件的优化器为例,不论是简单还是复杂的问题,JMP内置的优化器(Optimizer)都可以在多个响应变量之间进行不可避免的权衡以寻找最优的方案。
分析到这里还没有结束,通过试验设计方法分析得到的最优方案是否在现实的执行环境中可行呢?或者它在具体实施的时候稳健性如何呢?这是两个非常重要的问题,因为方案的试验性实施往往会伴随不少的资源投入,如果失败就可能造成很多资源浪费。要解决这两个问题就需要使用另外一种方法:模拟(Simulation)。这种方法可以考察和预测获得的方案在实施时候的稳健性,以及预测其实际的实施效果——原则上,不论方案是否已经“最优”,都能借助模拟(如JMP的模拟器)方法对其稳健性和实施效果进行模拟和预测。