试验设计方法

在一些科学研究领域如医学研究、农业研究中,分析问题首先要设计一个实验,进而收集数据、得出结论。其实在其他领域的数据分析也是一样,只是实验的概念有所不同。

我们知道,数据挖掘是在事先没有明确的分析目的的情况下,对数据进行探索,从中找到数据间的未知的潜在关系,为问题的分析提供灵感。而数据分析首先要做的就是明确分析目的,根据这个分析目的收集、整理数据,然后选择相应的分析方法、得出结论,整个过程唯一不变的就是分析目的,其余步骤都有可能反复进行、不断校正。那么实验设计就是衔接整个过程的具体实施方案。

实验设计需要理论与实践相结合,不同的实验设计要采用相应的分析方法,实验设计的好坏直接关系到分析工作能否正确顺利的进行,一定要认真谨慎的对待。实验设计所收集上来的数据,通常使用列联表进行汇总,不同的实验设计,构造出的列联表也有所不同。

首先来介绍一下在实验设计中要使用到的常用术语和定义

1.指标

在各种实验因素或水平作用下产生的结果值,也就是实验中实际得到的值,也可以称为实验过程的因变量,指标可以是定量指标也可以是定性指标,相应的指标值也就为连续型和离散型

2.因素

对实验指标有影响的原因或要素,也可称为实验过程中的自变量。实际上也就是我们要进行分析的内容,我们在选择因素进行分析的时候要抓住主要因素、控制非主要因素。

3.水平

水平就是因素在实验过程中所处的不同状态,可以为数值或字符描述。既然我们主要分析因素对于实验指标的影响,那么根据因素的数量来划分实验设计方法,可以分为单因素实验设计和两因素及以上实验设计:

一、单因素实验设计方法

单因素实验设计主要针对只引入一个影响因素的两个或多个水平,注意这里说引入的意思是影响实验指标的因素通常有很多种,而我们只想分析其中一种,根据经验来讲,这种被分析的因素往往影响力是最强的。

1.完全随机设计方法:

将样本随机分为不同的组,每组接受不同水平的试验。或从不同的总体中随机抽取一定样本接受不同水平的试验。要确保每组样本或每个样本只接受一种水平的处理。

这种试验设计的特点是随机:随机抽样、随机分组、随机配置,每组或每个样本有同等机会接受任意一种水平的处理。

优点是:方法简单易行

缺点是:只分析一个因素,不考虑样本间的差异,这样会增大误差,并且对样本同质性要求较高,比较适合大样本。

随机抽取的每组样本量可以相等也可以不等,但是相等时效率更高,在设计时,应尽量满足每组样本量相等。在多个处理组之间,还涉及两两比较的问题。

2.配对设计

配对样本我们在之前有遇到过,指的是将相同或相近的两个个体接受相同或不同的实验处理,这里要注意两个关键词:

(1)两个个体:必须是两个个体才能称为配对,如果是多个个体就是配伍(下面会讲),配对是配伍的其中一种常见用法。

(2)不同的实验处理:谓不同的试验处理,可以是同一因素的不同水平,也可以是不同因素的同一水平,因此,配对设计既可以是单因素实验设计也可以是多因素实验设计,如果是多因素实验设计,需要考虑交互作用。

注意:我们进行配伍的因素不能是要进行分析的实验因素,并且不能和实验因素存在交互作用。

配对设计可以大致分四种

(1)自身前后配对设计:同一个体在实验前和实验后的指标对比或同一个体分别接受两种水平处理的指标对比,强调的是同一个体。

(2)自身左右配对设计:同一个体的两个局部在实验前和试验后的指标对比或分别接受两种水平处理的指标对比,强调的是同一个体的两个局部,这种设计一般出现在医学研究中,如左右眼、左右肾脏等,在其他分析中很少用到。

(3)异体配对设计:指的是将相近或条件相同的个体组成配对的一组,一个作为实验组接受实验处理,另一个作为对照组不接受实验处理,将二者结果进行对比。

(4)交叉配对设计:一种特殊的配对设计,它通过引入阶段性概念,可以对时间因素在实验设计中的影响分析出来,具体操作方法为:根据事先规定好的试验顺序,随机将一部分样本在第一阶段接受A实验处理,第二阶段接受B实验处理,顺序为AB,再将剩下的样本在第一阶段接受B实验处理,第二阶段接受A实验处理,顺序为BA,两种实验处理在全过程中交叉进行,并且阶段和处理都可以增加。

配对设计的优点是由于个体间差异=0,因此抽样误差很小

缺点是:有时很难将处理前后的非处理因素等条件控制的完全一致,如果是异体配对,对配对要求较高。

3.配伍设计

配伍设计也称为随机区组设计,先将条件相同或相近的样本配成对子,称为配伍组,然后根据随机分配的原则将这些配伍组给予不同的试验处理。

我们可以这样想,将整个实验分成若干个相对独立的单元,每个单元内设置一套完整的实验,这样的单元可以看做是配伍组或区组,区组内的样本各项条件应基本一致,而区组之间则有明显区别。当每个区组内只包含两个个体时,就是配对实验设计。和配对设计一样,配伍设计也可以为单因素或多因素设计,如果是多因素实验设计,需要考虑交互作用。

注意:我们进行配伍的因素不能是要进行分析的实验因素,并且不能和实验因素存在交互作用。

由于进行了分组,误差被分为了两部分:一部分是组内误差,由于组内条件一致,这部分误差可以认为是随机误差。另一部分是组间误差,这部分误差可以从总变异中析出,从而使随机误差更为纯粹。

优点是:排出了非实验因素的干扰,减少了抽样误差,使效能较高

缺点是:由于配伍的条件限制,有时候很难将样本配对成功。

二、两因素及以上实验设计方法

1.拉丁方设计

拉丁方设计主要用来分析3个及3个以上因素对实验结果的影响,但是最常用于3因素分析。具体设计方法是:

把需要分析的因素做为处理因素,用拉丁字母表示,其他两个因素分别用行列表示,由此构成一个数据方阵,故称为拉丁方设计,如下图4其中字母处理因素要求随机

使用拉丁方设计有一些前提条件

(1)各因素之间不能存在交互作用,或交互作用可忽略不计
(2)各因素水平数必须相等
(3)数据不能有缺失值
(4)每种因素水平不可重复

拉丁方设计的优点:

在配伍设计中,我们进行配伍以消除系统误差,但是如果系统误差来自两个方向,那么我们就要设置两个方向的区组来进行消除,拉丁方的行列就是这两个方向的区组,它使得实验进一步区组化和均衡化,能充分显示出处理间的差异,效率更高。而缺点,就是前面讲到的那些前提条件,限制性较高。

2.析因设计

析因设计是将两个或两个以上因素的各种水平进行全面组合的实验设计,它对各种组合都进行实验设计,可以分析:

(1)在其他因素的某个水平条件下,某一因素不同水平间的差别(单独效应)
(2)在其他因素全部水平条件下,某一因素不同水平间的平均差别(主效应)
(3)某因素的各个单独效应随另一因素的不同水平变化而变化,并得出最佳组合(交互作用)

当选用因分析做为实验设计时,要注意几点:

(1)每组水平组合至少做两次独立重复实验
(2)在具体实验时,全部因素是同时施加的,换句话说,实验因素不是分期分批出现在实验过程中的
(3)在进行统计分析时,将全部因素视为对观察指标的影响是同等重要的。

析因设计是一种全面且高效的实验设计方法,但是由于是全面实验,因此分析的因素和水平数不宜过多,否则计算起来非常繁琐,一般以4因素以内为佳。

3.正交设计

析因设计的缺点是实验次数太多,并且其中的有些实验并没有太大意义可以不做,正交设计正是利用正交表,在全面实验中科学的选取具有代表性的水平组合进行实验,是析因设计的部分实施。

正交设计特别适用于因素数量比较多并且每个因素水平又比较少的情况。

正交设计使用的正交表可以分为:

(1)等水平正交表

各因素水平数相等的正交表

L:正交表代号
n:正交表横行数(试验次数)
r:因素水平数
m:正交表纵列数(最多能安排的因子个数)

等水平正交表有如下特点:

<1>表的任一列,不同数字出现的次数相同
<2>表的任意两列的同行数字对出现的次数相同

(2)混合水平正交表

各因素水平不完全相同的正交表

选择正交表的基本原则

<1>先确定实验因素、水平和交互作用,主要因素可多选几个水平,次要因素可少选几个水平
<2>看水平,如果水平都相等,则为等水平正交表,否则为混合水平正交表
<3>每个交互作用在正交表中应占一列或两列
<4>如果实验要求精度高,则宜选取试验次数多的正交表

4.均匀设计

我们知道正交设计特别适用于因素数量比较多并且每个因素水平又比较少的情况,并且正交设计根据正交性挑选试验点,并且遵循两个特点:试验点均匀分散、试验点排列规律整齐,但是当因素数量或水平数较大时,正交设计的实验次数仍然很大,并且为了照顾排列规律整齐,正交设计并不能充分实现均匀分散。

而均匀设计只考虑均匀分散,而不考虑排列整齐,因此均匀设计比正交设计均匀性更好,试验点有更好的代表性,由于不考虑排列整齐,因此可以大大减少实验次数。

均匀设计表符号表示如下:

均匀实验很适合因素水平较多的情况下,因此多用于实验的初步考察阶段(被考察的因素较多,且考察的因素水平较广)

均匀设计的最大缺点就是计算比较复杂,需要使用非线性回归的二次响应曲面回归。

时间: 2024-11-12 13:10:25

试验设计方法的相关文章

黑盒测试用例方法详述(概念、场合、步骤、要点出发)

黑盒测试用例方法详述 测试用例概述 1)测试用例是将测试行为进行量化,使得软件测试是有组织性.步骤性.计划.(案例)主要记录:测试目的.测试对象.前置条件.测试步骤.方法.数据.预期结果的文档,由测试人员在执行测试之前编写的 2) 测试用例就是设计一个情况,软件程序在这种情况下,必须能够正常运行并且达到程序所设计的执行结果.如果程序在这种情况下不能正常运行,而且这种问题会重复发生,那就表示软件程序人员已经测出软件有缺陷,这时候就必须将这个问题标示出来,并且输入到问题跟踪系统内,通知软件开发人员.

黑.白盒测试

1.黑盒测试:不关心被测软件的内部结构,只关心软件的输入数据和输出结果 测试方法:等价类划分法,边界值,决策表,因果图,场景法,错误推测法..... 1. 等价类划分法:等价类划分就是解决如何选择适当的数据子集来代表整个数据集的问题,通过降低测试的 数目去实现"合理的"覆盖,覆盖了更多的可能数据,以发现更多的软件缺陷. 等价类测试的分类 基于覆盖程度: 弱组合形式:测试用例仅需满足对有效等价类的完全覆盖, 强组合形式:测试用例不仅满足对有效等价类的完全覆盖,而且应覆盖所有的等价类组合.

软件测试(六):黑盒测试

1.常见黑盒测试用例设计方法 等价类划分法.边界值分析法.因果图法.状态迁移法.判定表法.流程分析法.正交试验法.错误猜测法.输入/输出域测试法.异常分析法. 2.等价类划分法 概念:某个输入域的集合,在这个集合中每个输入条件都是等效的.  原则: A.规定了取值范围或值的个数,则可确定一个有效等价类和两个无效等价类 B.规定了输入值的集合,或是规定了必须如何的条件,则可确定一个有效等价类和一个无效等价类 C.布尔量,则可确定一个有效等价类和一个无效等价类 D.输入数据的一组值假定N个,并且程序

正交试验法

正交试验法介绍: >>测试人员希望测试充分(即测试用例代表性强),又要求用例数量不可过大,究竟该如何设计测试用例则显得尤为关键. >>正交试验法即使用事先已创建好的表格--正交表,来安排试验并进行数据分析的一种科学试验设计方法,该法简单易行.应用甚广 借助正交表可从大量的试验数据(测试用例)中筛选出适量的.有代表性的值,从而协助合理地安排试验(测试),满足了"在简化用 例的同时尽量充分开展测试"的需求. 正交试验表: >>正交试验法的介绍较抽象,就是

浅谈黑盒测试和白盒测试

1. 黑盒测试和白盒测试的直观图 从图中可以直接看出来,黑盒测试就当整个程序是个黑盒子,我们看不到它里面做了些什么事情,只能通过输入输出看是否能得到我们所需的来测试.而白盒测试可以当盒子是透明的,里面的一切我们都看的清楚,从而我们可以通过去测内部结构来测试. 2. 黑盒测试 (Black-Box Testing) 黑盒测试又称为功能测试.数据驱动测试或基于规格说明书的测试,是一种从用户观点出发的测试.测试人员一般把被测程序当作一个黑盒子. 黑盒测试主要测到的错误类型有:不正确或遗漏的功能:接口.

显著性检验

什么是显著性检验 显著性检验就是事先对总体(随机变量)的参数或总体分布形式做出一个假设,然后利用样本信息来判断这个假设(原假设)是否合理,即判断总体的真实情况与原假设是否显著地有差异.或者说,显著性检验要判断样本与我们对总体所做的假设之间的差异是纯属机会变异,还是由我们所做的假设与总体真实情况之间不一致所引起的. 显著性检验是针对我们对总体所做的假设做检验,其原理就是“小概率事件实际不可能性原理”来接受或否定假设. 抽样实验会产生抽样误差,对实验资料进行比较分析时,不能仅凭两个结果(平均数或率)

干货-测试工程师必备武器

如何进行用例设计,如何让设计好的用例覆盖全面,将代码存在的问题在上线前更早发现是每一个测试工程师必备的技能.那么如何达到这些指标呢?如何将用例设计既快又全面呢?今天小编就告诉大家常用设计用例的方法,以及每个方法的适用范围,便于大家更快的选择出最优的方法. 从需求到用例设计 在项目中我们从拿到产品需求到最后的用例设计完成,都要经历哪些事情,包括今天要讲的用例设计方法是在哪个阶段使用,下面的图会告诉你答案. 设计用例方法 1.等价类 定义:把所有可能的输入数据,即程序的输入域划分成若干部分(子集),

黑盒测试,白盒测试,测试用例设计

1. 黑盒测试和白盒测试的直观图 从图中可以直接看出来,黑盒测试就当整个程序是个黑盒子,我们看不到它里面做了些什么事情,只能通过输入输出看是否能得到我们所需的来测试.而白盒测试可以当盒子是透明的,里面的一切我们都看的清楚,从而我们可以通过去测内部结构来测试. 2. 黑盒测试 (Black-Box Testing) 黑盒测试又称为功能测试.数据驱动测试或基于规格说明书的测试,是一种从用户观点出发的测试.测试人员一般把被测程序当作一个黑盒子. 黑盒测试主要测到的错误类型有:不正确或遗漏的功能:接口.

测试基础2

15.软件测试应该划分几个阶段?简述各个阶段应重点测试的点?各个阶段的含义? 大体上来说可分为单元测试,集成测试,系统测试,验收测试,每个阶段又分为以下五个步骤: 测试计划,测试设计,用例设计,执行结果,测试报告初始测试集中在每个模块上,保证源代码的正确性,该阶段成为单元测试,主要用白盒测试方法. 接下来是模块集成和集成以便组成完整的软件包.集成测试集中在证实和程序构成问题上.主要采用黑盒测试方法,辅之以白盒测试方法.软件集成后,需要完成确认和系统测试.确认测试提供软件满足所有功能.性能需求的最