在搜索混料模型$D$-最优设计的计算机算法领域, 主流算法包 括经典的Fedorov算法, 以及元启发类算法, 但两者在一些特定的优化问 题上, 分别在收敛速度和收敛精度方面有进一步提升的空间. 文章分别探讨了可能造成这种情况的两类算法各自的局限性, 并采取优势互补的策略, 构建了交换点式门限接受算法, 即ETA (exchange threshold accepting)算法. 以含倒数项混料模型为例, 文章验证了ETA算法生成设计的$D$-最优性, 并分别与Fedorov算法和元启发类的ProjPSO算法作比较. 结果表明, 至少在某些特殊的混料模型$D$-最优设计的搜索方面, ETA算法在收敛速度和精度方面均具有一定的优势.
基于模型对称分解的对称全局敏感性分析在 高维复杂模型的推断中起着重要作用. Wang和Chen (2017)提出 了一种对称设计来获得对称灵敏度指标的估计, 此设计具有 较高的抽样效率且不需要得到对称分解项的解析表达. 然 而, 给定试验次数, 对称设计的生成具有较强的随机性, 导致某些设计的空间填充性较差且在低维投影上出现塌陷. 文章提出了一种对称拉丁超立方体, 使对称设计同时具有拉丁超立方体结构, 从而在保持设计对称性的基础上最大化一维投影的均匀性. 通过剖析设计的结构得到了对称拉丁超立方体的构造方法. 同时, 进一步提出最优化算法, 得到具有最优中心化$L_2$ 偏差的对称拉丁超立方体设计. 通过一个构造算例, 验证了所得设计的优良性.
当研究目标的实际测量具有不可修复的破坏性或耗资巨大时, 有效 的抽样设计将是一项重要的研究课题. 在统计推断方面, 排序集抽样~(RSS)~被视为一种比简单随机抽样~(SRS)~更为有效的收集数据 的方式. 动态极值~RSS~(MERSS)~是一种修正的~RSS. 文章在~SRS~和~MERSS~下研 究了~Logistic~分布中参数的极大似然估计~(MLEs). 在这两种抽样下证明了该分布中位置参数和刻度参数的~MLEs~的存在性和唯一性, 并计算了所含参数的~Fisher~信息量和~Fisher~信息矩阵. 比较了这两种抽样下对应估计的渐近效率. 数值结果表明~MERSS~下的~MLEs~一致优于~SRS~下的~MLEs.
纯净效应准则是选择最优设计的一个重要准则, 实际中往往部分二阶交互效应是可忽略的, 此时对主效应的估计, 可以允许主效应与可忽略二阶交互效应混杂. 文章首先回顾了部分纯净主效应设计的相关理论、进展、以及二水平情形下的结果. 然后以三水平为例,给出了高水平下部分纯净主效应设计的若干结果. 相比二水平情形, 其存在更多类的高水平部分纯净主效应设计. 最后通过随机模拟比较, 验证了三水平部分纯净主效应设计在估计参数上的优势.
计算机仿真模型广泛应用于工业工程等领域, 借助真实的物理观测对计算机模型的校准参数进行估计, 可以提高计算机模型的仿真精度. 已有文献 指出, 当物理试验的试验点独立同分布于均匀分布时, 计算机模型校准参 数的$L_2$估计半参数有效. 然而真实的物理试验点往往不满足独立同分布于 均匀分布这一条件, 文章证明了在固定的试验点下, 较准参数$L_2$估计的相合性和渐近正态性, 并通过数值模拟验证了$L_2$估计的收敛速度.
混料试验设计在众多领域中都有广泛的应用, 有时试 验者不仅仅需要考虑各混料成分所占比例对响应变量的影响, 同时 还关心其它被称为过程变量的因素. 在实际中, 对于这类问题通常 使用的设计方案是混料设计和因子设计的组合设计. 这种组合设计在 过程变量的不同水平组合下, 使用的是相同的设计阵, 因此空间填充 性较差. 基于混料球体堆积设计, 文章提出了一类新的混料设计, 称之为混料切片设计, 它的整体设计和所有子设计(过程变量的每一水平组合对应的混料设计)都具有很好的空间填充性, 从而比组合设计有更好的模型稳健性. 基于同余子群的陪集分解方法, 针对过程变量水平组合数的不同情况提出了相应的简单快速的构造算法, 文章最后的数值例子解释了算法的可行性和设计的有效性.
目前的试验设计大体在连续空间或者无约束的离散空间下进行研究,但实际工程中不少场 景都需要在离散空间中挑选试验点来进行试验设计,通常的试验设计方法无法应用于约束的离散空间中.文章 立足于实际工程背景,基于连续空间下的均匀试验设计,采用Gale-Shapley 算法,给出了连续空间到离散空间的映射设计方案.最后,结合实例进行了Gale-Shapley算法与经验方 法所得设计的对比验证研究,在约束的离散空间下, Gale-Shapley 算法所得到的映射设计具有更好的均匀性,且计算效率满足工程实际需求.
过程能力分析在工业生产上是衡量生产能力以及保障 产品质量的一个重要问题. 与其他指标相比, 过程无能 力指数 $C_{pp}$ 不仅能直接反映过程的不可靠性, 而且能提供更多关于过程不精确性的相关信息. 因此, 它可以帮助供应商改进不良过程来提高质量性能. 在采样的数据通常是来自于不平衡单因素随机效应模型时, 文章利用近似广义推断、 Fiducial 推断和参数自助法分别给出了 $C_{pp}$ 的区间估计, 并对3种区间估计的性能进行了模拟比较. 模拟结果表明 Fiducial 区间估计优于近似广义推断和参数自助法, 特别是在数据不平衡时.
空间填充设计在计算机试验中应用十分广泛, 当拟 合回归模型时, 正交的空间填充设计保证了因子效应估计的独立性. 基于广义正 交设计, 文章给出了构造二阶正交拉丁超立方体设计和列正交设计的方法, 新构造的设计不仅满足任意两列之间相互正交, 还能保证每一列与任一列元素平方组成的列以及任两列元素相乘组成的列都正交. 当某些正交的空间填充设计不存在时, 具有较小相关系数的近似正交设计可作为替代设计使用. 设计构造的灵活性为计算机试验在实践中的广泛应用提供了必要的支持.
在许多工业应用中, 通常分步应用跟随设计来考察输入(因子)和产 出(响应)间的关系. 在许多跟随设计中, 在跟随阶段可以加入一些另外的两 水平或三水平因子, 因为它们在初始阶段可能被忽略但又十分重要. 文章在均匀性准则下, 提出了中心化$L_2$-偏差意义下的混水平列扩充均匀设计, 给出了列扩充设计在中心化$L_2$-偏差下的解析表达式及相应的下界, 其可作为搜索均匀设计的基准. 进一步, 具有一个附加区组因子的列扩充设计是均匀的当且仅当未加区组因子时的列扩充设计是均匀的.
当研究目标的实际测量具有不可修复的破坏性或耗资巨大时, 有效的抽样设计将是一项重要的研究课题. 在统计推断方面, 排序集抽样~(RSS)~被视为一种比简单随机抽样~(SRS)~更为有效的收集数据的方式. 文章分别在~SRS~ 和~RSS~下研究了~Power-law~分布中参数的极大似然估计~(MLE), 修正~MLE, 修正无偏估计和修正最优线性无偏估计~(BLUE). 进一步针对该分布, 文章找到了基于次序统计量~Fisher~信息量最大化的~RSS, 并在这种~RSS~下研究了上述估计. 模拟结果显示~RSS~下的对应估计一致优于~SRS~下的对应估计.
II 期临床试验的主要目的是对药物治疗的安全性 和有效性进行评估. 针对具有高安全性的~II 期两阶段临床试验, 给出小样本量下关于安全性和有效性的精确检验方法, 并证明最 大~I 类错误概率与~II 类错误概率分别在原假设和备择假设的边界处达到. 在期望样本量最小原则下,给出最优两阶段设计的构造方法和 常用设计表, 供实际应用选用.
逐步区间删失是获取高可靠性产品相 关信息的一种重要方法. 文章研究了产品寿命服从Weibull分布, 带有随机移除逐步区间删失寿命试验的最优设计问题. 采用极大似然方法获取模型参数的估计及其信息矩阵. 利用 Bayesian 方法处理模型参数未知情况下设计准则对模型参数的依赖问题, 获得了模型参数估计的 Bayesian 稳健设计准则. 在考虑试验费用有限制的条件下, 给出了获得最优稳健设计非线性混合整数算法. 同时对先验选取及约束参数设定的敏感性做了分析. 数值结果表明文章提出的方法是有效可行的.
感度试验在爆炸科学领域有非常广泛的应用, 其中位数 是含能材料的一个关键性能指标. 高效估计感度分布中位数是实际工程应用中 的重要问题. 文章提出一种两阶段的优化序贯试验设计方法来估计感度分布 的中位数, 并将正交设计与两阶段优化序贯试验设计方法相结 合给出了筛选影响含能材料安定性重要因子的试验设计方法. 广泛的模拟比较验证了所提方法在小样本情况下可以获得感度分布中位数的准确估计, 并且对模型假设和初始参数猜测具有一定的稳健性. 当因子效应不是太小的时候, 因子筛选方法可以准确地筛选出有显著影响的因子.
在混料试验中, 当混料模型较为复杂且混料成份较多时, 要 验证一个设计$\xi$的最优性是比较困难的. 一方面, 当模型或约束较为复杂时难以证明方差函数是否满足最优性准 则条件, 另一方面, 当混料成份多于3时不能通过绘制方差函数的曲面图来观 察最优性.文章提出一种可用于验证混料对称设计的最优性的图检验法 , 通过 实例分析, 这种方法是有效的.
空间填充设计是有效的计算机试验设计, 比如均匀 设计、 最大最小距离拉丁超立方体设计等. 虽然这些设计在整个试验空间中有较好的均匀性, 但其 低维投影均匀性可能并不理想. 对于因子是定量的计算机试验, 已有文献构造了诸如最大投影 设计、均匀投影设计 等相适应的设计; 而对于同时含 有定性因子和定量因子的计算机试验, 尚未有投影均匀设计的相关文献. 文章提出了综合投影均匀准则, 利用门限接受算法构造了投影均匀的分片拉丁超立方体设计. 在新构造设计中, 整体设计与每一片设计均具有良好的投影均匀性. 模拟结果显示, 与随机分片拉丁超立方体设计相比, 利用新构造设计进行试验而拟合的高斯过程模型具有更小的均方根预测误差.
当研究目标的实际测量具有不可修复的破坏性或耗 资巨大时, 有效的抽样设计将是一项重要的研究课题. 在统计推断方面, 排序集抽样被视为一种更为有效的收集数据的方式. 极值排序集 抽样(ERSS)~是一种改进的排序集抽样. 文章在~ERSS~下研究了总 体均值的比率估计. 以正态分布为例, 比较了简单随机抽样和~ERSS~下比率估计的相对效率. 数值结果表明~ERSS~下的比率估计优于简单随机抽样下的比率估计.
在统计学与机器学习中, 交叉验证被广泛应用于 评估模型的好坏. 但交叉验证法的表现一般不稳定, 因此评 估时通常需要进行多次交叉验证并通过求均值以提高交叉验证 算法的稳定性. 文章提出了一种基于空间填充准则改进的$ k $ 折交叉验证方法, 它的思想是每一次划分的训练集和测试集均具有较好的均匀性. 模拟结果表明, 文章所提方法在五种分类模型($ k $近邻,决策树,随机森林,支持向量机和 Adaboost)上对预测精度的估计均比普通$ k $折交叉验证的高. 将所提方法应用于骨质疏松实际数据分析中, 根据对预测精度的估计选择了最优的模型进行骨质疏松患者的分类预测.