高宁华, 徐英恺, 曹子暄, 吴伟志, 杨淑云
多尺度信息表是一类特殊的具有分层递阶的数据集,这类数据集研究的一个重要问题是根据最终决策保持某种性质的最优尺度组合的选择.文章通过利用香农熵,研究在广义多尺度决策表中保证在“互信息量满足需求的前提下,互信息率最大”的最优尺度组合选择问题.首先,介绍信息表中的熵和互信息量的概念及其性质,综合考虑“提供足够多的信息”与“降低对运算和存储的需求”这两个因素,定义互信息率,并通过研究互信息率的性质说明定义的合理性.其次,通过引入参数给出广义多尺度决策表中基于互信息率的最优尺度组合概念,使决策者可以通过调整参数满足自己的偏好,并给出计算最优尺度组合的算法.最后,通过与最新的研究方法比较,说明文章提出新方法的有效性,并且,此方法无需判断决策表的协调性,都可以找到它基于互信息率的最优尺度组合.