邓述慧
自从五十年代 Robbins-Monro 提出随机逼近算法以来,不仅离散时间量测,而且连续时间量测的算法也引起人们很大的关注。对连续时间的量测误差也从最简单的独立增量过程研究到相关增量及其他一般的过程。 近年来对离散时间的量测的算法出现了一些新的想法。文献[5]中提出了随机变界截尾算法,去掉了对算法事先要求有界的条件。研究了两步算法,去掉了对某一 Liapunov 函数存在性的要求。[8]进一步把[5]和[6]的方法结合起来,在较弱的条件下求解了优化问题。本文把这些思想结合起来用到连续时间量测,给出一个连续时间的二步算法,用随机变界截尾的方法,既不事先假定算法有界,也不额外假定某一 Liapunov 函数的存在性,在较弱条件下证明了算法向函数的极值几乎处处收敛。本文还以组合债券问题为例,说明在实际中确实出现连续量测下求极值的问题。我们对组合债券这一实例给出了数学模型。它正好可以用本文给出的理论方法解决。