【动态规划与马尔柯夫过程】上海科学技术.pdf

动态规划与马尔柯夫过程 [美]R.A.霍华特著 李为政 徐映波賴炎連 桂湘云校
引言 系統工程师和运筹学工作者經常要对一些运行系統进行模型 設計。这些系通常同时包含着概率的和决策的两种性质,因此,我們可以预料,所得到的模型是十分复杂,在分析上是难于处理的.对于已經提出来的大多数的模型,情况的确是这样。R.具尔曼“ 提出的动态规划的想法給复杂系的分析提供了希望,然而,由于 在实际上往往有許多問题虽然可以用这个技巧来關述,但是不能 求解,因此,这种希望也就减少了。看来是很合理的一些方法往往 本书的意图是对一类决策系給出一个分析結构,一般来,这种結构是足以描逃系統而同时叉有計算可能的。
目录策略改进程序.一个多键的例子 迭代循环的性质 第七章具有折扣的序實决策过程 用值迭代法解有折扣的序買决策过程 定值运算.策略改进程序 迭代循环性质的明.最优策略对于折扣因子的敏感性 具有折扣的汽車替换問題 总結 