
What are the characteristics of finite Markov decision processes?
本文共计94个文字,预计阅读时间需要1分钟。马尔可夫过程是一种无记忆的随机过程,即随机状态序列 (S_1, S_2, ldots) 的转移概率仅依赖于当前状态,而与过去状态无关。例如,一个包含 (M) 个有限状态的马尔可夫决策过程 (M)。
共收录篇相关文章

本文共计94个文字,预计阅读时间需要1分钟。马尔可夫过程是一种无记忆的随机过程,即随机状态序列 (S_1, S_2, ldots) 的转移概率仅依赖于当前状态,而与过去状态无关。例如,一个包含 (M) 个有限状态的马尔可夫决策过程 (M)。