What are the characteristics of finite Markov decision processes?
- 内容介绍
- 文章标签
- 相关推荐
本文共计94个文字,预计阅读时间需要1分钟。
马尔可夫过程是一种无记忆的随机过程,即随机状态序列 \(S_1, S_2, \ldots\) 的转移概率仅依赖于当前状态,而与过去状态无关。例如,一个包含 \(M\) 个有限状态的马尔可夫决策过程 \(M\)。
本文共计94个文字,预计阅读时间需要1分钟。
马尔可夫过程是一种无记忆的随机过程,即随机状态序列 \(S_1, S_2, \ldots\) 的转移概率仅依赖于当前状态,而与过去状态无关。例如,一个包含 \(M\) 个有限状态的马尔可夫决策过程 \(M\)。

