Near-Optimal Policy Identification in Robust Constrained Markov Decision Processes via Epigraph Form

Source

arxiv.orgfull article ↗

Publisher summary· verbatim

arXiv:2408.16286v5 Announce Type: replace Abstract: Designing a safe policy for uncertain environments is crucial in real-world control systems. However, this challenge remains inadequately addressed within the Markov decision process (MDP) framework. This paper presents the first algorithm guarante

Discussion

No replies yet. Be first.

Near-Optimal Policy Identification in Robust Constrained Markov Decision Processes via Epigraph Form

Related coverage

Near-Optimal Policy Identification in Robust Constrained Markov Decision Processes via Epigraph Form

Related coverage