Solutions of the average cost optimality equation for finite Markov decision chains: risk-sensitive and risk-neutral criteria

Cavazos-Cadena, Rolando

doi:10.1007/s00186-008-0277-y

Solutions of the average cost optimality equation for finite Markov decision chains: risk-sensitive and risk-neutral criteria

Original Article
Published: 23 December 2008

Volume 70, pages 541–566, (2009)
Cite this article

Download PDF

Access provided by CONRICYT-eBooks

Mathematical Methods of Operations Research Aims and scope Submit manuscript

Solutions of the average cost optimality equation for finite Markov decision chains: risk-sensitive and risk-neutral criteria

Download PDF

Rolando Cavazos-Cadena¹

115 Accesses
15 Citations
Explore all metrics

Abstract

This work is concerned with controlled Markov chains with finite state and action spaces. It is assumed that the decision maker has an arbitrary but constant risk sensitivity coefficient, and that the performance of a control policy is measured by the long-run average cost criterion. Within this framework, the existence of solutions of the corresponding risk-sensitive optimality equation for arbitrary cost function is characterized in terms of communication properties of the transition law.

Article PDF

Controlled Semi-Markov Chains with Risk-Sensitive Average Cost Criterion

Article 11 March 2016

Contractive Approximations in Risk-Sensitive Average Semi-Markov Decision Chains on a Finite State Space

Article 22 November 2021

A Discounted Approach in Communicating Average Markov Decision Chains Under Risk-Aversion

Article 07 October 2020

Use our pre-submission checklist

Avoid common mistakes on your manuscript.

References

Arapstathis A, Borkar VK, Fernández-Gaucherand E, Gosh MK, Marcus SI (1993) Discrete-time controlled Markov processes with average cost criteria: a survey. SIAM J Control Optim 31: 282–334
Article MathSciNet Google Scholar
Cavazos-Cadena R (2003) Solution to the risk-sesnitive average cost optimality equation in a class of markov decision processes with finite state space. Math Methods Oper Res 57: 263–285
Article MATH MathSciNet Google Scholar
Cavazos-Cadena R, Fernández-Gaucherand E (1999) Controlled Markov chains with risk-sensitive criteria: average cost, optimality equations and optimal solutions. Math Methods Oper Res 43: 121–139
Google Scholar
Cavazos-Cadena R, Fernández-Gaucherand E (2002) Risk-sensitive control in communicating average Markov decision chains. In: Dror M, L’Ecuyer P, Szidarovsky F (eds) Modelling uncertainty: an examination of stochastic theory, methods and applications. Kluwer, Boston, pp 525–544
Google Scholar
Cavazos-Cadena R, Hernández-Hernández D (2003) Solution to the risk-sensitive average cost optimality equation in communicating Markov decision chains with finite state space: An alternative approach. Math Methods Oper Res 56: 473–479
Article Google Scholar
Cavazos-Cadena R, Hernández-Hernández D (2008) Necessary and sufficient conditions for a solution to the risk-sensitive Poisson equation on a finite state space. Syst Control Lett (to appear)
Di Masi GB, Stettner L (2000) Infinite horizon risk sensitive control of discrete time Markov processes with small risk. Syst Control Lett 40: 305–321
Article MathSciNet Google Scholar
Di Masi GB, Stettner L (2007) Infinite horizon risk sensitive control of discrete time Markov processes under minorization property. SIAM J Control Optim 46: 231–252
Article MATH MathSciNet Google Scholar
Fleming WH, McEneany WM (1995) Risk-sensitive control on an infinite horizon. SIAM J Control Optim 33: 1881–1915
Article MATH MathSciNet Google Scholar
Hernández-Hernández D, Marcus SI (1996) Risk-sensitive control of Markov processes in countable state space. Syst Control Lett 29: 147–155
Article MATH Google Scholar
Hernández-Lerma O (1988) Adaptive Markov control processes. Springer, New York
Google Scholar
Howard AR, Matheson JED (1972) Risk-sensitive Markov decision processes. Manage Sci 18: 356–369
Article MATH MathSciNet Google Scholar
Jacobson DH (1973) Optimal stochastic linear systems with exponential performance criteria and their relation to stochastic differential games. IEEE Trans Automat Control 18: 124–131
Article MATH Google Scholar
Jaquette SC (1973) Markov decison processes with a new optimality criterion: discrete time. Ann Stat 1: 496–505
Article MATH MathSciNet Google Scholar
Jaquette SC (1976) A utility criterion for Markov decision processes. Manage Sci 23: 43–49
Article MATH MathSciNet Google Scholar
Jaśkiewicz A (2007) Average optimality for risk sensitive control with general state space. Ann Appl Probab 17: 654–675
Article MATH MathSciNet Google Scholar
Puterman ML (1994) Markov decision processes. Wiley, New York
Book MATH Google Scholar
Seneta E (1980) Nonnegative matrices. Springer, New York
Google Scholar
Thomas LC (1980) Conectedness conditions for denumerable state Markov decision processes. In: Hartley R, Thomas LC, White DJ (eds) Recent advances in Markov decision processes. Academic Press, New York
Google Scholar

Download references

Author information

Authors and Affiliations

Departamento de Estadística y Cálculo, Universidad Autónoma Agraria Antonio Narro, Buenavista, 25315, Saltillo, COAH, Mexico
Rolando Cavazos-Cadena

Authors

Rolando Cavazos-Cadena
View author publications
You can also search for this author in PubMed Google Scholar

Corresponding author

Correspondence to Rolando Cavazos-Cadena.

Additional information

Dedicated to Professor Onésimo Hernández-Lerma, on the occasion of his sixtieth birthday.

This work was supported by the PSF Organization under Grant No. 08-04, and in part by CONACYT under Grant 25357.

Rights and permissions

Reprints and permissions

About this article

Cite this article

Cavazos-Cadena, R. Solutions of the average cost optimality equation for finite Markov decision chains: risk-sensitive and risk-neutral criteria. Math Meth Oper Res 70, 541–566 (2009). https://doi.org/10.1007/s00186-008-0277-y

Download citation

Received: 26 May 2008
Revised: 08 November 2008
Published: 23 December 2008
Issue Date: December 2009
DOI: https://doi.org/10.1007/s00186-008-0277-y

Keywords

Mathematics Subject Classification (2000)

Use our pre-submission checklist

Avoid common mistakes on your manuscript.

Solutions of the average cost optimality equation for finite Markov decision chains: risk-sensitive and risk-neutral criteria

Abstract

Article PDF

Similar content being viewed by others

Controlled Semi-Markov Chains with Risk-Sensitive Average Cost Criterion

Contractive Approximations in Risk-Sensitive Average Semi-Markov Decision Chains on a Finite State Space

A Discounted Approach in Communicating Average Markov Decision Chains Under Risk-Aversion

References

Author information

Authors and Affiliations

Corresponding author

Additional information

Rights and permissions

About this article

Cite this article

Keywords

Mathematics Subject Classification (2000)

Navigation

Solutions of the average cost optimality equation for finite Markov decision chains: risk-sensitive and risk-neutral criteria

Abstract

Article PDF

Similar content being viewed by others

Controlled Semi-Markov Chains with Risk-Sensitive Average Cost Criterion

Contractive Approximations in Risk-Sensitive Average Semi-Markov Decision Chains on a Finite State Space

A Discounted Approach in Communicating Average Markov Decision Chains Under Risk-Aversion

References

Author information

Authors and Affiliations

Corresponding author

Additional information

Rights and permissions

About this article

Cite this article

Share this article

Keywords

Mathematics Subject Classification (2000)

Search

Navigation