BATCH POLICY LEARNING IN AVERAGE REWARD MARKOV DECISION PROCESSES.
Ann Stat
; 50(6): 3364-3387, 2022 Dec.
Article
en En
| MEDLINE
| ID: mdl-37022318
Texto completo:
1
Colección:
01-internacional
Banco de datos:
MEDLINE
Tipo de estudio:
Health_economic_evaluation
Idioma:
En
Revista:
Ann Stat
Año:
2022
Tipo del documento:
Article