Your browser doesn't support javascript.
loading
Optimal Policy of Multiplayer Poker via Actor-Critic Reinforcement Learning.
Shi, Daming; Guo, Xudong; Liu, Yi; Fan, Wenhui.
Afiliação
  • Shi D; Department of Automation, Tsinghua University, Beijing 100084, China.
  • Guo X; Department of Automation, Tsinghua University, Beijing 100084, China.
  • Liu Y; Department of Automation, Tsinghua University, Beijing 100084, China.
  • Fan W; Department of Automation, Tsinghua University, Beijing 100084, China.
Entropy (Basel) ; 24(6)2022 May 30.
Article em En | MEDLINE | ID: mdl-35741495

Texto completo: 1 Coleções: 01-internacional Base de dados: MEDLINE Tipo de estudo: Prognostic_studies Idioma: En Revista: Entropy (Basel) Ano de publicação: 2022 Tipo de documento: Article

Texto completo: 1 Coleções: 01-internacional Base de dados: MEDLINE Tipo de estudo: Prognostic_studies Idioma: En Revista: Entropy (Basel) Ano de publicação: 2022 Tipo de documento: Article