Evaluating the performance of large language models in haematopoietic stem cell transplantation decision-making.

Civettini, Ivan; Zappaterra, Arianna; Granelli, Bianca Maria; Rindone, Giovanni; Aroldi, Andrea; Bonfanti, Stefano; Colombo, Federica; Fedele, Marilena; Grillo, Giovanni; Parma, Matteo; Perfetti, Paola; Terruzzi, Elisabetta; Gambacorti-Passerini, Carlo; Ramazzotti, Daniele; Cavalca, Fabrizio

Civettini, Ivan; Zappaterra, Arianna; Granelli, Bianca Maria; Rindone, Giovanni; Aroldi, Andrea; Bonfanti, Stefano; Colombo, Federica; Fedele, Marilena; Grillo, Giovanni; Parma, Matteo; Perfetti, Paola; Terruzzi, Elisabetta; Gambacorti-Passerini, Carlo; Ramazzotti, Daniele; Cavalca, Fabrizio.

Afiliación

Civettini I; Department of Medicine and Surgery, University of Milano-Bicocca, Monza, Italy.
Zappaterra A; Department of Haematology and Bone Marrow Trasplantation Unit, Fondazione IRCCS San Gerardo dei Tintori, Monza, Italy.
Granelli BM; Department of Medicine and Surgery, University of Milano-Bicocca, Monza, Italy.
Rindone G; Department of Haematology and Bone Marrow Trasplantation Unit, Fondazione IRCCS San Gerardo dei Tintori, Monza, Italy.
Aroldi A; Department of Haematology and Bone Marrow Transplantation Unit, ASST Grande Ospedale Metropolitano Niguarda, Milan, Italy.
Bonfanti S; Department of Medicine and Surgery, University of Milano-Bicocca, Monza, Italy.
Colombo F; Department of Haematology and Bone Marrow Trasplantation Unit, Fondazione IRCCS San Gerardo dei Tintori, Monza, Italy.
Fedele M; Department of Medicine and Surgery, University of Milano-Bicocca, Monza, Italy.
Grillo G; Department of Haematology and Bone Marrow Trasplantation Unit, Fondazione IRCCS San Gerardo dei Tintori, Monza, Italy.
Parma M; Department of Haematology and Bone Marrow Trasplantation Unit, Fondazione IRCCS San Gerardo dei Tintori, Monza, Italy.
Perfetti P; Department of Medicine and Surgery, University of Milano-Bicocca, Monza, Italy.
Terruzzi E; Department of Haematology and Bone Marrow Trasplantation Unit, Fondazione IRCCS San Gerardo dei Tintori, Monza, Italy.
Gambacorti-Passerini C; Department of Medicine and Surgery, University of Milano-Bicocca, Monza, Italy.
Ramazzotti D; Department of Haematology and Bone Marrow Trasplantation Unit, Fondazione IRCCS San Gerardo dei Tintori, Monza, Italy.
Cavalca F; Department of Haematology and Bone Marrow Trasplantation Unit, Fondazione IRCCS San Gerardo dei Tintori, Monza, Italy.

Br J Haematol ; 204(4): 1523-1528, 2024 Apr.

Article en En | MEDLINE | ID: mdl-38070128

RESUMEN

In a first-of-its-kind study, we assessed the capabilities of large language models (LLMs) in making complex decisions in haematopoietic stem cell transplantation. The evaluation was conducted not only for Generative Pre-trained Transformer 4 (GPT-4) but also conducted on other artificial intelligence models: PaLm 2 and Llama-2. Using detailed haematological histories that include both clinical, molecular and donor data, we conducted a triple-blind survey to compare LLMs to haematology residents. We found that residents significantly outperformed LLMs (p = 0.02), particularly in transplant eligibility assessment (p = 0.01). Our triple-blind methodology aimed to mitigate potential biases in evaluating LLMs and revealed both their promise and limitations in deciphering complex haematological clinical scenarios.

Asunto(s)

Inteligencia Artificial; Trasplante de Células Madre Hematopoyéticas; Humanos; Lenguaje; Donantes de Tejidos

Palabras clave

GPT; HSC transplantation; artificial intelligence; interrater agreement; transplant

Texto completo

Imprimir

XML

PubMed Links

Buscar en Google

Texto completo: 1 Bases de datos: MEDLINE Asunto principal: Inteligencia Artificial / Trasplante de Células Madre Hematopoyéticas Límite: Humans Idioma: En Revista: Br J Haematol Año: 2024 Tipo del documento: Article País de afiliación: Italia

Texto completo

Imprimir

XML

PubMed Links

Buscar en Google