Overcoming data scarcity in biomedical imaging with a foundational multi-task model.

Schäfer, Raphael; Nicke, Till; Höfener, Henning; Lange, Annkristin; Merhof, Dorit; Feuerhake, Friedrich; Schulz, Volkmar; Lotz, Johannes; Kiessling, Fabian

Schäfer, Raphael; Nicke, Till; Höfener, Henning; Lange, Annkristin; Merhof, Dorit; Feuerhake, Friedrich; Schulz, Volkmar; Lotz, Johannes; Kiessling, Fabian.

Afiliação

Schäfer R; Fraunhofer Institute for Digital Medicine MEVIS, Bremen, Germany.
Nicke T; Fraunhofer Institute for Digital Medicine MEVIS, Bremen, Germany.
Höfener H; Fraunhofer Institute for Digital Medicine MEVIS, Bremen, Germany.
Lange A; Fraunhofer Institute for Digital Medicine MEVIS, Bremen, Germany.
Merhof D; Fraunhofer Institute for Digital Medicine MEVIS, Bremen, Germany.
Feuerhake F; Institute of Image Analysis and Computer Vision, Faculty of Informatics and Data Science, University of Regensburg, Regensburg, Germany.
Schulz V; Institute for Pathology, Hannover Medical School, Hanover, Germany.
Lotz J; Institute for Neuropathology, Medical Center, University of Freiburg, Freiburg, Germany.
Kiessling F; Fraunhofer Institute for Digital Medicine MEVIS, Bremen, Germany.

Nat Comput Sci ; 4(7): 495-509, 2024 Jul.

Article em En | MEDLINE | ID: mdl-39030386

ABSTRACT

ABSTRACT

Foundational models, pretrained on a large scale, have demonstrated substantial success across non-medical domains. However, training these models typically requires large, comprehensive datasets, which contrasts with the smaller and more specialized datasets common in biomedical imaging. Here we propose a multi-task learning strategy that decouples the number of training tasks from memory requirements. We trained a universal biomedical pretrained model (UMedPT) on a multi-task database including tomographic, microscopic and X-ray images, with various labeling strategies such as classification, segmentation and object detection. The UMedPT foundational model outperformed ImageNet pretraining and previous state-of-the-art models. For classification tasks related to the pretraining database, it maintained its performance with only 1% of the original training data and without fine-tuning. For out-of-domain tasks it required only 50% of the original training data. In an external independent validation, imaging features extracted using UMedPT proved to set a new standard for cross-center transferability.

Assuntos

Processamento de Imagem Assistida por Computador; Humanos; Processamento de Imagem Assistida por Computador/métodos; Bases de Dados Factuais; Diagnóstico por Imagem/métodos; Algoritmos; Aprendizado de Máquina

Texto completo

Imprimir

XML

PubMed Links

Buscar no Google

Texto completo: 1 Coleções: 01-internacional Base de dados: MEDLINE Assunto principal: Processamento de Imagem Assistida por Computador Limite: Humans Idioma: En Ano de publicação: 2024 Tipo de documento: Article

Texto completo

Imprimir

XML

PubMed Links

Buscar no Google