Interpreting frequentist hypothesis tests: insights from Bayesian inference.
Can J Anaesth
; 70(10): 1560-1575, 2023 10.
Article
em En
| MEDLINE
| ID: mdl-37794259
RéSUMé: Les études randomisées contrôlées constituent l'un des meilleurs moyens de quantifier l'efficacité des interventions médicales. Par conséquent, lorsque les autrices et auteurs d'une étude randomisée superiorité signalent que les différences dans le critère d'évaluation principal entre le groupe d'intervention et le groupe témoin sont « significatives ¼ (c.-à-d. P ≤ 0,05), nous pourrions supposer que l'intervention a un effet sur le critère d'évaluation. De même, lorsque les différences entre les groupes ne sont « pas significatives ¼, nous pourrions supposer que l'intervention n'a pas d'effet sur le critère d'évaluation. Pourtant, ces deux hypothèses s'avèrent souvent incorrectes.Dans cet article, nous explorons la relation qui existe entre les effets réels d'un traitement et les déclarations de signification statistique fondées sur les valeurs P et les intervalles de confiance. Nous expliquons pourquoi, dans certaines circonstances, la probabilité qu'une intervention soit inefficace lorsque P ≤ 0,05 dépasse 25 % et la probabilité qu'une intervention soit efficace lorsque P > 0,05 dépasse 50 %.Au cours de la dernière décennie, nous avons assisté à un intérêt croissant pour les méthodes bayésiennes comme alternative aux tests d'hypothèses fréquentistes. Nous proposons une introduction robuste mais non technique à l'inférence bayésienne et expliquons pourquoi une distribution postérieure bayésienne surmonte bon nombre des problèmes associés aux tests d'hypothèses fréquentistes.Malgré l'intérêt actuel pour les méthodes bayésiennes, les tests d'hypothèses fréquentistes restent la méthode par défaut pour l'inférence statistique en recherche médicale. Par conséquent, nous proposons une solution provisoire au « problème de signification ¼ basée sur des mesures bayésiennes simplifiées (par exemple, facteur de Bayes, risque de faux positifs) qui peuvent être rapportées en même temps que les mesures traditionnelles des valeurs P et des intervalles de confiance. Nous calculons ces paramètres pour quatre études multicentriques bien connues. Nous fournissons des liens vers des calculatrices en ligne afin que les lectrices et lecteurs puissent facilement estimer ces mesures pour les études publiées. De cette façon, nous espérons que les décisions sur l'intégration des résultats des études randomisées dans la pratique clinique pourront être améliorées, minimisant ainsi le risque que des traitements utiles soient rejetés ou que des traitements inefficaces soient adoptés.
Palavras-chave
Texto completo:
1
Coleções:
01-internacional
Base de dados:
MEDLINE
Assunto principal:
Projetos de Pesquisa
/
Pesquisa Biomédica
Tipo de estudo:
Clinical_trials
/
Prognostic_studies
Limite:
Humans
Idioma:
En
Revista:
Can J Anaesth
Ano de publicação:
2023
Tipo de documento:
Article