ABSTRACT
Ziel war es die Wirksamkeit der Influenza-Impfung (VE) für die Grippesaison 2014/2015 auf Grundlage von Routinedaten aus Krankenkassendatensatz zu schätzen und zu replizieren. Zusätzlich sollten methodische Aspekte untersucht werden. Es wurden Abrechnungsdaten von 2,64 Millionen Versicherten der AOK Baden-Württemberg mit dortigem Wohnsitz ab 15 Jahren analysiert. Basierend auf Abrechnungsdaten für die Influenza-Impfung 2014, wurden die Teilnehmer als ungeimpft oder geimpft klassifiziert. Kovariablen, die den Zusammenhang zwischen Impfung und Influenzainfektion beeinträchtigen könnten, wurden berücksichtigt. Hierzu gehörten Alter, Geschlecht, Wohnort sowie Kovariablen, die auf den Gesundheitszustand und die Inanspruchnahme von Gesundheitsdienstleistungen hinweisen. Der primäre Endpunkt war ein Krankenhausaufenthalt wegen Influenza während der Grippesaison 2015. Zu den sekundären Endpunkten gehörten unter anderem Krankenhausaufenthalte wegen Lungenentzündung und die Gesamtmortalität. Um eine vergleichbare Gruppe von geimpften und ungeimpften Teilnehmern zu ermitteln, wurde ein Propensity-Score-Matching (PSM) durchgeführt. Es wurde eine Bias-Analyse durchgeführt, bei der die VE vor und nach der Grippesaison geschätzt wurde, also zu Zeitpunkten, in denen angenommen wurde, dass die Influenza nicht in der Bevölkerung zirkulierte und die Impfung nicht wirken konnte. Insgesamt konnten 839.706 Teilnehmer 1:1 gematcht werden. Die geschätzte VE (basierend auf Influenza bedingten Krankenhausaufenthalten) betrug 27% [95%Konfidenzintervall (KI): 17%; 36%], was der Schätzung des RKI für dieselbe Saison (27% [95%KI: -1%; 47%]) entspricht. Die Bias-Analyse zeigte, dass das Ergebnis teilweise durch residuale Konfundierung erklärt werden kann, was zu einer potenziellen Überschätzung des zugrunde liegenden Effekts führt. Die Ergebnisse der sekundären Endpunkte zeigten ähnliche Ergebnisse, obwohl sie wahrscheinlich in höherem Maße durch residuale Konfundierung bedingt sind. Zusammenfassend zeigt sich, dass (1) sekundäre Daten der deutschen Krankenkassen verwendet werden können, um plausible VE-Schätzungen abzuleiten, und dass (2) das PSM eine nützliche und transparente Methode zur Ableitung dieser Schätzungen ist. Darüber hinaus ist (3) residuale Konfundierung ein relevantes Problem in Beobachtungsstudien zu VE und (4) Bias-Analysen vor- und nach der Grippesaison sind eine wesentliche Ergänzung für die Interpretation der Ergebnisse.
Subject(s)
Influenza Vaccines , Influenza, Human , Propensity Score , Humans , Germany/epidemiology , Influenza, Human/prevention & control , Influenza, Human/epidemiology , Influenza Vaccines/administration & dosage , Male , Female , Middle Aged , Adult , Aged , Adolescent , Young Adult , Cohort Studies , Aged, 80 and over , Hospitalization/statistics & numerical data , Vaccine Efficacy/statistics & numerical data , Treatment Outcome , Age Distribution , Sex Distribution , Reproducibility of ResultsABSTRACT
HINTERGRUND: In Sekundärdaten existieren oftmals unstrukturierte Freitexte. In dieser Arbeit wird ein Text-Mining-System validiert, um unstrukturierte medizinische Daten für Forschungszwecke zu extrahieren. METHODEN: Aus einer radiologischen Klinik wurden aus 7102 CT-Befunden 1000 zufällig ausgewählt. Diese wurden von 2 Medizinern manuell in definierte Befundgruppen eingeteilt. Zur automatisierten Verschlagwortung und Klassifizierung wurde die Textanalyse-Software Averbis Extraction Platform (AEP) eingesetzt. Besonderheiten des Systems sind u. a. eine morphologische Analyse zur Zerlegung zusammengesetzter Wörter sowie die Erkennung von Nominalphrasen, Abkürzungen und negierten Aussagen. Anhand der extrahierten standardisierten Schlüsselwörter werden Befundberichte mithilfe maschineller Lernverfahren den vorgegebenen Befundgruppen zugeordnet. Zur Bewertung von Reliabilität und Validität des automatisierten Verfahrens werden die automatisierten und 2 unabhängige manuelle Klassifizierungen in mehreren Durchläufen auf Übereinstimmungen hin verglichen. ERGEBNISSE: Die manuelle Klassifizierung war zu zeitaufwendig. Bei der automatisierten Verschlagwortung stellte sich in unseren Daten die Klassifizierung nach ICD-10 als ungeeignet heraus. Ebenfalls zeigte sich, dass die Stichwortsuche keine verlässlichen Ergebnisse liefert. Computerunterstütztes Textmining in Kombination mit maschinellem Lernen führte zu verlässlichen Klassifizierungen. Die Inter-Rater-Reliabilität der beiden manuellen Klassifizierungen, sowie der maschinellen und der manuellen Klassifizierung war sehr hoch. Beide manuelle Klassifizierungen stimmten in 93% aller Befunde überein. Der Kappa-Koeffizient beträgt 0,89 [95% Konfidenzintervall (KI) 0,87-0,92]. Die automatische Klassifizierung stimmte in 86% aller Befunde mit der unabhängigen, zweiten manuellen Klassifizierung überein (Kappa-Koeffizient 0,79 [95% KI 0,75-0,81]). DISKUSSION: Die Klassifizierung der Software AEP war sehr gut. In unserer Studie folgte sie allerdings einem systematischen Muster. Die meisten falschen Zuordnungen finden sich in Befunden, die auf ein erhöhtes Krebsrisiko hinweisen. Die Freitextstruktur der Befunde lässt Bedenken hinsichtlich der Machbarkeit einer rein automatisierten Analyse aufkommen. Die Kombination aus menschlichem Intellekt und einer intelligenten, lernfähigen Software erscheint als zukunftsweisend, um unstrukturierte aber wichtige Textinformationen der Forschung zugänglich machen zu können.