| Forschungszusammenhang
Pädiatrische Ellenbogenfrakturen machen einen bedeutenden Anteil der Traumafälle in der pädiatrischen Notaufnahme aus. Diese Frakturen sind aufgrund der komplexen Anatomie des kindlichen Ellenbogens und der sich entwickelnden Knochenstruktur bei Kindern bekanntermaßen schwer genau zu diagnostizieren. Fehldiagnosen oder verzögerte Diagnosen solcher Frakturen können zu verheerenden Komplikationen führen, einschließlich langfristiger Funktionseinschränkungen oder dauerhafter Behinderungen des betroffenen Kindes. Das derzeit am häufigsten verwendete diagnostische Werkzeug für diese Verletzungen ist die Röntgendurchleuchtung, die trotz ihrer weiten Verbreitung inhärente Einschränkungen in ihrer Sensitivität aufweist. Menschliche Faktoren, wie mangelnde diagnostische Erfahrung bei jungen Ärzten oder Erschöpfung, die auch erfahrene Fachkräfte betreffen kann, können die genaue Beurteilung zusätzlich erschweren. Künstliche Intelligenz (KI) hat bereits gezeigt, dass sie in der Lage ist, in der medizinischen Bildgebung Pathologien präzise zu identifizieren und zu lokalisieren. Mit dieser Forschung zielen wir darauf ab, die Entwicklung von KI-Algorithmen voranzutreiben, die pädiatrische Ellenbogenfrakturen erkennen können, um die diagnostische Genauigkeit zu verbessern und die Behandlungsergebnisse zu optimieren.
Ziele
Diese Arbeit hat folgende Ziele: 1) Zwei verschiedene CNN-Modelle (nämlich EfficientNet und YOLOv8) zu trainieren, um pädiatrische Ellenbogenfrakturen zu erkennen, indem Ellenbogenröntgenbilder von Kindern (welche Frakturen vs. keine Frakturen enthalten) klassifiziert und der „Bereich von Interesse“ (ROI) im Bild markiert wird. 2) Relevante Performancemesswerte (z. B. Precision, Recall, F1-Score, NPV, PR-AUC Kurven und andere) für beide Modelle, EfficientNet und YOLOv8, darzustellen.
Methodik
Wir nutzten einen internen Datensatz, der von der Abteilung für Pädiatrische Radiologie, Institut für Radiologie, Medizinische Universität Graz, zusammengestellt wurde und 17.084 Röntgenbilder von Kinderellenbogen von 6.423 Patienten umfasst. EfficientNet mit seinen Untervarianten B0-B7 und YOLOv8 mit seinen Untervarianten YOLOv8-n, YOLOv8-s, YOLOv8-m, YOLOv8-l, YOLOv8-x wurden trainiert, um kindliche Ellenbogenfrakturen auf den Bildern zu erkennen und zu lokalisieren, wobei letzteres durch das Markieren des Bereichs von Interesse (ROI) mit Begrenzungsrahmen erfolgte. Nach dem Training beider Modelle haben wir deren Leistung anhand standardisierter KI-Metriken wie Accuracy, Precision, Sensitivität und F1-Score sowie weiterer Metriken bewertet. Diese Metriken wurden dann genutzt, um die Effektivität der EfficientNet-Untervarianten und der YOLOv8-Untervarianten bei der genauen Erkennung und Lokalisierung von kindlichen Ellenbogenfrakturen miteinander zu vergleichen. Für alle getesteten EfficientNet-Untervarianten und YOLOv8-Untervarianten wurden PR-AUC Kurven erstellt.
Ergebnisse
Unter den EfficientNet-Varianten erzielte das Modell B3 die höchsten Werte in Bezug auf Recall (94,41%), F1-Score (92,22%) und Accuracy (88,6%). Das Modell B6 hingegen erreichte die besten Ergebnisse in den Kategorien Precision (91,62%), Spezifität (78,87%), und NPV (91,62%), wodurch es besonders effektiv in der Minimierung von falsch-positiven Diagnosen ist. Die PR-AUC von B0 beträgt 0,94, die von B2 und B4 liegt bei 0,95, die von B1, B3 und B7 bei 0,96 und schließlich die von B5 und B6 bei 0,97.
In der YOLOv8-Familie erreichte YOLOv8-x die höchste Precision (94,4%), F1-Score (91,45%) und AP50-95% (66,12%), während YOLOv8-n und YOLOv8-s die höchsten NPV-Werte (beide jeweils mit 97,64%) aufwiesen. YOLOv8-m, YOLOv8-l und YOLOv8-x haben jeweils eine PR-AUC von 0,954, während YOLOv8-n und YOLOv8-s jeweils eine PR-AUC von 0,951 haben.
Diskussion
Sowohl die EfficientNet- als auch die YOLOv8-Modelle zeigten ein großes Potenzial, die Erkennung von pädiatrischen Ellenbogenfrakturen zu unterstützen, wobei ihre Leistung je nach spezifischen Metriken variierte. Unsere Ergebnisse unterstreichen das Potenzial von KI-Modellen, die radiologische Diagnostik im pädiatrischen Bereich zu verbessern. Allerdings sind weitere Verfeinerungen und klinische Validierungen erforderlich, um ihre Wirksamkeit in realen Anwendungen sicherzustellen.
|