| Hintergrund: Die diagnostische Leistung von CNNs für die Diagnose verschiedener Arten von Hautkrebs zeigte sich in den letzten Jahren sehr vielversprechend. Der Einsatz einer Smartphone-Applikation, die Laien mit Hilfe einer integrierten künstlichen Intelligenz eine erste Einschätzung geben kann, könnte gegebenenfalls zu einer schnelleren Therapie führen.
Zielsetzung: Bis dato ist in der Literatur noch nicht über die Leistungsfähigkeit einer zertifizierten Smartphone-basierten neuronalen Netzwerkanwendung für die Analyse von makroskopischen Bildern von Hautläsionen berichtet worden, die von Laien unter realen Bedingungen aufgenommen wurden. Das Hauptziel dieser Studie ist die Bewertung der Risikobewertung durch die Smartphone-App im Vergleich zur Risikobewertung durch ein Expertengremium aus drei Dermatologen. Methoden: Wir analysierten und verglichen die Erkennungsgenauigkeit des CE- gekennzeichneten Algorithmus der SkinScreener© Smartphone-Applikation mit der Konsensmeinung der teilnehmenden Dermatologen. Die primären Endpunkte waren Sensitivität, Spezifität und Genauigkeit für die trichotome Risikoeinschätzung (geringes, mittleres, hohes Risiko). Sekundäre Endpunkte waren interindividuelle Unterschiede in der diagnostischen Leistung der Dermatologen bei der Analyse der jeweiligen Hautläsionen als auch die Analyse der durch die KI falsch beurteilten Läsionen.
Ergebnisse: Die Leistung des CE-gekennzeichneten Smartphone-Algorithmus bei der Risikobewertung betrug 76,9% - 95% CI: {71,7% - 81,5%} für die Sensitivität und 80,9% - 95% CI: {78,5% - 83,2%} für die Spezifität. Die Gesamtgenauigkeit betrug 77,2 %. Sekundäre Endpunkte waren interindividuelle Unterschiede in der diagnostischen Leistung der Dermatologen bei der Analyse der jeweiligen Hautläsionen. Es konnte gezeigt werden, dass die Leistungsfähigkeit schlechter war als in einer zuvor durchgeführten Studie unter klinischen Bedingungen.
Schlussfolgerungen: Die Validierung von Smartphone-basierten Anwendungen wie der SkinScreener©-Anwendung in einem nicht-klinischen Umfeld kann entscheidend sein, um ausreichende Leistungsdaten für solche Anwendungen zu erhalten. Es muss ein geeigneter Referenzstandard gefunden werden, da der Goldstandard mit histopathologischer Verifizierung in einem solchen nicht-klinischen Umfeld nicht zugänglich ist. Der in Form eines Expertengremiums verwendete Referenzstandard zeigte aus verschiedenen Gründen Schwierigkeiten, eine eindeutige Konsensmeinung zu erhalten, und wirft daher die Frage auf, wie eine solche Validierung unter Verwendung eines Expertengremiums als Referenzstandard in künftigen Studien verbessert oder durch andere Modalitäten ergänzt werden kann. |