| Einleitung: Das kolorektale Karzinom steht weltweit an dritter Stelle in der Krebsstatistik, nach dem Bronchial- und Mammakarzinom. Einige Kolonpolypen, insbesondere Adenome und sessile serratierte Läsionen, gelten als Vorstufen des kolorektalen Karzinoms. Die Entfernung von Kolonpolypen während einer Koloskopie kann das Risiko für die Entwicklung von kolorektalem Karzinom erheblich reduzieren. Daher spielt die frühzeitige Erkennung und deren Entfernung eine bedeutende Rolle bei der Prävention von kolorektalem Karzinom. Das Ziel dieser Diplomarbeit ist die Erstellung eines annotierten Datensatzes, welcher für die Erstellung eines Algorithmus, basierend auf künstlicher Intelligenz, dienen soll.
Methodik: Die Biobank Graz stellte die erforderlichen Präparate für dieses Projekt zur Verfügung. Ihr Bestand umfasst über 11 Millionen histologische Präparate mit Patient*innendaten. Für diese Studie wurde sorgfältig eine Kohorte von Patient*innen mit Kolonpolypen aus den Jahren 1984 bis 2014 ausgewählt. Die histologischen Präparate dieser Kolonpolypen wurden abgerufen und mittels hochauflösenden Whole-Slide-Imaging-Scanner digitalisiert, gefolgt von der Anonymisierung der Daten. Die darauffolgenden Annotationen wurden mit der Open-Source-Software QuPath durchgeführt. Der Datensatz umfasst H&E-gefärbte histologische Schnitte, die sowohl Kolonpolypen als auch normale Kolonschleimhaut beinhalten. Die Ausschnittbilder wurden als rechteckige Bilder exportiert, wobei das Annotation-Polygon das Zentrum jedes Bildes markiert. Alle Bilder haben eine Auflösung von 1024x1024 Pixeln.
Ergebnisse: Das Datenset umfasst 533 histologische Schnittbilder, die mit Hämatoxylin und Eosin (H&E) gefärbt wurden. Davon wurden 33 Schnitte aus dem Projekt ausgeschlossen. Insgesamt wurden 17.937 Bildbereiche gesammelt, wobei 10.088 physiologische Drüsen und 7.848 dysplastische Drüsen repräsentieren.
Conclusio: Unser Datensatz ist im Vergleich zu ähnlichen Datensätzen, die für Studien und wissenschaftliche Wettbewerbe verwendet wurden, von signifikanter Größe und Qualität. Es ist jedoch wichtig zu beachten, dass eine direkte Vergleichbarkeit dieser Datensätze aufgrund von Unterschieden in ihren vorgesehenen Zwecken eingeschränkt sein kann. Automatisierte Analysen werden in Zukunft in der Histopathologie immer wichtiger, aber unterschiedliche Gewebestrukturen und subjektive Bewertungen können weiterhin eine Herausforderung darstellen. Robuste Algorithmen sind für eine diagnostische Reproduzierbarkeit erforderlich. Die Implementierung von Deep-Learning-Modellen in der digitalen Pathologie hat das Potenzial, die Zeit- und Arbeitsbelastung von Ärzt*innen und Patholog*innen zu reduzieren, potenzielle Fehler zu minimieren und die Genauigkeit der Darmkrebsvorsorge zu verbessern. |