In der Entwicklung medizinischer Anwendungen wendet das Engineering- und Consulting-Unternehmen Helbling verschiedene Techniken an, um Innovationen im Rahmen von Künstlicher Intelligenz umsetzen zu können. Dadurch wird auch möglich, in den Anwendungen trotz limitierter Datensätze auf KI zurückzugreifen, heisst es in einem Fachartikel. Das Vorgehen wird vielfach nötig, da die Beschaffung grosser Datenmengen gerade für kleine oder mittlere Unternehmen beispielsweise in Form klinischer Studien zu teuer und zu zeitaufwändig ist. Bei allen Techniken sei Fachwissen der Schlüssel für die erfolgreiche Anwendung, schreiben die Autoren. Dazu gehörten medizinisches Wissen und das Verständnis der physikalischen Prozesse und der Benutzerinteraktionen.
Um unter diesen Voraussetzungen eine KI für medizinische Produkte trainieren zu können, reduzieren die Experten von Helbling etwa die Modellkomplexität und damit auch die erforderliche Datenmenge. „Erreicht wird dies, indem der Leistungsumfang des Modells begrenzt wird oder extrahierte Merkmale anstelle von Rohdaten verwendet werden“, heisst es im Fachartikel. Mit einer anderen Methode, der Data Augmentation, können die Experten Datenmengen künstlich vergrössern. Hierbei werden laut der Experten leicht veränderte Kopien vorhandener Daten hinzugefügt oder neue synthetische Daten generiert. Als Beispiel nennen sie ein Projekt zur Analyse von Hautkrebsbildern. Die Datenmenge wurde erhöht durch das Variieren von Bildern, etwa durch das Hinzufügen von Bildrauschen, durch das Reduzieren des Bildkontrasts, das Ändern des Umgebungslichts und der Homogenität der Beleuchtung.
Bei der Technik des Transferlernens wiederum kann der Prozess der Anwendung von Wissen aus einem gelösten Problem auf ein neues, artverwandtes Problem angewendet werden. Dabei kommt eine Teilmenge von bereits trainierten Schichten eines etablierten neuronalen Netzes zum Einsatz und wird neu trainiert. Eine andere Form des sogenannten Transfer Learnings sei zudem die Kombination eines kleinen verfügbaren Datensatzes mit Daten, die von einem anderen Gerät erfasst worden seien.
Begrenzte Datensätze können gemäss der Autoren auch bedeuten, dass unausgewogene Datensätze existieren. In solchen Fällen sei es möglich, mit Hilfe des Synthetic Minority Oversampling neue Datenpunkte einer unterrepräsentierten Klasse in einem Datensatz zu erzeugen. ko