Synthetische Sonardaten gegen Datenmangel
Die zuverlässige Erkennung von Objekten am Meeresboden ist eine zentrale Voraussetzung für maritime Sicherheit und die Beräumung von Munitionsaltlasten in Nord- und Ostsee. Seitensicht-Sonar (Side-Scan Sonar, SSS) ist dafür ein verbreitetes Sensorverfahren. Für moderne Deep-Learning-Verfahren fehlt es jedoch an annotierten Trainingsdaten: Von seltenen Objekttypen wie versenkter Munition existieren oft nur wenige Dutzend beschriftete Aufnahmen. Ein gemeinsam mit TKMS und dem Segment TKMS ATLAS ELEKTRONIK erarbeiteter Beitrag adressiert genau dieses Problem und wurde auf der AUSTech 2026 angenommen, dem Workshop „Advances in Underwater Surveillance" im Rahmen der International Conference on Pattern Recognition (ICPR 2026) in Lyon.
Die Arbeit „From Masks to Images: Mask-Conditional Diffusion for Realistic Synthetic SSS Data" wurde von Franziska Auer und Zayd Yacouti (TKMS ATLAS ELEKTRONIK) verfasst und von Tobias Meisen seitens des TMDT betreut. Im Zentrum steht eine modulare Synthese-Pipeline, die nicht die gesamte akustische Szene simuliert, sondern gezielt die aussagekräftigen Bildanteile erzeugt und die zugrunde liegende Sonar-Physik explizit kodiert.
Den Kern bildet ein maskenkonditioniertes Diffusionsmodell (Mask-Conditional DDPM), das realistische Vordergrundobjekte erzeugt und dabei einer vorgegebenen Highlight-Shadow-Geometrie folgt. Die Geometrie wird also explizit vorgegeben statt implizit gelernt. Ein physikbasierter Compositor berechnet die akustischen Schatten analytisch aus der Sensorgeometrie und erzeugt automatisch Annotationen im YOLO-Format. Ergänzend vergleicht die Arbeit systematisch zwei Strategien zur Hintergrunderzeugung: synthetische, per GAN generierte Meeresböden gegenüber realen, unbeschrifteten Sonar-Hintergründen.
Die Ergebnisse sind deutlich: Die Anreicherung von 60 realen Aufnahmen mit 600 synthetischen Samples hebt die mediane Testgenauigkeit über sechs CNN-Architekturen hinweg von 29 Prozent auf 80 Prozent. Bemerkenswert ist ein kontraintuitiver Befund: saubere, artefaktfreie GAN-Hintergründe erreichten vergleichbare oder leicht bessere Ergebnisse als reale Meeresböden, insbesondere bei Modellen mit hoher Kapazität. Unter starkem Datenmangel ist „mehr Realismus" also nicht automatisch „mehr Nutzen": Ein kontrolliert erzeugter synthetischer Hintergrund kann als Regularisierung wirken und das Netzwerk auf das eigentliche Objekt fokussieren.
Damit liefert die Arbeit einen praxisnahen Baustein, um Sonar-Surveys zur Beräumung von Munitionsaltlasten schneller und kostengünstiger zu machen, und das mit Deep-Learning-Verfahren, die unter den realen Datenbeschränkungen des Anwendungsfelds funktionieren.
Die Forschung wurde vom Bundesministerium für Wirtschaft und Energie (BMWE) im Rahmen des Projekts IRAV 2 (Industrielle Räumung von Altlasten in Verklappungsgebieten 2) gefördert.