ECCV 2026-Paper zur LiDAR-Robustheit
Eine Arbeit aus dem Forschungsbereich Industrial Deep Learning (IDL) des TMDT ist auf der European Conference on Computer Vision (ECCV 2026) angenommen worden, einer der weltweit führenden Konferenzen im Bereich Computer Vision. Die Studie untersucht, wie robust LiDAR-basierte 3D-Objektdetektoren für das autonome Fahren tatsächlich sind, wenn sie nicht nur auf sauberen Benchmark-Daten, sondern unter gezielten Störungen bewertet werden.
Ausgangspunkt der Arbeit ist eine Beobachtung: Moderne Detektoren erzielen auf Standard-Datensätzen immer bessere Erkennungsraten, doch ein hoher Benchmark-Wert (mAP) sagt wenig darüber aus, wie zuverlässig ein Modell unter realen, ungünstigen Bedingungen arbeitet. Genau diese Lücke zwischen „gut auf sauberen Daten" und „sicher im Straßenverkehr" steht im Zentrum der Untersuchung.
Um diese Frage systematisch zu beantworten, hat das Team ein ganzheitliches Bewertungs-Framework entwickelt, das die Robustheit erstmals in zwei getrennte Dimensionen aufschlüsselt: strukturelle Robustheit (Punktwolken-Dichte und -Lokalisierung) und prädiktive Robustheit (Fehlklassifikation, Lokalisierungsfehler in Translation, Skalierung und Orientierung sowie Distanz zum eigenen Fahrzeug). Anhand von fünf Kriterien wurden vier verbreitete Detektoren (PointPillars, CenterPoint, PillarNeSt und FocalFormer3D) gegen fünf LiDAR-spezifische Angriffsverfahren auf den Datensätzen nuScenes und Waymo geprüft.
Die zentralen Erkenntnisse:
Erstens reicht die mAP-Metrik allein zur Bewertung von Robustheit nicht aus. Ein Modell kann seinen mAP-Wert halten und dennoch gefährlich fehlorientierte Begrenzungsboxen erzeugen, die Schätzung der Objektausrichtung (Yaw) erwies sich als besonders fragil. Da nachgelagerte Bewegungsplaner auf diese Ausrichtung angewiesen sind, ist ein falscher Richtungswert ein unmittelbar sicherheitsrelevanter Fehler.
Zweitens bedeutet mehr Modellkapazität nicht automatisch mehr Sicherheit. Leistungsstarke, voxelbasierte Detektoren zeigten sich anfälliger für strukturierte Koordinatenstörungen als einfachere, pillar-basierte Modelle. Neuere Architekturen sind kaum robuster als ihre Vorgänger, und die Objekte, die zuerst nicht mehr zuverlässig erkannt werden, sind die besonders schutzbedürftigen Verkehrsteilnehmer: Fußgängerinnen, Fußgänger und Radfahrende.
Drittens schlägt die Arbeit eine ehrlichere Erfolgsmetrik für Angriffe (Attack Success Rate) vor, die bereits auf sauberen Daten übersehene Objekte ausschließt und auch Einbrüche der Erkennungskonfidenz berücksichtigt, nicht nur eindeutige Fehlklassifikationen.
Die übergeordnete Botschaft lautet nicht, dass diese Modelle schlecht sind. Vielmehr zeigt die Studie, dass Benchmarks, die ausschließlich die Genauigkeit auf sauberen Daten belohnen, die falschen Anreize setzen. Sichere maschinelle Wahrnehmung im autonomen Fahren braucht Bewertungsverfahren, die prüfen, ob eine Architekturentscheidung die Robustheit wirklich verbessert — und nicht nur den Benchmark-Wert erhöht.
Die Arbeit ist die zweite LiDAR-Publikation von Adwait Chandorkar im Schwerpunkt Visual Perception & Understanding des IDL-Forschungsbereichs. Sie knüpft an seine auf einem ICCV-2025-Workshop ausgezeichnete Arbeit zu effizienten Detektor-Backbones an: erst Effizienz, nun Robustheit, zwei Seiten dessen, was nötig ist, um 3D-Wahrnehmung in die reale Welt zu bringen. Die Publikation entstand gemeinsam mit Adwait Chandorkar, Kai Krink, Yerdana Maulenbay, Hasan Tercan und Tobias Meisen und ging aus Arbeiten im Projekt AiThena hervor.