Erkennung von Objekten und Zuständen in Bildern, Punktwolken und Oberflächenmodellen.
Computer Vision, zu Deutsch “Maschinelles Sehen”, ermöglicht es, aus unstrukturierten Daten wie Bildern und Punktwolken strukturierte, maschinenlesbare Informationen abzuleiten. Beispielsweise können basierend auf Punkwolken automatisch die auf einer Baustelle vorhandenen Materialmengen ermittelt, oder anhand von Drohnenbildern Schäden an Anlagenteilen erkannt werden.
Modernes Computer Vision basiert auf sogenannten „Künstlichen Neuronalen Netzen“, der gleichen Technologie, die auch hinter generativen Sprachmodellen wie Chat-GPT steckt. Bei der Industriellen Nutzung von Computer Vision Modellen wird in der Regel auf vortrainierten Modellen aufgebaut. Diese haben anhand riesiger, oftmals frei zugänglicher Datensätze bereits gelernt, allgemeine Muster und Merkmale wie Kanten und einfache geometrische Formen zu identifizieren.
Die zentrale Aufgabe bei der Entwicklung industrieller Anwendungen besteht daher im „Umschulen“ vortrainierter Neuronaler Netze auf spezifische Industrieprobleme sowie in der Entwicklung eines Gesamtprozesses, der es dem System erlaubt, sich durch menschliches Feedback während seiner Anwendung kontinuierlich zu verbessern.