Das ist es:
Computer Vision ist quasi das Sehorgan für einen Comupter. Dieser Teilbereich des Machine Learning ermöglicht dem Comupter das Erkennen, Verarbeiten und die Informationsgewinnung von visuellen Datenquellen. Untersucht werden visuelle Datenquellen mithilfe von Farbanalysen oder Patchanalysen. Bei diesen Analysen werden Farben einzelner Pixel erkannt oder die Betrachtung von sogenannten „Patches“ (dt. Flecken) genutzt. Die Algorithmen der Computer Vision werden dann auf das Erkennen von Objekten, die diese Pixel oder Patches bilden, trainiert. Dazu nutzen sie große Mengen von Bildern und Videos zum Trainieren. Dieses Training lässt Computer sehr genau zu erkennen, was sich auf einer visuellen Datenquelle wo befindet. Computer im Smartphone können so beispielsweise QR-Codes erkennen und in einen Link verwandeln, Filter von Social Media-Plattformen werden innerhalb von Millisekunden auf unser Gesicht angepasst und der Spurhalterassisitent eines Fahrzeugs gibt eine Warnung aus, wenn man zu nah an die Fahrbahngrenze kommt.
So funktioniert es:
Mittels Computer Vision erkennt ein Computer Pixel in einer Bild- oder Bewegtbildquelle, z.B., welche Farbe dieses Pixel hat und in welches Farbschema es passt. Bei der Farberkennung gibt es aufgrund von äußerlichen Einflussfaktoren wie z.B. Lichteinstrahlung, Tageszeit oder Position des Objekts immer abweichende Farben in einer Bildquelle. Durch die erschwerte Bestimmung der einzelnen Farbcodes wird diese Analyse ungenau. Eine aussagekräftigere Analyse bietet dabei das Analysieren (Betrachten) von visuellen Datenquellen in Patches oder Flecken ohne Farbe. Hierbei werden bei den Patches die umliegenden Bereiche eines Pixels mit in die Analyse einbezogen. Diese Analyse ermöglicht Umrisse von Objekten zu identifizieren. Die Pixelflecken gibt es in vielen Varianten und werden kombiniert zur Analyse einer Datei eingesetzt. Sucht ein Computer Vision-Algorithmus jetzt z.B. „Augen“ auf einem Bild, sucht er nach kreisförmigen dunklen Anordnungen, die von hellen Pixeln umrandet sind. Durch das maschinelle Training dieser Algorithmen entstehen im Laufe der Zeit immer genauere Annahmen über visuelle Inhalte von Daten.
Beispiele für Computer Vision:
- Gesichtserkennung z.B. mit dem Smartphone
- Erkennen von Bar- oder QR-Codes
- Filter von Social Media-Plattformen, die passgenau auf dem Gesicht dargestellt werden
Computer Vision in der Zukunft:
Die Genauigkeit der Computer Vision-Algorithmen wird in der Zukunft weiterhin zunehmen. Ein großer Meilenstein wird dabei die Realisierung von autonomem Fahren sein. Dann kann sich ein Fahrzeug mithilfe visueller Erkennungsmechanismen (Kamera, Radar, Lidar, etc.) im Straßenverkehr fortbewegen. Auch die Früherkennung von Krebs wird sich durch Computer Vision die Früherkennung weiterentwickeln, die optimale Bewirtschaftung von Ackerflächen mittels Bildaufnahmen wird in Zukunft möglich sein. Auch die bedarfs- und bedürfnisgesteuerte Handels- und Ladenflächensteuerung wird weiter optimiert werden. Die Entwicklung der Computer Vision wird durch die zunehmende Durchdringung von Digitalisierung immer mehr Bereiche des Arbeits- und Privatsleben beeinflussen.