Die Straßen dieser Welt verĂ€ndern sich stĂ€ndig, und das ist natĂŒrlich auch eine Herausforderung fĂŒr die Google Maps – denn die App bzw. das dahinter liegende Datenmaterial muss Schritt halten und stĂ€ndig aktualisiert werden. Das geschieht zum einen durch die Hilfe der Nutzer und kann zum anderen auch automatisiert erfolgen. Dazu setzt Google auf die Fotos der Streetview-Fahrzeuge, mit denen sich Straßenschilder und Namen von GeschĂ€ften vollautomatisch korrigieren lassen.

Auch wenn sie hierzulande lĂ€ngst von den Straßen verbannt sind, gibt es noch viele Teile der Welt, in denen die Fahrzeugen von Google Streetview regelmĂ€ĂŸig unterwegs sind und frisches Fotomaterial liefern. Aber auch die Datenbank, der in der Vergangenheit aufgenommenen Fotos, enthĂ€lt wertvolle Daten, die nun von den Algorithmen ausgewertet werden und das Kartenmaterial ergĂ€nzen und korrigieren sollen.

Das Team von Google Streetview hat Algorithmen entwickelt, mit denen sich die Beschilderung auf den Fotos vollautomatisch erkennen lĂ€sst. Das ist dank OCR, also Texterkennung, in der Theorie zwar keine große Herausforderung, in der Praxis aber eine Mammut-Aufgabe. Auf den Fotos befinden sich natĂŒrlich nicht nur Straßenschilder sondern auch Werbeanzeigen, Nummernschilder und viele weitere Dinge, die mit einem Straßenschild natĂŒrlich nichts zu tun haben. Diese mĂŒssen also alle erst einmal herausgefiltert werden.

Ist dann ein Straßenschild extrahiert, nimmt sich der Algorithmus alle verfĂŒgbaren Ansichten dieses Schildes und versucht den Text darauf möglichst genau zu erkennen. Dabei werden AbkĂŒrzungen wie Av., Str. oder Ln. automatisch erkannt und vervollstĂ€ndigt. Diese Schilder können dann dank der Geodaten der Fahrzeuge einer genauen Straße zugewiesen werden, so dass die Maps ĂŒber den korrekten Namen verfĂŒgen. Herausforderung ist dabei vor allem auch das Ausblenden von Hausnummern und auch Schildern von kreuzenden Straßen.

Aber nicht nur Straßennamen werden auf diese Weise korrigiert oder ergĂ€nzt, sondern auch Bezeichnungen von GeschĂ€ften. Dabei stand und steht das Team vor der Herausforderung, das korrekte Schild dem korrekten GeschĂ€ft zuzuweisen. Werbeanzeigen daneben und darĂŒber mĂŒssen ausgeblendet werden, eventuell erwĂ€hnte Produkte und Marken ebenfalls. Eine 100%ige Erkennung ist somit natĂŒrlich nicht möglich, aber immerhin ein Datenabgleich mit bestehenden Datenbanken.

Wie das Ganze funktioniert beschreiben die Entwickler in einem ausfĂŒhrlichen Blogpost von Google Research und verlinken dort auch viele weitere verwendete Technologien. FĂŒr Entwickler ganz interessant, wie sich diese Technologien im Laufe der Zeit verbessert haben. Unter anderem hat Google auch fĂŒr diesen Zweck wieder auf die Hilfe der Community gesetzt und hat erkannte Schilder aus Streetview in Captchas verwendet – so konnte das System perfekt trainiert und mit korrekten Daten gefĂŒttert werden.

Insgesamt verfĂŒgt das Streetview-Team mittlerweile ĂŒber 80 Milliarden Fotos, die allesamt in den vergangenen Jahren analysiert wurden und auch weiterhin ausgewertet werden, um möglichst viele Daten herauszuholen.