Google nutzt Streetview zur Texterkennung bei Google Maps

Die Straßen dieser Welt verändern sich ständig, und das ist natürlich auch eine Herausforderung für die Google Maps – denn die App bzw. das dahinter liegende Datenmaterial muss Schritt halten und ständig aktualisiert werden. Das geschieht zum einen durch die Hilfe der Nutzer und kann zum anderen auch automatisiert erfolgen. Dazu setzt Google auf die Fotos der Streetview-Fahrzeuge, mit denen sich Straßenschilder und Namen von Geschäften vollautomatisch korrigieren lassen.

Auch wenn sie hierzulande längst von den Straßen verbannt sind, gibt es noch viele Teile der Welt, in denen die Fahrzeugen von Google Streetview regelmäßig unterwegs sind und frisches Fotomaterial liefern. Aber auch die Datenbank, der in der Vergangenheit aufgenommenen Fotos, enthält wertvolle Daten, die nun von den Algorithmen ausgewertet werden und das Kartenmaterial ergänzen und korrigieren sollen.

Das Team von Google Streetview hat Algorithmen entwickelt, mit denen sich die Beschilderung auf den Fotos vollautomatisch erkennen lässt. Das ist dank OCR, also Texterkennung, in der Theorie zwar keine große Herausforderung, in der Praxis aber eine Mammut-Aufgabe. Auf den Fotos befinden sich natürlich nicht nur Straßenschilder sondern auch Werbeanzeigen, Nummernschilder und viele weitere Dinge, die mit einem Straßenschild natürlich nichts zu tun haben. Diese müssen also alle erst einmal herausgefiltert werden.

Ist dann ein Straßenschild extrahiert, nimmt sich der Algorithmus alle verfügbaren Ansichten dieses Schildes und versucht den Text darauf möglichst genau zu erkennen. Dabei werden Abkürzungen wie Av., Str. oder Ln. automatisch erkannt und vervollständigt. Diese Schilder können dann dank der Geodaten der Fahrzeuge einer genauen Straße zugewiesen werden, so dass die Maps über den korrekten Namen verfügen. Herausforderung ist dabei vor allem auch das Ausblenden von Hausnummern und auch Schildern von kreuzenden Straßen.

Aber nicht nur Straßennamen werden auf diese Weise korrigiert oder ergänzt, sondern auch Bezeichnungen von Geschäften. Dabei stand und steht das Team vor der Herausforderung, das korrekte Schild dem korrekten Geschäft zuzuweisen. Werbeanzeigen daneben und darüber müssen ausgeblendet werden, eventuell erwähnte Produkte und Marken ebenfalls. Eine 100%ige Erkennung ist somit natürlich nicht möglich, aber immerhin ein Datenabgleich mit bestehenden Datenbanken.

Wie das Ganze funktioniert beschreiben die Entwickler in einem ausführlichen Blogpost von Google Research und verlinken dort auch viele weitere verwendete Technologien. Für Entwickler ganz interessant, wie sich diese Technologien im Laufe der Zeit verbessert haben. Unter anderem hat Google auch für diesen Zweck wieder auf die Hilfe der Community gesetzt und hat erkannte Schilder aus Streetview in Captchas verwendet – so konnte das System perfekt trainiert und mit korrekten Daten gefüttert werden.

Insgesamt verfügt das Streetview-Team mittlerweile über 80 Milliarden Fotos, die allesamt in den vergangenen Jahren analysiert wurden und auch weiterhin ausgewertet werden, um möglichst viele Daten herauszuholen.

Ads schalten wie die Profis

Newsletter-Anmeldung

Bestellen Sie jetzt die besten Tipps & Tricks aus unserem Nähkästchen.
Gratis und unverbindlich.

Name(erforderlich)
Name(erforderlich)
Hidden
Datenschutz(erforderlich)

Durch Absenden dieses Formulars erklären Sie sich mit unserer Datenschutzrichtlinie einverstanden.

Dieses Feld dient zur Validierung und sollte nicht verändert werden.