Google 'leest' huisnummers in Street View

Google onderzoekt de beste manier om huisnummers zichtbaar in Street View automatisch te analyseren. Hiermee kan de zoekgigant adressen nauwkeuriger bepalen.

Google geeft in zijn fotonavigatiedienst Street View adressen nu bij benadering weer. De zoekgigant wil dit verbeteren en onderzoekt automatische manieren voor de detectie van huisnummers die zichtbaar in beeld zijn.

Huisnummers lezen
Samen met Stanford University heeft Google het detecteren en analyseren van cijfers onderzocht. Het doel is openlijk geformuleerd al: "het lezen van huisnummers van straatniveau-foto's."

Volgens Google is deze nummerherkenning handig voor een verbetering van de routenavigatie via zijn online-diensten. Daarnaast zorgt de nummerherkenning voor een verbetering van de geocodering van adressen. De locatie op een kaart, op Street View-foto's en in het echt zijn dan beter op elkaar af te stemmen.

In plaats van extrapolatie
Tot op heden wordt er in wezen 'een slag naar geslagen'. Google legt uit: "In de meeste landen hebben weinig adressen geografische co÷rdinaten. De geocode van de meerderheid van de onbekende adressen wordt daarom berekend aan de hand van interpolatie van bekende adressen."

Dergelijke berekeningen zijn volgens Google allerminst feilloos en zorgen voor significante fouten. Dankzij huisnummerherkenning kan Google een betere geografische code berekenen voor de ontbrekende huizen.

OCR-module
De techniek is gebaseerd op een herkenningsmodule die ook gebruikt wordt in OCR-modules voor lijnherkenning. De techniek gaat er vanuit dat de huisnummers horizontaal staan weergegeven op de foto.

Vervolgens analyseert de module het huisnummer op verschillende cijfers en lettertypen. In een laatste analyse worden de getallen nogmaals geverifieerd om de 'false positives' eruit te filteren. Dat zijn dan cijfers of tekens die ten onrechte worden herkend als een bepaald huisnummer.

Navigatie en geocodes
De resultaten zijn op dit moment niet zo goed zijn als handmatige herkenning. De verwachting is dat een verbetering van de algoritmen van de OCR-module in de toekomst even goede resultaten zal geven. De automatische herkenning krijgt dan het voordeel van snelheid, en lage kosten.

In het onderzoek uitgevoerd met de Stanford universiteit heeft Google een database gebruikt van 600.000 gelabelde cijfers. Die zijn allemaal afkomstig van foto's uit Street View. Uiteindelijk is dit onderzoek uitgemond in een automatische leermethode die het beste scoorde op de proefdata.