Digitransit-osoitehaku käyttää seuraavia lähdeaineistoja:
Osoitehaku palauttaa kohteita ensisijaisesti sen perusteella, kuinka hyvin kohteen ominaisuustiedot täsmäävät käyttäjän syöttämästä merkkijonosta tulkittuihin tietoihin. Kohteen laadulla, koolla tai suosiolla on vain vähäinen merkitys. Esimerkiksi haku 'Linnamäki' palauttaa joukon kohteita, joiden nimi on täsmälleen hakutermi. Suosittu Helsingin Linnanmäki ei mahdu hakutuloksiin.
Haku on jossain määrin 'sumea', eli se osaa palauttaa kohteita, joiden nimi tai muut tiedot eivät täysin täsmää hakutermin kanssa. Näin tapahtuu silloin, kun riittävää määrää täysin täsmääviä kohteita ei löydy. Hakutermin kirjainten painoarvo vähenee loppua kohden: haku 'Nappi' palauttaa ehdotuksen 'Nappila', mutta ei ehdotusta 'Lappi'.
Osoitehaku käyttää esimerkkiaineistolla opetettua keinoälyalgoritmia tulkitsemaan käyttäjän syöttämän merkkijonon jäsennellyksi tiedoksi. Menetelmä toimii varsin hyvin, kun kyseessä on merkittävä tai tunnettu kohde. Esimerkiksi haut 'Hämeentie 5, Helsinki' ja sama ilman pilkkua 'Hämeentie 5 Helsinki' tulkitaan molemmat seuraavasti:
Pienillä kohteilla, kuten 'Mäkitie 1 Kuru' keinoälyjäsennys ei toimi yhtä luotettavasti. Tällöin erotinmerkki auttaa jäsentämään tiedot oikein. Täysin jäsentämättömät haut toimivat yleensä huonosti, sillä haku saattaa päätyä vertailemaan kadunnimeä kaupungin nimen kanssa.
Digitransit-reittioppaan käyttöliittymä hakee tyypillisesti 20 ehdotusta osoitehaussa. Usein lähdeaineistosta löytyy tätä enemmän hakutermiä hyvin vastaavia kohteita. Kohteiden järjestäminen paremmuusjärjestykseen ratkaisee, mitkä ehdotuksista päätyvät käyttäjälle esitettyyn tuloslistaan. Yhtä hyvin täsmäävät kohteet järjestetään tällöin seuraavien sääntöjen mukaisesti, tässä esitetyssä sääntöjärjestyksessä:
Kohteen tyyppi seuraavassa tärkeysjärjestyksessä: maakunta, kunta/kaupunki, postitoimialue, asema, katu/tie, katuosoite, paikka, pysäkki, kaupunginosa. Esimerkki: Haku 'Jämsä' palauttaa Jämsän kaupungin ennen Jämsän kylää Mikkelissä.
Lähdeaineisto. Aineistot ovat muutoin samanarvoisia, mutta OpenStreetMap priorisoidaan muiden edelle.
Kohteen tunnettuus/suosio. Tämä tieto on käytettävissä vain osalla aineistoista ja kohdetyypeistä. Esimerkiksi OpenStreetMap-aineiston julkisen liikenteen terminaaleille ja asemille annetaan korkea suosioarvo. Vähäpätöisen rakennuksen (vaja, autotalli tms) osoitetieto saa taas pienen suosioarvon.
Etäisyys hakijan sijainnista. Reittiopaspalveluissa on mahdollisesti käytössä hakua tekevän henkilön paikannustieto. Lähellä olevat kohteet tulkitaan tällöin paremmiksi kuin kaukaiset kohteet. Esimerkki: haku 'R-kioski' palauttaa lähimmän kioskin ensimmäisenä.
Aakkosjärjestys kohteen kuntanimen mukaan. Haku 'Polvikatu' palauttaa Polvikatu, Lahti ennen kohdetta Polvikatu, Tampere.
Osoitenumeron poikkeama haetusta, mikäli kyseessä on katuosoitehaku. Haku 'Mikonkatu 5' palauttaa lähiosoitteet järjestyksessä Mikonkatu 5, Mikonkatu 4, Mikonkatu 6, Mikonkatu 3, Mikonkatu 7, Mikonkatu 2, Mikonkatu 8.
Yllä esitetyt periaatteet kuvaavat haun toiminnan digitransit-palvelurajapintojen kautta. Digitransit-reittioppaan verkkosivuilta tehdyssä osoitehaussa on kuitenkin huomioitava seuraavat seikat, jotka vaikuttavat hakutuloksiin:
Liikennepoliittiset painotukset
Koska kyseessä on julkisen liikenteen reitityspalvelu, asema- ja terminaalityyppisiä kohteita suositaan
5%. Pysäkkien pisteytystä taas lasketaan 5%, koska niillä on toistuvanimisinä taipumus täyttää hakulistan
koko alkuosa. Lisäksi matkustaja ei yleensä ole menossa pysäkille, vaan se on pelkkä välietappi matkalla.
Vanhat haut ja suosikit
Aiemmin suoritettuja hakuja ja käyttäjän lisäämiä suosikkeja suositaan hiukan. On huomattava, että
kyseiset kohteet eivät ole suoraan vertailukelpoisia osoitehaun löytämien kohteiden kanssa, koska
suosikit ja vanhat haut ladataan selaimen paikallismuistista, eikä niille muodostu yhdenmukaista
pisteytystä osoitehaun kanssa.