Business, Technology

Asuntojen trendit ja miten niistä tehdään luotettavia ennusteita

May 6, 2015

Read time 2 min

Kannattaako kauppa -palvelun idea on paljastaa asuntojen hintojen todelliset trendit yksittäisten hintojen takaa. Saat palvelusta postinumeroalueiden asunto-osakkeiden hintatrendit, jotka on mallinnettu huippuluokan tilastollisilla malleilla.

Avoimen datan käyttö on sekä julkisella että yksityisellä sektorilla nousussa. On hyvä, että sekä päättäjät että me kansalaiset saamme tietoa. Pelkkä data ei kuitenkaan riitä: esimerkiksi julkisuutta keräävät hintakehityksen “parhaat” ja “huonoimmat” listat ovat usein tiheämpiä taajamia lukuun ottamatta hyvin satunnaisia. Jos alueella on toteutunut osakekauppoja vain muutamia – ja näin usein on – on sattumalla suuri osuus tuloksiin. Pelkän raakadatan visualisointi tai luettelointi johtaa helposti virheellisiin johtopäätöksiin tilanteissa, joissa dataa on vähän tai sen laatu on heikkoa.

Tämä ei ole ylipääsemätön asia. Olemme tehneet analytiikkaa pitkään ja haluamme avoimella datalla ja koodilla näyttää, miten puutteellisestakin datasta voidaan saada parempaa ja kattavampaa informaatiota. Asuntojen hinnat ovat useimpia suomalaisia kiinnostava aihe ja myös yhteiskunnallisesti merkittävä kysymys, joten se toimii tässä tapauksessa oikein hyvänä esimerkkikohteena.

Analytiikkaa tarvitaan moneen, markkinoinnin kohdentamisesta  yhteiskunnalliseen päätöksentekoon ja vaikuttavuusarviointiin. Kohdistettaessa markkinointia, tai vaikkapa päätettäessä vesitornin vedenkorkeutta, mutu-säännöillä haaskataan aikaa ja rahaa verrattuna kunnolla optimoituihin malleihin. On siis kullankallista, että datan hyödyntämisellä on perusteltu, tieteellinen lähtökohta.

Kuinka palvelu rakennettiin?

Teimme Kannattaako kauppa -palveluun kahdenlaista ennustamista: sekä menneisyyden että tulevaisuuden trendin hahmottamista. Varsinkin tulevaisuuden ennustamiseen liittyy tekijöitä, joita malli ei voi ottaa huomioon. Vasta vuoden 2016 jälkeen nähdään, miten siinä onnistuimme. Emme siis voi luvata mitään.

Toteutuneiden kauppojen osalta tiheästi asuttujen alueiden tilanne on joskus selkeä ilman mallintamistakin, koska kauppoja on paljon. Sen sijaan syrjäisemmillä seuduilla kauppojen määrä on pieni, ja Tilastokeskus sensuroi keskimääräisen hinnan, jos se lasketaan alle kuudesta kaupasta.

Bayesilainen hierarkkinen mallimme ottaa huomioon tiedon epävarmuuden eli kauppojen määrän vuotta kohden, hyödyntää tietoa naapuripostinumeroista, jos alueet ovat annetun datan puolesta samankaltaisia, käyttää apuna väestötiheyttä ja hyödyntää hintojen ja hintojen muutosten korrelaatioitakin. Näin saadaan hinta-arvio jopa postinumeroalueille, joilla ei ole yhtään julkistettua kauppaa. Lue lisää tilastollisesta mallistamme tästä blogautuksesta.

Mallimme perustuu kokonaan julkiseen, avoimeen asunto-osakkeiden hintadataan ja väestömääriin. Alan toimijoilla ja viranomaisilla on yksityiskohtaisempaa tietoa hinnoista, jolloin vastaavia ennusteita voitaisiin tehdä vielä paremmin.

Never miss a post