Datankesyttäjä, kybermaailman sankari

Datatieteilijää on luonnehdittu vuosisadan seksikkäimmäksi ammatiksi. Ei ihme, sillä dataan perustuva koneoppiminen ja tekoäly ovat tulleet keskuuteemme ja hurmanneet meidät. Kone ohjaa autojamme, suosittelee tuotteita ostettavaksemme ja ohjelmia katsottavaksemme ja vielä tunnistaa kuvia ja puhetta.

Sen sijaan siitä arkisemmasta ja pitkäpiimäisestä datatyöstä, joka on toimivan tekoälysovelluksen välttämätön edellytys, puhutaan usein kiusaantuneeseen sävyyn. Se kun ei ole seksikästä. Digitalisaation sankaritaruun eivät kuulu tietokantaskeemojen tavaaminen, datan vääntäminen sopivaan muotoon, pitkäpiimäiset selvittelyt kenttien merkityksestä, syntyhistoriasta ja jakaumista. Miksi koneoppimisprojektit eivät lennä helpommin? Kyllähän tekoälyn pitäisi onnistua, kun vain on paljon dataa!

Muodikas digitalisaatiopuhe yliarvioi algoritmien kyvyn tehdä lapiohommia. Kuitenkin suuri osa data- tai tekoälyprojektien välttämättömistä töistä on kaikkea muuta kuin sci-fi-sarjojen säihkettä ja algoritmien kehittelyä. Datan esikäsittelyyn kuluva työmäärä tulee helposti aliarvioiduksi. Samalla ylenkatsomme sitä tietoa ja viisautta, joka kertyy nöyrästä siivoustyöstä digitalisaation kellareissa ja ihmisten kohtaamisista asioiden selvittelemiseksi.

Heikko ja vahva tekoäly

Nykyiset järjestelmät tekevät tosiaan vaikuttavia suorituksia kuvan- ja puheentunnistuksessa, auton ohjaimissa tai go-laudan ääressä. Nämä saavutukset ovat merkittäviä. Samalla ne helposti hämäävät meitä uskomaan, että niiden taustalla olevalla tekoälyllä olisi muita, yleisinhimillisiä kykyjä. Tekoälyä on kuitenkin vielä hankala saada itsestään suorittamaan käsitteellisiä ja huonosti määriteltyjä ongelmia: Miten tiedot tulevat reaalimaailmasta tähän toiminnanohjausjärjestelmään? Mitä tämä tietue tarkoittaa tietokannassa? Mitä pitäisi ennustaa? Mitä toimenpiteitä pitäisi tehdä, jotta nimenomaan tämä bisnes tuottaisi enemmän rahaa?

Parhaatkin nykyiset tekoälyt ovat kapeita. Ne eivät vielä inhimillisessä mielessä ymmärrä ihmisten maailmaa – eivätkä edes ihmisten rakentamia tietojärjestelmiä. Sekä yrityksen datan että yrityksen tavoitteiden abstraktiotaso on hyvin korkea. Lisäksi tavoitteet ovat tilannesidonnaisia, monitulkintaisia ja inhimillisen monimutkaisia. Tietojärjestelmä, vaikka se olisikin big dataa, sisältää asioiden merkityksestä ja yrityksen tavoitteista vain hyvin kalpean kuvan. Paraskaan syvä neuroverkko ei voi yksin taikoa siitä tulosta. Pelkästään datan esikäsittelyä ja integrointia varten pitää todella ymmärtää, mitä maailmassa tapahtuu – tietää “ihmisten juttuja”. Jotta tehtävästä selviäisi autonomisesti, tarvittaisiin vahva ja valistunut tekoäly, jota ei vielä ole olemassa.

Datatyö on oppimista organisaatiosta

Tekoäly on siis vielä kapeaa ja tässä mielessä heikkoa. Se auttaa yleisessä ongelmanratkaisussa vain vahvasti tuettuna, toteutettiinpa tekoälyä sitten syväoppimisella, todennäköisyysohjelmoinnilla, perinteisellä koneoppimisella tai vaikka asiantuntijajärjestelmällä. Siksi meitä ihmisiä tarvitaan monessa paikassa vielä pitkään. Meitä tarvitaan ensiksikin määrittelemään yrityksen tavoitteet, sillä ne pohjautuvat inhimillisiin aikeisiin ja päämääriin. Toiseksi ihmisen varassa on ainakin toistaiseksi datan mallintaminen ja esikäsittely tekoälyä varten – eli se ei-niin-seksikäs osuus. Tällainen datatyö on välttämätöntä, jotta organisaatio saa datasta arvoa.

Vahvaa tekoälyä ei vielä ole, mutta kun kapea tekoäly tai edes tilastollinen malli saadaan sopivaan tehtävään ja optimoimaan oikeita asioita, se peittoaa ihmisen monissa tehtävissä vähintäänkin tasaisella laadullaan ja kapasiteetillaan.

Datatyö ei ole kainosteltava, toisarvoinen taakka. Datatyö on oppimista. Sitä tehtäessä päästään konkreettisesti kiinni siihen, miten informaatio kerääntyy ja muokkaantuu organisaatiossa. Kuka todella tietää asioista, ja mitä tavoitteista ja datasta ylipäätään pitäisi tietää? Miten dataa kerätään ja miten sitä pitäisi kerätä? Miten se muuntuu matkan varrella? Miten tavoitteiden toteutumista testataan ja mitataan digitalisoituvassa organisaatiossa, joka alkaa soveltaa analytiikkaa, koneoppimista ja tekoälyä?

Nämä ovat datavetoisen toiminnan kannalta mitä olennaisinta tietoa prosesseista ja organisaatiosta.

Olemme jo kyberorganismi

Päätöksiä tekee jo nyt ihmisten ja tietojärjestelmän yhdistelmä. Kapea tekoälykin on jo täällä. Se ei vielä ole inhimillisessä mielessä äly, pikemminkin nippu tärkeitä refleksejä, jotka tehostavat toimintaamme tai matkivat kykyämme analysoida kuvaa, tekstiä tai puhetta. Tekoäly on kuitenkin vielä huolella istutettava organisaatioon. Tekoälyn idut kun ovat toistaiseksi patatyhmiä, mitä tulee korkean tason tavoitteiden laadintaan, ja diivamaisen herkkiä kohdatessaan valmistelematonta dataa.

Data ei ole organisaatiosta irrallinen olio. Liioin eivät johtajat, tai ihmiset ylipäätään, ole enää ainoita päätöksentekijöitä. Tekoäly ja analytiikka ovat happotesti sille, miten hyvin organisaatio toimii, sillä sekä ihmisten että koneiden on ymmärrettävä informaatiota ja tehtävä parempia päätöksiä sen perusteella. Kaiken on pelattava yhteen. Informaatio virtaa tietojärjestelmän ja ihmisorganisaation muodostamassa kokonaisuudessa. Digiajan organisaation tärkeä kysymys kuuluukin, miten yhdistää data, tekoäly ja ihmisten toiminta, sillä olemme jo kyberorganismi.

Recommended posts