Voiko tilastoihin luottaa?

“Vale, emävale, tilasto”, kuuluu vanha sanonta. Leikkimielisessä sananparressa piilee kuin piileekin totuuden siemen, sillä numerot ja luvut kertovat harvemmin koko totuutta asioista. Pelkkiä tilastoja tuijottamalla saa monesta ilmiöstä ja kokonaisuudesta usein varsin yksipuolisen kuvan ja niitä saatetaan käyttää jopa tahalliseen harhaanjohtamiseen. Oma lukunsa ovat myös virheelliset tulkinnat ja puutteellisesti kerätyt tiedot. Näistä vaaroista huolimatta maailma, jossa elämme, nojautuu hyvin pitkälti tilastojen ja niiden kautta tulkittavan tiedon varaan. Törmäämme päivittäin erilaisiin tilastoihin ja niistä johdettuun informaatioon, joten terve varovaisuus, lähdekriittisyys ja kyky tulkita tilastoja oikein ovat todella tarpeen.

Tilastojen esittely on oiva tapa saada etenkin kyseessä olevasta asiantilasta hieman huonommin perillä olevat ihmiset vakuuttumaan tutkimustuloksista ja muusta – kenties virheellisestäkin – tiedosta. Esimerkkinä toimivat vaikkapa Suomen työttömyystilastot: työttömyysprosentin saa siivottua mairittelevammaksi helposti, kun työllistyneiksi lasketaan myös vaikkapa palkattomissa tai todella pienipalkkaisissa työharjoitteluissa olevat ja TE-toimiston järjestämiin koulutuksiin osallistuvat henkilöt. Tällaisen siivotun prosentin esittely antaa vaikutelman todellisuutta ruusuisemmasta työllisyystilanteesta, mikä puolestaan on epäilemättä hyödyksi monille tahoille aina poliitikoista maamme maineeseen luottoluokituksineen. Tilastoihin ja erilaisiin tutkimustuloksiin tutustuessaan onkin hyvä pitää mielessä, ettei kaikkia tutkimuksia ole suinkaan tehty puolueettomasti.

Monenlaisia tilastoja – monenlaisia sudenkuoppia

Tilastoja on montaa eri sorttia. Esimerkiksi urheilutilastot ovat hyvin erityyppisiä kuin vaikkapa ihmisten työllistymistä, rikollisuuden määrää tai muita yhteiskunnallisia asioita kuvaavat tilastot. Kokeneet vedonlyöjät ja kovat urheilufanit kuitenkin tietävät, että urheilutilastoihin pätevät hyvin pitkälti samat lainalaisuudet kuin muihinkin tilastoihin: ne harvoin kertovat koko totuutta, vaikka lukemat paikkansa pitäisivätkin. Menestyvä veikkaaja harvemmin luottaakaan pelatessaan pelkkään tilastojen antamaan tietoon, vaan ottaa huomioon myös muut seikat ja ennen kaikkea tulkitsee tilastoja varoen sekä erilaiset tekijät huomioiden. Oma lukunsa urheilun maailmassa on elektroninen urheilu, josta siitäkin tuotetaan jatkuvasti erilaisia tilastoja. Parhaan käsityksen lajista saa kuitenkin siihen kokonaisvaltaisemmin perehtymällä: opi kaikki mitä olet halunnut tietää e-urheilusta, niin saat tilastoistakin enemmän irti, etkä mene halpaan.

Urheilutilastoja tarkastellessa on tärkeä muistaa, että tuloksiin vaikuttavat monet asiat aina sääolosuhteista vastapuolen edustajiin, eivätkä menneet tapahtumat välttämättä korreloi tulevien kanssa. Poliittisessa keskustelussa ja uutisoinnissa dataa taas käytetään usein tarkoitushakuisesti liittäen yhteen sellaisia asioita, joilla ei todellisuudessa ole syy-seuraussuhdetta. Ilmiöön, jossa kaksi asiaa esiintyy yhdessä ilman, että kumpikaan kuitenkaan johtuu toisesta, viitataan usein hauskankuuloisella termillä jäätelökorrelaatio. Nimi juontaa juurensa argumentointivirheestä, jossa jäätelön syönnin päätellään aiheuttavan ihmisten hukkumista, sillä tilastollisesti ensimmäisen kasvaessa myös toinen lisääntyy. Jäätelön kulutuksen kasvulla ja lisääntyneillä hukkumisilla todella on yhteys – lämpimät kesäsäät – mutta kumpikaan ei johdu toisesta.

Oikea tulkinta ja lähdekriittisyys – luotettavuuden avaimet

Tilastoja näkyy eri medioissa päivittäin eikä niiden ymmärtäminen ole aina helpoimmasta päästä. Kuten aina tietoa etsiessä, myös tilastoja tutkiskellessa on tärkeää muistaa lähdekriittisyys. Kuka tilaston esittää ja millaisin intressein? Onko taustalta löytyvä tutkimus tehty asianmukaisella ja objektiivisella tavalla? Vaikka itse tilastot olisivatkin peräisin luotettavalta taholta, niiden esittämis- ja tulkintatavat voivat johtaa ihmisiä harhaan joko tarkoituksella tai tahattomasti. Yksi ja sama tilastotieto voidaan esittää toisistaan rutkasti poikkeavilla tavoilla: jos vaikkapa uutisoidaan asunnottomien määrän olevan jonakin tiettynä vuonna 6600 henkilöä, ei se kuulosta järin mukavalta. Toisaalta samasta tilastotiedosta voidaan saada aikaiseksi myös varsin positiivinen uutinen, jos kerrotaankin asunnottomuuden laskeneen edellisvuodesta 200 henkilöllä.

Suomessa virallisia tilastoja julkaisevat muun muassa Tilastokeskus ja Kela. Tällaisten tahojen julkaisemat tilastot ovat pääsääntöisesti luotettavia, mutta on syytä muistaa, että niillä on julkaisijasta huolimatta aina omat rajoitteensa ja myös viralliset tilastot voivat olla harhaanjohtavia tai jopa virheellisiä. Syy voi piillä esimerkiksi aineistossa, laskentamenetelmässä, liian pienessä otoksessa tai yksinkertaisesti inhimillisessä virheessä. Niinpä tilastoja ei kannata uskoa täysin sokeasti, vaikka ne ovatkin parhaimmillaan todella informatiivisia ja ennen kaikkea mielenkiintoisia. Taitava tilastojen tulkinta ja siihen kuuluva terve kriittisyys ovat kansalaistaitoja, jotka jokaisen kannattaa ottaa haltuun.