Siirry pääsisältöön
Tilasto-oppaat
Tilastokeskuksen etusivulle

Tilastokuviot tutuksi

5 Miten tilastokuvioita tulkitaan?

5.1 Tulkinta on tilastojen lukutaitoa

Edellä opit perusasiat yleisimmistä tilastokuvioista ja tutustuit hieman myös muihin tilastotietoa havainnollistaviin esittämisen tapoihin. Kun tunnet eri kuviotyyppien ominaisuudet ja tiedät, milloin mitäkin kannattaa käyttää, olet tiellä kohti oikeaa tulkintaa.

Tässä osiossa perehdyt lyhyesti tilastokuvioiden tulkintaan. Muistilistan ja kokoamiemme vinkkien avulla voit tehdä luotettavammin päätelmiä tilastokuvioista ja niiden välittämästä tiedosta. Tutustut kuvioiden näkökulmaeroihin ja harhaanjohtaviin esittämisen tapoihin.

Kuvioiden tarkastelun voit aloittaa vaikka miettimällä, miten tuloksia pitäisi tulkita ja mitä niiden perusteella voi asiasta luotettavasti sanoa. Täyttääkö kuvio tehtävänsä eli välittää keskeisen informaation ymmärrettävästi?

5.2 Muistilistan avulla pääset hyvään alkuun

Olet sitten tilastokuvion tulkitsija tai laatija, on hyvä pitää mielessä seuraava muistilista. Mitä enemmän tulkinnan tueksi on saatavilla tietoa, sitä vähemmän syntyy väärinkäsityksiä tai tarvetta lähdekritiikille. Kun kuvion laatijana tarjoat riittävästi taustatietoa, esimerkiksi perusjoukkoon ja otokseen liittyvistä yksityiskohdista, voi tulkitsija tehdä luotettavammin päätelmiä kuvion välittämästä tiedosta. 

Kannattaa pohtia ainakin seuraavia asioita:

  1. Kuka (tilasto)tiedon on tuottanut?
  2. Mihin (tilasto)tieto pyrkii vastaamaan?
  3. Mikä on perusjoukko?
  4. Mikä on otoksen koko?
  5. Onko otos edustava?
  6. Miten asia on kysytty tai tiedot kerätty?
  7. Miten tieto vertautuu aiempaan ja/tai muihin maihin?

Perusjoukko, otos, edustava otos... Jos tilastokäsitteet ovat päässeet unohtumaan, ei hätää, voit kerrata niitä Tilastojen lukutaito -oppaasta. Keskeisiä käsitteitä on koottu myös tämän osion loppuun.

5.3 Harhaanjohtavan tilastokuvion voi tunnistaa

Hieno tilastokuvio ei tee huonosta datasta parempaa. Jos kuvion taustalla oleva data ei ole validia tai sitä on liian vähän, mikään kuvio ei sitä pelasta. Se on yksi tämän oppaan tärkeimmistä opeista, ellei kaikkein tärkein. Hyvä ja informatiivinen tilastokuvio syntyy ainoastaan laadukkaasta aineistosta asiantuntevan ajattelutyön lopputuloksena. 

Tilastokuvio ei ole koskaan koriste, jolla muutoin kuivakkaa tekstiä yritetään elävöittää, vaan sen tarkoitus on olla viestintuoja ja merkitysten kantaja. Se on tekstin ja muiden visuaalisten elementtien tavoin yksi keskeinen osa tiedon välittämistä.  

Ainakin näihin kolmeen seikkaan on hyvä kiinnittää huomiota:  

  • Summautuvatko prosentit sataan?
  • Onko dataa eli tietoa tarpeeksi keskiarvojen laskemiseen tai luotettavien jakaumien esittämiseen?
  • Ovatko suureet samoja? Toisin sanoen verrataanko prosentteja prosentteihin ja kappalemääriä kappalemääriin ja niin edelleen.

Seuraavaksi käydään läpi harhaanjohtavan tilastografiikan piirteitä esimerkkien avulla. Niihin tutustumalla opit tunnistamaan vaaranpaikat ja arvioimaan kriittisesti kuvioita, jotka eivät täytä tilastokuviolle asetettuja laatuvaatimuksia.

Vaaranpaikkoja ovat:

Värit toimivat tilastokuvioissa tehokeinoina

Värit ovat tilastokuvioiden keskeisimpiä elementtejä ja tehokeinoja. Värien erot hahmotetaan helpommin kuin monien muiden tehokeinojen. Yhtenäisellä värillä väritetty alue tai jatkuva viiva ovat myös tarkempi esitystapa kuin katkoviivat, rasteroinnit tai vastaavat visuaaliset koodaustavat.

Tilastokuvioilla pyritään maksimoimaan välitetyn viestin tehokkuus. Kaikkia käytössä olevia tehokeinoja pyritään hyödyntämään juuri siten, miten suurin osa lukijoista on taipuvainen niitä tulkitsemaan. Tämä pätee myös väreihin. 

Värit ja opitut tulkinnat

Värien tulkinta on osittain tiedostamatonta. Eri väreillä ei sinänsä ole mitään keskinäistä universaalia arvojärjestystä, vaan niiden tulkinnat ovat hyvin subjektiivisia tai kulttuurisidonnaisia. Perinteinen tilastografiikka pyrkii hyödyntämään ja varsin pitkälti jopa nojaa juuri näihin opittuihin kulttuurisidonnaisiin tulkintoihin, vaikka se siitä kritiikkiä ajoittain saakin. 

Eri värit ovat keskenään tasa-arvoisia. Värisävyjen tummuusasteet kuitenkin tulkitaan varsin yleisesti niin, että tummempi on enemmän, tiheämpi tai jopa tärkeämpi kuin vastaavat vaaleammat sävyt. Tämän takia tilastokuvioissa ja -kartoissa on yleensä merkitty luokat sitä tummemmalla värillä, mitä suurempi lukuarvo tai mitä oleellisempi luokka on kyseessä. Eri väreillä ja värisävyillä tulee olla myös riittävästi kontrastia, jotta erottelukyky säilyy. Lue lisää saavutettavuudesta osiosta 6.5 Tilastokuvion saavutettavuutta et voi ohittaa.

Vinkkejä värien käyttöön

Useissa tilastokuviotyypeissä, kuten hajontakuviossa tai tavallisessa pylväskuviossa, on hyvä käyttää vain yhtä väriä. Toisella värillä voi kuitenkin korostaa jotain yksittäistä tai muutamaa erityisen merkittävää luokkaa.  

Väreillä on mahdollista sitoa loogisesti toisiinsa liittyvät luokat visuaalisesti tiiviimmin toisiinsa yksittäisen tilastokuvion sisällä. Jos samassa esityksessä on useita tilastokuvioita (esimerkiksi dashboard), niin samaa väriä käytetään kaikissa kuvaamaan samaa asiaa, ja eri värillä kuvataan eri asioita. Luokkaeroasteikollisissa vertailuissa tulisi käyttää toisistaan selkeästi erottuvia värejä. Jatkuva-arvoisissa mitta-asteikoissa on paikallaan käyttää suhteellista väriskaalaa eli yhden värin eri tummuusasteita.

Digitaaliset esitystavat mahdollistavat väriskaalojen käyttämisen niin, että värin tummuus heijastaa hyvinkin tarkkaan esitettyjen lukujen matemaattisia suhteita. Tätä hyödynnetään varsinkin teemakartoissa. Tarkoilla väriskaaloilla voidaan tuoda myös muihin tilastokuvioihin jokin lisäulottuvuus, joka mahdollisesti selittää kyseisen tilastokuvion välittämää tulkintaa. Kaikkia värien tummuusasteita ei ole tarkoituskaan erottaa, vaan kuviolla pyritään välittämään vain yleisiä painopisteitä ja mielikuvia.

Esimerkki 1. Värillä on väliä

Värit ovat vahvasti kulttuurisidonnaisia. Länsimaissa punaisen ajatellaan olevan rakkauden väri, mutta joissakin toisissa kulttuuripiireissä rakkautta symboloi esimerkiksi vihreä tai keltainen. Politiikassa punaisella viitataan tiettyyn poliittiseen suuntaukseen. Suomessa poliittisesti vasemmalla olevat puolueet ovat ottaneet tunnusväreikseen punaisen eri sävyjä, kun taas oikealle asemoituvat käyttävät sinisen sävyjä.

Ylen uutisessa kuvataan suurimpien puolueiden jakautumista arvokentällä. Kuviosta voit erottaa, miten eri värit ryhmittyvät samoille alueille.

Pidä edellinen graafinen esitystapa mielessäsi ja tutustu seuraavaksi Politico-lehden verkkojulkaisussa esiteltyyn poliittiseen karttaan (englanniksi). Huomaat varmaan, että samasta aiheesta voidaan käyttää väriyhdistelmiä suomalaisesta poliittisen värikartan tyylistä poikkeavalla tavalla. Vaikuttaako se tekemiisi tulkintoihin? 

Värien sisäänkirjoitetuilla ominaisuuksilla voidaan siis vahvistaa lukujen antamaa viestiä, mutta myös vääristää niistä syntyvää mielikuvaa. Kyse voi olla täysin tahattomasta tai ajattelemattomasta toiminnasta, mutta joissain tilanteissa kyseessä voi olla jopa tahallinen harhauttaminen. Ei siis ole aivan sama, mitä väriyhdistelmiä kuviossa käytetään ja millaisiin tehosteratkaisuihin lopulta päädytään. Kuvion laatijan näkökulmasta tärkeintä onkin pitää mielessä data, johon kuvio perustuu, ja esittää tulokset totuudenmukaisina. Tulkitsijalle puolestaan olennaista on ristiriidattomuus ‒ tulkinnanvaraa ei pitäisi jäädä.

Esimerkki 2. Värien käyttö vaikuttaa tulkintaan

Vasemmanpuoleisessa kuviossa tummemmalla sävyllä olevat pylväät erottuvat herkemmin, ja vähemmälle huomiolle tuntuvat jäävän vaaleamman sävyiset pylväät, vai miten itse tulkitset? Kun väritys kuviossa vaihdetaan päinvastaiseksi, myös katseen fokus saattaa vaihtua. Tulkinta tapahtuu alitajuntaisesti edelleen tummemman värin perusteella. 

Lähde: Vesa Kuusela, Se pieni ero. Tietoaika 3/2004

Valekerroin

Valekerroin on yksi tilastografiikan tunnetuimpia käsitteitä ja perustuu Edward Tuften ajatteluun. Valekertoimen idea on hyvin yksinkertainen. Sillä kuvataan sitä, miten täsmällisesti kuviossa esitetty ilmiön koko vastaa datan osoittamaa ilmiön kokoa. Jos valekertoimen arvo on tasan 1, kuvio esittää dataa totuudenmukaisesti. Jos kerroin poikkeaa tästä, kuvio vääristää ilmiön suuruutta. 

Tyypillinen esimerkki on sellainen, jossa kuvion pylväät korvataan esimerkiksi ilmiötä kuvaavilla symboleilla. Tällöin symbolien keskinäiset suhteet saattavat vääristyä kokoa muutettaessa ja vaikuttavat niiden välittämään informaatioon. Katso esimerkki 3.

Esimerkki 3. Symbolikuviot

Pinta-alaa tulkitaan vahvemmin kuin symbolin pituutta. Jos toinen vertailtavista luvuista on vain kolme kertaa suurempi kuin toinen, on parempi käyttää oheisessa kuviossa kolmen pienen sammakon mukaista esitystapaa kuin yhtä isoa sammakkoa, joka näyttää liki kymmenkertaiselta pienemmän sammakon rinnalla. Suositeltavaa tietenkin on pitäytyä perinteisissä tilastografiikan mukaisissa elementeissä kuten pylväissä.

Kuva. Sammakoiden lukumäärän kuvaaminen symboleilla.

Lue lisää valekertoimesta

Katkaistut asteikot

Asteikon katkaisu on yksi tyypillisimmistä tavoista tehdä tilastokuviosta harhaanjohtava. Todelliselta mittakaavaltaan pienet erot saadaan näyttämään suuremmilta, jopa dramaattisilta, kun asteikkoa leikataan sopivista kohdista.

Pylväskuviossa, joissa lukijan huomio kohdistuu määrällisiin eroihin, akselien katkaisu onkin käytännössä aina kiellettyä. Viivakuviossa, jossa lukijan huomio kiinnittyy ennen kaikkea kehityssuuntiin eli trendeihin, tilanne on toinen. Joskus viivakuviossa voi olla tarpeen korostaa aineistosta ilmeneviä pieniä muutoksia, jolloin asteikon katkaisu on aivan paikallaan. Seuraavassa esimerkissä katkaistua asteikkoa on käytetty perustellusti ja tarkoituksenmukaisesti.

Esimerkki 4. Vertaa alkuperäistä kuviota kuvioon, jossa on katkaistu akseli

Seuraavat esimerkit ovat viivakuvioita, mutta akseleiden leikkaaminen vaikuttaa merkittävästi myös pylväskuvioiden tulkintaan. Pohdi miten kuvioiden tulkinta muuttuisi, jos näkisit kuvioista vain toisen.

Kuvio. Bruttokansantuote vuosineljänneksittäin, volyymisarja, viitevuosi 2015 (mrd. euroa), alkuperäinen kuvio

Viivakuvio, jossa toinen viiva kuvaakausitasoitettua ja työpäiväkorjattua sarjaa ja toinen viiva alkuperäistä sarjaa. Y-akselin asteikko alkaa nollasta. Tällöin viivojen esittämä kehitys näyttää maltilliselta.

Kuvio. Bruttokansantuote vuosineljänneksittäin, volyymisarja, viitevuosi 2010 (mrd. euroa), katkaistu akseli

Viivakuvio, jossa toinen viiva kuvaakausitasoitettua ja työpäiväkorjattua sarjaa ja toinen viiva alkuperäistä sarjaa. Y-akselin asteikko alkaa 40 00:sta miljardista eurosta. Kun asteikko on suhteellisen tiheä, muutosta ja vaihteluväliä voi tarkastella yksityiskohtaisemmin.

Lähde: Kansantalouden tilinpito, taulukko 132h. Bruttokansantuote ja -tulo sekä tarjonta ja kysyntä neljännesvuosittain, 1990Q1‒ (StatFin)

Asiayhteys ja toisaalta esitettävien lukujen skaala määrittävät sen, onko akselin katkaiseminen tarkoituksenmukaista vai ei. Nyrkkisääntönä voi kuitenkin sanoa, että jos asteikon katkaisun syyt eivät ole ilmiselviä, tulisi sille löytyä avoimesti esitetyt perustelut. Jos perusteluja ei esitetä, kuvioon kannattaa suhtautua varauksella ja valmistautua selvittämään asian taustoja itse.

Esimerkki 5. Temppuna katkaistu akseli

Jos tilastokuvion asteikko ei siis ala nollasta, muutos tai esimerkiksi ominaisuuksien ero näyttää paljon todellista suuremmalta. Infograafissa kuvion asteikko alkaa arvosta 26,4 (metriä). Tällöin jarrutusmatkan pituus rengasmerkillä 4 näyttää yli kolminkertaiselta verrattuna rengasmerkkiin 1. Asteikon arvoista kuitenkin huomaa, että todellisuudessa eroa vain metri.

Esimerkkikuva katkaistun akselin vaikutuksesta. Kuvassa verrataan jarrutusmatkaa eri rengasmerkeillä. Akseli ei ala nollasta, jolloin jarrutusmatka rengasmerkillä 4 näyttää jopa kolminkertaiselta verrattuna rengasmerkkiin 1. Todellisuudessa jarrutusmatkojen ero on vain metri.

Venytetyt asteikot

Toinen erityisesti viivakuvioon liittyvä harhaanjohtavuutta lisäävä tekijä on kuvion mittasuhteiden venyttäminen. Mistä sitten tietää, ovatko akselit järkevässä suhteessa toisiinsa?

Puhtaasti teknisestä näkökulmasta kannattaa pyrkiä niin sanottuun diagonaaliperiaatteeseen. Tällöin tasainen kasvu asettuu 45 asteen kulmaan. Usein kuvio muodostuu tällöin sopusuhtaisen suorakaiteen malliseksi. Jos huomaat kuvion olevan huomattavasti korkeampi suhteessa sen leveyteen, kannattaa kuvioon ja sen välittämään tietoon suhtautua kriittisesti.

Sisällöllinen näkökulma on kuitenkin tärkein. Välitetyn mielikuvan tulisi olla mahdollisimman lojaali kuvattavan ilmiön kontekstiin. Maltilliset muutokset tulisi siis näyttää maltillisina ja jyrkät muutokset jyrkkinä. Hyvä esimerkki on ilmastonmuutos, jossa yhden asteen keskimääräinen lämpötilan nousu on matemaattisessa mielessä pieni, mutta käytännön vaikutusarvoltaan valtava yhteiskunnallinen muutos.

Seuraavassa esimerkissä 4 näet kolme esitystapaa samasta aiheesta. Kuviot näyttävät erilaisilta, vaikka tiedot ovat kaikissa täsmälleen samat.

Esimerkki 6. Valkoposkihanhien määrät eri asteikoilla esitettyinä

Seuraavassa näet kolme eri esitystapaa valkoposkihanhien määrästä pääkaupunkiseudulla vuosina 2010–2019. Tiedot ovat kaikissa kuvioissa täsmälleen samat, mutta akseleiden mittasuhteet ovat erilaiset. Esitystavassa 1 kuviokokoa on kavennettu huomattavasti ja esitystavassa 3 levennetty. Mikä esitystavoista on mielestäsi neutraalein?

Esitystapa 1. Valkoposkihanhien määrä pääkaupunkiseudulla vuosina 2010‒2019

Esitystapa 2. Valkoposkihanhien määrä pääkaupunkiseudulla vuosina 2010‒2019

Esitystapa 3. Valkoposkihanhien määrä pääkaupunkiseudulla vuosina 2010‒2019


Lähde:  Suomen ympäristökeskus, Valkoposkihanhien väheneminen pääkaupunkiseudulla taittui (syke.fi)

Entä jos haluaisit paisutella valkoposkihanhien määrän lisääntymistä, minkälaista vääristelyä kannattaisi mielestäsi käyttää? Jos taas haluaisit vähätellä hanhien aiheuttamaa vaivaa kaupunkialueilla, mikä ylläolevista kuvioista olisi silloin tehokkain?

Vaikeat vaikutussuhteet, mikä on syy ja mikä seuraus?

Tilastokuvioiden tulkinnassa hyödyt paljon siitä, että tunnet tilastotiedon peruskäsitteet ja määritelmät. Toisaalta vaikka hallitsetkin keskeiset tilastokäsitteet, voi joskus olla vaikea päätellä asioiden todellisia syy- ja seuraussuhteita. 

Kun tilastokuviossa esitetään vaikutussuhteita, on hyvä muistaa, että

  • vaikutussuhde tulee perustella tekstissä kuvion ulkopuolisilla lähteillä, esimerkiksi tutkimustuloksilla
  • tilastokuviota ei voi käyttää ainoana perusteluna vaikutussuhteelle
  • erityisesti sosiaalisessa mediassa on syytä suhtautua varauksella tilastograafiseen esitykseen, jos sen yhteydessä ei tarjota riittävästi tutkimus- ja taustatietoa tulosta selittämään. 

Vaikutussuhde voi myös olla näennäinen ja johtua jostain muusta taustalla vaikuttavasta tekijästä. Syynä voi olla esimerkiksi havainnoitavan populaation rakenteelliset muutokset. Hyvä esimerkki on syöpätapausten lisääntyminen. Sen on joskus tulkittu johtuvan pelkästään elinympäristön kemikalisoitumisesta. Sekin voi toki selittää osan syöpien lisääntymisestä, mutta merkittävä osa syöpien yleistymisestä johtuu ikärakenteen muutoksesta populaatiossa. Väestö siis vanhenee, elää nykyisin pidempään ja sairastaa aiempaa enemmän. Lue lisää vaikutussuhteista Tehokas tilastotiedonhaku -oppaasta.

Syy-seuraussuhteen toteamiseksi ei riitä sekään, että asiat esiintyvät tilastossa ajallisesti kytkeytyneinä. Kyse voi olla puhtaasta sattumasta tai esimerkiksi siitä, että asiat ovat sinänsä toisistaan riippumattomia, mutta johtuvat samasta syystä.

Tupla-asteikollinen viivakuvio − pysy valppaana!

Viivakuviossa esitetyillä ilmiöillä tulisi lähtökohtaisesti olla aina vain yksi yhteinen mittayksikkö ja -asteikko. Joskus samassa kuviossa käytetään kuitenkin kahta eri asteikkoa, joilla on eri mittayksiköt. Tällöin kannattaa olla valppaana!

Tupla-asteikollisessa viivakuviossa määrällinen aikasarjavertailu ei ole mielekästä. Eri mittayksiköllisistä ilmiöistä ei useinkaan voida sanoa kumpi on enemmän tai vähemmän kuin toinen. Kuviossa ne voidaan asetella kummin päin tahansa. Näin ollen kuvio saattaa joko tahallisesti tai tahattomasti välittää lukijalleen harhaanjohtavan mielikuvan asioiden keskinäisistä kokosuhteista. 

Halutaanko vain säästää tilaa?

Kuviontekijöillä on toisinaan taipumuksena yhdistää liian monia asioita samaan kuvioon. Sama asia tai käsite esitetään kahdella eri mittayksiköllä mitattuna. Ongelmaksi muodostuu tulkinta: viivoja verrataan herkästi toisiinsa ja etsitään syitä niiden samankaltaisuudelle tai erilaisuudelle. Kun kyse on samasta käsitteestä tai ilmiöstä, yhteys toki löytyy. Se on kuitenkin lähes aina joko puhtaasti matemaattinen tai seurausta jostain kolmannesta tekijästä, johon toinen indikaattoreista on joko suhteutettu, kerrottu tai summattu. 

Tulkinnan kannalta olisi tehokkainta esittää kummatkin alkuperäiset indikaattorit sekä mahdollinen kolmas tekijä suoraan laskettuina omina kuvioinaan. 

Tarkkana myös asteikkojen skaalauksessa

Tupla-asteikkojen ongelma on, että ne voidaan skaalata keskenään lukemattomin eri tavoin. Asetuksia muuttamalla eri viiteviivojen muodot ja sijainnit suhteessa toisiinsa voivat välittää myös vääriä mielikuvia asioiden keskinäisistä suhteista. Tutustu esimerkkiin 6 ja huomaat, millaisia haasteita tupla-asteikollisen kuvion tulkintaan voi liittyä. Myös infograafissa voit nähdä vastaavanlaisia uhkia.

Esimerkki 7. Tupla-asteikollinen viivakuvio (1)

Tässä esimerkissä on esitetty kotimaan kuorma-autoliikenteen liikennesuorite ja kuljetussuorite vuosilta 2011–2021. Liikennesuorite on arvio kaikkien kuorma-autojen kotimaan tavarankuljetuksiin koko vuoden aikana ajamasta yhteismatkasta miljoonina kilometreinä. Kuljetussuorite puolestaan kuvaa koko kuljetustyön määrää eli ajettujen kilometrien ja kuljetetun tavaramäärän tuloa miljoonina tonnikilometreinä.

Indikaattorien erilaiset mittayksiköt eivät sinällään edellyttäisi tupla-asteikon käyttöä kuviossa. Tulkintaa hankaloittaa erityisesti indikaattoreiden eritasoiset skaalaukset, eikä niiden trendien visuaalinen vertailu ole kuviovalinnalla mielekästä. 

Kuvio. Kotimaan kuorma-autoliikenteen suoritteet 2011–2021

Lähde: Tieliikenteen tavarankuljetukset

Kuviosta voi nähdä, että viimeisen vuosikymmenen aikana kuljetussuorite on pienentynyt lähes 20 prosenttia ja samaan aikaan liikennesuorite on puolestaan kasvanut lähes 20 prosenttia. Kuvio osoittaa, että kuorma-autoliikenteen tavarankuljetusten lastien keskimääräinen paino on huomattavasti kasvanut. Tämä johtuu pääasiassa siitä, että kuorma-autojen keskimääräinen tilavuus on huomattavasti kasvanut. Lisäksi mahdollinen syy on, että niiden keskimääräinen täyttöaste on myös kasvanut.

Jos tämä on se asia, joka kyseisellä kuviolla on haluttu tuoda esiin, niin hyvä. Valmiiksi laskettuna ja yhden viivan kuviolla esitettynä tämä olisi kuitenkin tullut vieläkin tehokkaammin ja selkeämmin esiin ja juuri oikealla mittayksiköllä mitattuna.

Kuvion tekijä on saattanut päätyä esittämään nämä kaksi eri indikaattoria samassa kuviossa myös pelkästään säästääkseen tilaa. Suositeltavampaa olisi kuitenkin kuvata kumpikin eri mittayksiköllinen ilmiö omana kuvionaan. Tällöin niiden trendit olisivat selkeämmin havaittavissa, eikä niiden keskinäinen vertailu veisi turhaa huomiota lukijalta. 

Lukijaa saattaa hämätä myös se, että tupla-asteikollisen kuvion hilaviivat noudattavat vain ensisijaisen akselin mukaisia arvoja. Vaikka viivakuviossa akselin katkaisu on joissain tilanteissa perusteltua, tupla-asteikollisessa kuviossa se ei ole suositeltavaa. Riskinä on, että tietoviivojen keskinäiset suhteet vääristyvät.

Asteikkojen keskinäinen skaalaus edellyttää, että asteikoilla on jokin yhteinen looginen viitearvo. Useimmiten se on nolla tai esimerkiksi indeksien tapauksessa 100. Toinen edellytys on jokin viiteajankohta, jossa verrattavat tietoviivat leikkaavat toisensa. Mieluiten tämä on kuvion ensimmäinen viiteajankohta. Tällöin nämä eri mittayksiköt on indeksoitu keskenään kyseisen viiteajankohdan mukaan. Siten kuviosta on havaittavissa kummankin prosentuaalinen ajallinen muutos suhteessa itseensä. Se on eri mittayksiköllisten ilmiöiden ainoa loogisesti vertailtavissa oleva yhteys.

Luvut olisi siis hyvä muuttaa indeksipisteluvuiksi heti alussa. Tällöin niiden arvot ovat selkeästi luettavissa yhteisestä mitta-asteikosta. Kyseessä on prosentuaalinen muutos suhteessa viiteajankohtaan. Huonona puolena on, että tällä menettelyllä hävitään alkuperäiset lukuarvot. Toisaalta ne voitaisiin esittää kullekin indikaattorille varatuissa omissa kuvioissaan. Varsinkaan verkossa tila erillisille tilastokuvioille harvoin loppuu kesken.

Tulkinnan ja päätelmien vaikeus

Oikeiden tulkintojen ja päätelmien tekeminen pelkkien tilastojen pohjalta on aina hankalaa. Tilastokuviolla voidaan lukujen suhteita visuaalisesti korostaa, mutta yksinkertainenkaan kuvio ei välttämättä tee niiden tulkinnasta yksinkertaista, Oikea tulkinta edellyttääkin aina tarkkaa perehtymistä mitattuihin käsitteisiin, käytettyihin luokituksiin ja muuhun aineiston syntyhistoriaan. Tärkeää on tuntea käsiteltävän ilmiön luonne. Kaikista tärkeintä on kuitenkin oma mielenkiinto, uteliaisuus, kriittisyys ja pohdinta. Mahdollisia selityksiä ja syy-seuraussuhteita on usein monia, ja kaikkia niitä on harvoin nostettu kuvion yhteydessä esiin.

Esimerkki 8. Tupla-asteikollinen viivakuvio (2)

Infograafista nähdään, että ajokortin haltijoiden ja liikennerikosten määrät on esitetty samassa kuviossa. Ajokortillisia on Suomessa miljoonia, kun taas liikennerikoksia kirjataan vuosittain reilut satatuhatta. Kuviosta voi kuitenkin syntyä vaikutelma, että liikennerikoksia tehtäisiin enemmän kuin Suomessa on ajokortillisia. Tulkinnassa onkin syytä olla varovainen.

Infograafi kahden asteikon kuviona ajokortillisten henkilöiden ja liikennerikosten määriä vuosina 2014-2022.

Esimerkki 9. Keskitulot nousivat Sodankylässä selvästi 

Oletetaan, että tutkimuksen mukaan asuntokunnan käytettävissä oleva rahatulo kulutusyksikköä kohden kasvoi selvästi seitsemän vuoden aikana. Tulokset esitetään viivakuviolla. Mitä vaihtoehtoisia tulkintoja tämä kuvio sinulle tarjoaa? 

Kuvio. Asuntokuntien käytettävissä oleva rahatulo (mediaani) kulutusyksikköä kohden Sodankylässä vuosina 2006–2013

Lähde: Tulonjakotilasto, taulukko 118w. Asuntokuntien lukumäärät, tulot ja tulojen rakenne kunnittain, 1995– (StatFin)

Mitä kuvitteellisessa esimerkissä oikeastaan tapahtui? 

  • Kaikkien sodankyläläisten tulot nousivat?
  • Jonkin ryhmän tulot kasvoi, muiden pysyivät ennallaan?
  • Kenenkään tulot eivät kasvaneet, vaan köyhät kuolivat tai muuttivat pois?
  • Kenenkään tulot eivät kasvaneet, vaan alueelle muutti rikkaita?
  • Kotitalouksien tulot pysyivät ennallaan, mutta henkilömäärä muuttui, kun lapset kasvoivat aikuisiksi?

Tulkitse taiten ‒ lue lisää!

Ylen Oppiminen-verkkopalvelussa on kooste tilastojen tulkinnasta ja yleisimmistä kompastuskivistä. Jutussa avataan yksinkertaisilla ja havainnollistavilla esimerkeillä tilastojen lukutaidon keskeisimpiä piirteitä.

Kertaa käsitteitä

Tilastotieteen keskeisiä käsitteitä voit kerrata Tilastojen lukutaito -oppaasta. Laajemmin tilastoissa käytettyjä käsitteitä löydät Tilastokeskuksen sivuilta.

  • Otos on varsinaisesta kohderyhmästä poimittu näyte, jonka perusteella voidaan saada kuva koko kohderyhmän ominaisuuksista.
  • Perusjoukko on joukko, jota otos edustaa.
  • Prosentti on sadasosa jostain.
  • Valekerroin kuvaa sitä, kuinka paljon kuvio liioittelee muutosta.
  • Viiteajankohta on se aika tai aikaväli, jota tilaston tieto kuvaa.