Tilastokuviot tutuksi
Edellisessä osiossa tutustuit yleisimpiin tilastokuviotyyppeihin. Niistä kaikista on olemassa myös monimutkaisempia variaatioita, jotka muun muassa haastavat tutkimaan aineistoa useammasta ulottuvuudesta tai näkökulmasta. Moniulotteisesta kuviosta voi olla kiinnostavaa havainnoida esimerkiksi muuttujien välistä vuorovaikutusta. Näiden informatiivisempien kuvioiden tulkinta poikkeaa hieman yleisimpiin tilastokuvioihin sovellettavasta melko suoraviivaisesta tulkinnasta. Oikeaan johtopäätökseen päätyminen voi vaatia sinulta hieman enemmän aikaa ja ajatuksia.
Tässä osiossa esitellään myös sellaisia kuvioita, joita voi käyttää ainoastaan tietyntyyppisten aineistojen kuvaamiseen. Esimerkiksi puukaaviota voi käyttää hierarkkisen muuttujan kuvaamiseen, ja tutkakuvio soveltuu syklisen, sulkeutuvan ulottuvuuden aineiston havainnollistamiseen. Teemakartta puolestaan on erinomainen esitystapa aineistoon, jossa on mukana jokin alueellinen muuttuja. Tilastoteemakartoista on tulossa erillinen opas, jossa niitä käsitellään perusteellisesti.
Tutustu erilaisiin kuviotyyppeihin ja opit, millaisiin tilanteisiin ne soveltuvat parhaiten ja milloin niiden käyttö on perusteltua. Lopusta löydät kertaustehtäviä tästä osiosta. Saatko kaikki oikein?
Osiossa 3.2 Pystypylväskuvio tutustuit perinteiseen pystypylväskuvioon. Sillä esitetään ja verrataan määrien suhteita eli sitä, paljonko jotain on suhteessa johonkin muuhun. Pylväitä verrataan siis toisiinsa.
Kun pystypylväskuviossa vertaillaan useita eri osajoukkoja, ryhmiä tai samalla mittayksiköllä mitattuja ilmiöitä keskenään, puhutaan pystypylväsryhmäkuviosta. Eri ryhmien kehitystä vertaillaan ajan suhteen. Hyvässä kuviossa vertailtavia ryhmiä ei ole liikaa: kaksi ryhmää on hyvä, yli neljän ryhmän vertailu on kokonaisuuden hahmottamiseksi hankalaa. Katso esimerkki 1, jossa vertailussa on kolme ryhmää.
Kuviossa vertaillaan vieraan kielen osaamista kolmen eri kouluasteen suorittaneella aikuisväestöllä. Koulutusasteet ovat perus-, keski- ja korkea-aste ja ne on merkitty kuvioon erivärisillä pylväillä. Koska mittausajankohdat eivät ole täysin tasavälisiä, on oikein käyttää tässä tapauksessa pystypylväsryhmäkuviota viivakuvion sijaan.
Pystypylväsryhmäkuviosta pystyt myös vertailemaan eri koulutusasteiden osuuksia kunakin erillisenä ajankohtana paremmin kuin viivakuviosta. Viivakuviohan sopii paremmin trendien ja kehityssuuntien vertaamiseen.
Kuvio. Vähintään yhtä vierasta kieltä osaavat koulutusasteen mukaan vuosina 1995, 2000, 2006, 2012 ja 2017 (18–64-vuotias väestö), %
Vaakapylväskuvioon tutustuit osiossa 3.3 Vaakapylväskuvio. Siinä korostetaan asioiden määrällisiä eroja eli paljonko jotain on suhteessa johonkin muuhun. Myös vaakapylväskuviossa voidaan käyttää useita pylväsryhmiä samalla kertaa.
Suosituksena on, että käytetään kahta ryhmää, jolloin toinen ryhmä toimii vertailuryhmänä ensimmäiselle. Varsinaisen tarkastelun kohteena oleva osajoukko laitetaan ylemmäksi ja lajittelu toteutetaan sen määrien mukaiseksi järjestykseksi. Näin tulkinta on helpompaa.
Kahden ryhmän vaakapylväsryhmäkuviossa huomio kiinnittyy luokkiin, joissa näiden ryhmien erot ovat suurimmat. Juuri tämä on kuviotyypin keskeisin tehtävä. Tutustu esimerkin 2 avulla lähemmin kuvion mahdollisuuksiin luokkien välisten erojen havainnollistamisessa.
Esimerkin kuvio esittää opiskelijoiden osuuksia eri koulutusaloilla sukupuolittain vuonna 2019. Vaakapylväsryhmäkuviossa huomio keskittyy ennen kaikkea sisempien ryhmien (tässä kuviossa eri sukupuolien) määrien eroihin kussakin ulomman muuttujan ryhmässä (tässä kuviossa eri koulutusalat).
Oheisen kuvion keskeisin huomio on, että tekniikan aloilla on huomattavasti enemmän mies- kuin naisopiskelijoita, kun taas terveys- ja hyvinvointialoilla on paljon enemmän nais- kuin miesopiskelijoita.
Tässä kuviossa lajittelukriteeriksi on valittu miehet. Lajittelun mukainen ryhmä kannattaa asettaa ylemmäksi ja kuvata tummemmalla värillä.
Kuvio. Opiskelijat koulutusalan ja sukupuolen mukaan vuonna 2019
Seuraavassa esimerkissä sukupuolten välisiä työllisyysasteiden eroja verrataan ylimmän suoritetun tutkintoasteen mukaisissa luokissa. Tilastokuvio vihjaa erojen mahdollisista selityksistä, mutta tulkitseminen vaatii sekä asiantuntemusta ilmiöstä että kriittistä arviointia ja harkintaa.
Mitä esimerkin 3 kuviosta voi mielestäsi päätellä ja mikä jää pelkkien arvailujen varaan?
Huomaat kuviosta, että erot ovat suurimmillaan lukiokoulutuksen, ammatillisen peruskoulutuksen ja lisensiaatintutkinnon suorittaneiden ryhmissä: näissä naisten työllisyysaste on huomattavasti suurempi kuin miesten.
Koska muissa ryhmissä työllisyysasteiden erot eivät ole kovin merkittäviä, voit kuvion perusteella arvata, että naisten yleinen korkeampi työllisyysaste (Yhteensä-luokka) selittyy todennäköisesti eroista noissa yllä mainituissa kolmessa ryhmässä. Koska kuviossa on esitetty vain työllisyysasteita, eikä siis ole mitään tietoa eri ryhmien kokoeroista, ei näin voida vielä kuitenkaan yksiselitteisesti päätellä.
Kuvio. Tutkinnon suorittaneiden työllisyys vuoden kuluttua valmistumisesta 2020
Pinotun pystypylväskuvion ensisijainen tehtävä on kokonaismäärän kehityksen lisäksi kuvata sen rakenteellista muutosta ja kehitystä ajan suhteen. Jos poimitun aineiston mittayksikkö on summautuva kuten lukumäärät tai eurot, eri osajoukot voidaan esittää pylväsryhmien sijasta pinottuina pylväinä.
Piirakkakuvion tavoin näiden keskenään pinottavien luokkien tulee olla toisensa poissulkevia ja muodostaa jokin järkevä kokonaisuus. Tästä syystä pinotut pylväät eivät useinkaan sovellu eri ryhmien tai ilmiöiden kuvaamiseen, koska ne harvemmin muodostavat keskenään mielekkään ja tulkintaa tukevan kokonaisuuden.
Kun merkittävin tai mielenkiintoisin luokka asetetaan alimmaksi, sen kehitystä on mahdollista visuaalisesti havainnoida kokonaissumman lisäksi. Eri luokkien määrien keskinäinen vertailu ei ole pinottujen pylväiden varsinainen tehtävä, vaan siihen soveltuu paremmin pylväsryhmäkuviot.
Esimerkkikuvio esittää eri perhetyyppien määrän kehityksen 70 vuoden ajalta vuosilta 1950–2020. Kuviosta huomaat, että vaikka aviopariperheiden määrä on kääntynyt laskuun jo useita vuosikymmeniä sitten, niin perheiden kokonaismäärä on jatkanut edelleen kasvuaan. Tämä selittyy kuvion perusteella sillä, että avopariperheiden määrä on lisääntynyt sitäkin enemmän.
Kuviosta on havaittavissa myös, että vaikka lapsellisten avo- ja avioparien määrä on laskusuunnassa, niin lapsen kanssa asuvan vanhemman ja yksinhuoltajaperheiden määrä on kuitenkin pysynyt suurin piirtein ennallaan. Kuvio osoittaa siis useita eri mielenkiintoisia näkökulmia perheistä, avioituneisuudesta, eronneisuudesta ja syntyvyydestä yhdessä näkymässä.
Toisaalta tästä kuviosta ei selviä perheiden (tai perheissä asuvien henkilöiden) määrän suhdetta yksinasuvien ja muiden perheiden ulkopuolella elävien ihmisten määrään. Tätä vertailua varten pitäisi tehdä ihan oma (hieman eri aineistoon pohjautuva) tilastokuvio tämän kuvion rinnalle, eikä tuoda vielä tätäkin näkökulmaa tähän samaan kuvioon. Vai mitä mieltä olet?
Kuvio. Perheet perhetyypin mukaan vuosina 1950–2020
Lähde: Suomen tilastollinen vuosikirja, taulukko 12.28 Perheet perhetyypin mukaan 1950–2020 (xlsx)
Pinotut pylväät on usein varsin mielenkiintoinen ja informatiivinen esitystapa, koska se välittää tulkintoja myös huomattavasti monimutkaisemmistakin ilmiöistä. Toki sen käyttö edellyttää, että kyseisessä ilmiössä todellakin on tapahtunut merkittäviä rakenteellisia muutoksia tutkittavalla aikavälillä. Lisäksi keskenään pinottavien luokkien valinnan tulee olla sekä mielekäs että mielenkiintoinen, eikä luokkia saa olla liikaa.
Muiden pystypylväskuvioiden tapaan myös pinottujen pystypylväiden x-akselilla voidaan esittää jokin muukin jatkuva-arvoinen muuttuja kuin aika. Alla olevassa kuviossa x-akselilla on esitetty ikä.
Kuvio osoittaa sen, mitkä miesten ikäkohortit eli ikäryhmät ovat suurimmat. Lisäksi siitä nähdään, kuinka miesten määrät jakautuvat eri siviilisäätyihin kussakin näistä ikäkohorteissa. Yhdessä ja samassa tilastokuviossa esitettynä nämä pylväät välittävät lukijalleen nopean yleiskäsityksen siitä, miten miehet jakautuvat iän ja siviilisäädyn mukaan Suomessa.
Kuviosta on helppo havaita, että miehistä suurin osa on naimattomia, mutta suurin osa näistä naimattomista miehistä kuuluu luonnollisesti nuorempiin ikäkohortteihin. Vasta noin 45-vuotiaista aina 90 ikävuoteen asti naimisissa oleminen on vallitseva miesten siviilisääty.
Kuvio. Väestö (miehet) siviilisäädyn mukaan vuonna 2021
Lähde: Väestörakenne, taulukko 11ry -- Siviilisääty iän (1-v. 0−112) ja sukupuolen mukaan, 1990− (StatFin)
Myös vaakapylväskuviossa voi esittää eri osajoukot pylväsryhmien sijasta pinottuina pylväinä. Tällöin edellytyksenä on, että varsinainen mitattava yksikkö on summautuva, kuten lukumäärät ovat. Esimerkiksi indeksipistelukujen tai muutosprosentin arvoja ei voi mielekkäästi summata keskenään.
Pinotussa vaakapylväskuviossa huomio keskittyy tavallisen vaakapylväskuvion tavoin luokkiin, jotka ovat kokonaismäärältään suurimpia tai pienimpiä. Vastaavan vaakapylväsryhmäkuvion tavoin sellaiset luokat korostuvat, joissa keskenään vertailtavien osajoukkojen erot ovat suurimmat.
Esimerkissä 6 on pinottu vaakapylväskuvio, jossa aineistona on sama kuin esimerkissä 2 (vaakapylväsryhmäkuvio). Pinotuista pylväistä näet nyt myös sukupuolten kokonaismäärät eri koulutusaloilla ja summittaisesti myös sukupuolten prosentuaalisen jakauman kullakin koulutusalalla. Yksittäisten luokkien (tässä tapauksessa varsinkin naisten) määrien arviointi on sen sijaan paljon vaikeampaa kuin vaakapylväsryhmäkuviosta.
Pinotuissa pylväissä on useimmiten suositeltavaa lajitella pylväät kokonaismäärien mukaan. Tällöin näkökulma aineistoon on selvästi erilainen kuin esimerkin 2 miesten määrien mukaan lajitellussa pylväsryhmäkuviossa.
Kuvio. Opiskelijat koulutusalan ja sukupuolen mukaan vuonna 2019
Pinotuilla pylväillä tulisi esittää vain summautuvaa tietoa kuten lukumääriä. Jos näiden keskenään pinottavien eri luokkien muodostama kokonaismäärä muodostaa ymmärrettävän kokonaisuuden, niin samalle aineistolle voidaan soveltaa myös esitystapaa, jossa eri pylväät on kaikki venytetty samanmittaisiksi. Tällöin puhutaan suhteellisesta tai 100 %:n pinotusta pylväskuviosta.
Alkuperäisten lukumäärien sijaan kuviotyypissä esitetään osajoukkojen suhteelliset osuudet kussakin ulomman muuttujan eri luokassa. Käytännössä tällöin lasketaan niiden suhteelliset osuudet ja esitetään tulokset 100 %:n venytettyinä pinottuna pylväinä. Tällaisesta kuvioista näet tarkemmin osajoukkojen suhteelliset osuudet kussakin yksittäisessä luokassa sekä näiden suhteellisten osuuksien erot ulomman muuttujan eri luokissa. Toisaalta on syytä muistaa, että 100 %:n pylväskuviosta et voi enää havainnoida ulomman muuttujan luokkien suuruutta eli sitä, mitkä niiden painoarvot ovat suhteessa kokonaismäärään, kuten esimerkissä 7.
Huomaat varmaan, että selvästi miesvaltaisimmat koulutusalat ovat tietojenkäsittely ja tietoliikenne sekä tekniikan alat. Toisaalta naisvaltaisimmat alat ovat terveys- ja hyvinvointialat sekä kasvatusalat.
Kuviosta ei kuitenkaan millään tavoin välity se, että tekniikan alat ja terveys- ja hyvinvointialat ovat opiskelijamääriltään suurimmat koulutusalat. Se tarkoittaa sitä, että niiden painoarvot kokonaisuutta tarkasteltaessa ovat paljon suuremmat kuin huomattavasti pienempien kasvatus- ja tietojenkäsittelyalojen. Tämän tiedon välittämiseksi rinnalle tarvittaisiin myös vastaava lukumäärittäinen pinottu pylväskuvio.
Kuvio. Opiskelijat koulutusalan ja sukupuolen mukaan vuonna 2019
Pinottu vaakapylväskuvio ja 100 %:n vaakapylväskuvio tarjoavat kaksi keskenään hyvin erilaista näkökulmaa aineistoon. Siksi onkin usein perusteltua tarjota molemmat erikseen. Suhteelliset osuudet kuvaavat usein paremmin varsinaisia lukujen takana olevia ilmiöitä. Alkuperäiset lukumäärät puolestaan auttavat ymmärtämään niiden painoarvoja ja todentamaan lukuja, joista suhteelliset osuudet on laskettu.
Pylväskuvioiden yksi muunnos on pyramidikuvio. Se ei kuitenkaan ole vaakapylväskuvion variaatio, vaikka se siltä saattaa näyttää. Ennemminkin voitaisiin puhua pystypylväskuvion muunnoksesta. Pyramidikuviossa kahden keskenään vertailtavan luokan pystypylväskuviot on ikään kuin asetettu rinnakkain. Oletuksena on, että y-akselilla esitetään jatkuva-arvoisen tai vähintään järjestysasteikollisen muuttujan luokkia. Pystypylväskuviosta poiketen ajan esittäminen pyramidikuvion y-akselilla ei kuitenkaan ole vastaavalla tavalla järkevää.
Yleensä pyramidikuviolla kuvataan naisten ja miesten välisiä eroja eri ikäluokissa. Siksi puhutaankin usein väestöpyramidikuviosta, jota esimerkki 8 kuvaa.
Pyramidikuviolla voidaan kuitenkin esittää myös muita kahteen eri ryhmään jakautuvia kokonaisuuksia, kuten esimerkiksi työttömät ja työlliset. Ikäluokkien lisäksi y-akselilla voidaan esittää esimerkiksi tulo-, varallisuus- tai koulutusasteluokkia.
Pyramidikuviossa voi tämän esimerkin tavoin olla joskus niin tiheä jako, että yksittäisten ikäkohorttien tarkkoja lukumääriä on vaikea hahmottaa. Muiden tilastokuvioiden tavoin pyramidinkin ensisijainen tehtävä on kuitenkin vain välittää yleinen mielikuva koko ilmiön painopisteistä, tässä tapauksessa väestön ikä- ja sukupuolirakenteen osalta.
Tämän kuviotyypin pyramidi-nimitys viittaa historiallisiin väestörakenteisiin. Nykyään ja tulevaisuudessa, ainakaan kehittyneiden teollisuusmaiden, väestörakenteet eivät enää yhtään muistuta pyramidia, kuten huomaatkin oheisesta kuviosta.
Kuvio. Vuoden 2021 väestöennuste sukupuolittain vuodelle 2060
Visualisoimalla kaksi pyramidia päällekkäin voidaan verrata esimerkiksi väestöpyramidien rakenteellisia eroja kahtena eri ajankohtana tai kahden eri maan väestön sukupuoli- ja ikärakenteellisia eroja keskenään. Kahden pyramidin esitykseen voit tutustua esimerkissä 9.
Reilussa sadassa vuodessa Suomen väestöä esittävä väestöpyramidin muoto on muuttunut oleellisesti. Säännönmukainen, ylöspäin kaventuva teräväkärkinen pyramidi on vuosikymmenten mittaan saanut entistä pulskemman ja perinteisen yksihuippuisen pyramidin sijaan kauttaaltaan levenevän muodon. Muutos kielii ennen kaikkea syntyvyydessä tapahtuneista radikaaleista muutoksista ja väestön ikääntymisestä.
Kuvio. Väestön ikärakenne vuosina 1917 ja 2021
Yksi viivakuvion muunnos on aluekuvio. Siinä viivan ja vaaka-akselin välinen alue täytetään jollain värillä, jolloin korostuu kyseisen alueen pinta-ala. Esitystapaa voi käyttää silloin, kun halutaan havainnollistaa jonkin asian määrällistä kertymää koko tutkittavalta aikaväliltä. Jos käsite saa kyseisellä aikavälillä myös negatiivisia arvoja, niiden kertymiä voidaan kuvata eri väreillä. Tällöin positiivisen ja negatiivisen kertymän keskinäinen vertailu on tehokkaampaa. Aluekuvio on käytännössä pylväskuvion vastine.
Joskus on tarpeellista tai mielekästä puolestaan värittää kahden eri tietoviivan välinen alue. Tällöin voi tutkia niiden erotuksen kumulatiivista kertymää tutkittavalla aikavälillä tai vaikka ikäkohorteittain.
Aluekuvio voi myös olla pinottu, jolloin se vastaa pinottua pylväskuviota. Pinottu aluekuvio ei kuitenkaan ole visuaalisesti aivan yhtä tarkka kuin vastaava pinottu pylväskuvio. Se ei myöskään ole yhtä hyvä esitystapa kuin pinotut pylväät silloin, kun halutaan kuvata yksittäisten ajankohtien tilannetta. Joskus pinottu aluekuvio saattaa kuitenkin olla silmille miellyttävämpi esitystapa kuvaamaan koko tutkittavalla aikavälillä kertyneitä kumulatiivisia määriä ja niiden suhteita. Pinotusta aluekuviosta käytetään joskus myös nimitystä summaviivakuvio.
Seuraavassa esimerkissä 10 näet pinotun aluekuvion energian kulutuksesta 30 vuoden ajalta.
Pinotussa aluekuviossa mielenkiintoisin luokka on usein sijoitettu alimmaksi, kuten pinotuissa pylväissäkin. Tällöin myös tämän yksittäisen luokan kehitys on havaittavissa kuviosta yhtä selkeästi ja tarkasti kuin kokonaismääränkin.
Tässä kuviossa alimmaisena kuvataan fossiilisten polttoaineiden ja turpeen osuuden kehitystä vuodesta 1970 alkaen. Sen kumulatiivinen osuus on laskenut selvästi tarkasteluajanjaksolla, kun taas uusiutuvan energian osuus on kasvanut.
Kuvio. Energian kulutus gigawattitunteina (GWh) vuosina 1970–2020*
(*ennakkotieto)
Piirakkakuvion tavoin puukaavio esittää kokonaisuuden jakautumista osiin. Kuten piirakkakuviossa, käytetyn mittayksikön tulee olla summautuva, ja esitettävän muuttujan luokkien tulee muodostaa jokin mielekäs kokonaisuus.
Puukaavion (englanniksi treemap) nimi tulee sen perinteisestä esitystavasta, joka on kuin puu, joka haarautuu ylöspäin oksistona tai alaspäin juuristona. Puu voi olla myös "kaatunut" eli sen haarat aukenevat joko vasemmalle tai oikealle.
Puukaavio soveltuu parhaiten kuvaamaan kokonaisuuden jakautumisen osiin jonkin useampitasoisen hierarkkisen ulottuvuuden mukaisesti. Puukaaviosta saat nopeasti hyvän yleiskäsityksen, mutta et välttämättä kovin tarkkaa kuvaa jonkin kokonaisuuden jakautumisesta osiin ja osajoukkoihin. Jos halutaan kuvata kunkin yksittäisen luokan osuutta kokonaisuudesta, käytetään piirakkakuviota. Vaakapylväskuvio taas kuvaa tarkemmin luokkien kokoeroja suhteessa toisiinsa.
Useimmiten puukaavio esitetään kuitenkin laatikkoina, joista muodostuu yksi iso, kokonaismäärän kuvaama laatikko. Laatikoiden värityksellä voidaan tehostaa sen tulkintaa. Yhtenevillä väreillä voidaan esimerkiksi tarvittaessa sitoa yhteen joitain toisiinsa liittyviä osajoukkoja tai -haaroja. Joskus väreillä tai värisävyasteikolla puolestaan pyritään osoittamaan jonkin muun muuttujan riippuvuutta tai jopa mahdollista syy-seuraussuhdetta suhteessa laatikoiden kokoja määrittävään muuttujaan.
Kuvio. Esimerkki puukaaviosta
Kun puukaavioon sisällytetään sekä oksat että juuret, siitä käytetään nimitystä vuokaavio. Vuokaavio esitetään usein niin sanotusti kaatuneena puuna, jolloin esitys muuttaa puun sijasta kaksisuuntaisesti haarautuvaa virtaa eli vuota. Vuokaaviolla visualisoidaan tyypillisesti esimerkiksi yksittäisten tulo- ja menoerien osuutta kokonaistuloista ja -menoista.
Samassa kuviossa on mahdollista vertailla näiden keskinäisiä kokoeroja suhteessa toisiinsa. Esimerkiksi alla olevassa Veropuu-esimerkissä kuvataan tällä tavalla julkisyhteisöjen tuloja ja menoja. Lähdemerkinnästä voit avata kuvan isompana ja tutustua tarkemmin veropuun ominaisuuksiin.
Kuvio. Esimerkki vuokaaviosta
Lähde: Veropuu (Hahmota Oy)
Tilastoteemakartta yhdistää tilasto- ja paikkatietoa. Tilastoteemakartalla esitetään valitun ilmiön tai teeman maantieteellistä jakaantumista ja keskittymiä sekä niiden voimakkuutta tai alueellista vaihtelua.
Tilastoteemakartat ovat monipuolinen kokoelma keskenään hyvinkin erilaisia ja erinäköisiä esitystapoja. Tilastotieto voi esimerkiksi olla pistemäistä tarkkoihin koordinaatteihin tai esimerkiksi hallinnollisiin alueisiin kuten kuntiin ja maakuntiin sidottua tietoa.
Alueellista tietoa havainnollistetaan kartalla usein lukumäärien kokosuhteita vastaavina eri kokoisina ympyröinä. Virtauskartalla voidaan puolestaan esittää vaikkapa muuttoliikettä alueiden välisillä erilevyisillä nuolilla. Jos kuvataan suhteellisia mittayksiköitä, ilmiön voimakkuutta havainnollistetaan tavallisesti tummenevilla värisävyillä.
Tässä esimerkissä on esitetty Suomen väestöntiheys maakuntatasolla. Huomaa, että tällaisissa koropleettikartoissa sekä valittu aluetaso että valitut luokkarajat ja väriarvot vaikuttavat huomattavasti kartan ulkoasuun ja sitä kautta myös sen välittämään tulkintaan. Eri aluetasoilla ja luokkarajoilla kuvattuna voi tästä täysin samasta ilmiöstä ja datasta saada aikaan hyvinkin erinäköisen alueellisen tulkinnan.
Kannattaa siis kokeilla kartantekoa useilla eri valinnoilla ja rajauksilla ja tällä tavoin visuaalisesti tutkia kyseistä aineistoa. Lopulliseksi kartaksi voi sitten valita näistä sen tai ne, jotka parhaiten kuvaavat kyseisen ilmiön alueellisia eroja.
Kuvio. Väestöntiheys maakunnittain vuonna 2020
Alueellinen näkökulma on yksi kiinnostavimmista tilastojen osatekijöistä ja näkökulmista, ja siksi karttoja käytetään runsaasti hyvinkin erilaisissa yhteyksissä. Tilastoteemakarttojen lukutaidon voi sanoa olevan olennainen kyky yhteiskunnan alueellisten ilmiöiden hahmottamisessa. Siksi aiheesta onkin tekeillä oma Tilastoteemakartat-opas.
Hajonta- eli pistekuvio soveltuu havainnollistamaan kahden eri indikaattorin riippuvuutta, yhteisvaikutusta ja mahdollista syy-seuraussuhdetta. Muista tilastokuviotyypeistä poiketen tässä kuviossa indikaattoreilla voi olla keskenään eri mittayksiköt. Mittayksiköiden arvojen tulisi lähtökohtaisesti olla jatkuva-arvoisia tai vähintäänkin järjestysasteikollisia.
Jos hajontakuviolla pyritään osoittamaan syy−seuraus-suhdetta, x-akselille valitaan muuttuja, joka oletetaan tarkasteltavan ilmiön syyksi. Y-akselille puolestaan asetetaan muuttuja, joka oletetaan ilmiön seuraukseksi. Kuviossa jokainen piste kuvaa joko yksilöä kuten henkilöä, yksikköä kuten rakennusta tai yhteiskuntatilastoissa jotain laajempaa kokonaisuutta, esimerkiksi kuntaa, ikäluokkaa tai muuta väestöryhmää.
Hajontakuviolla on mahdollista riippuvuuden lisäksi havainnollistaa indikaattorien yhteisvaikutusten perusteella muista poikkeavien pisteiden olemassaoloa, kuten seuraavassa esimerkissä.
Oheisessa hajontakuviossa on esitetty Suomen kunnat sinisinä pisteinä. Ne edustavat kuntien jakautumista sekä lasten että eläkeikäisten osuuksien suhteen. Näillä kahdella indikaattorilla on hyvin vahva keskinäinen riippuvuussuhde eli korrelaatio. Tämä johtuu siitä, että ne ovat saman väestön kaksi eri osajoukkoa, ja täten ainoa puuttuva tekijä on kyseisen kunnan työikäisten eli 15–64-vuotiaiden osuus.
Kuviosta on hyvin hahmotettavissa, kuinka kunnat keskimäärin jakaantuvat näille akseleille. Myös muista poikkeavat kunnat on helppo huomata. Poikkeuksellisia kuntia ovat esimerkiksi Kökar, jossa on hyvin vähän lapsia sekä Liminka, jossa lapsimäärä on korkea. Suurissa kaupungeissa kuten Helsingissä, Turussa ja Tampereella on suhteellisen vähän sekä lapsia että eläkeikäisiä. Näissä kunnissa on siis luonnollisesti suhteellisen paljon työikäistä väestöä. Esimerkiksi Kinnulassa puolestaan on poikkeuksellisen vähän työikäisiä.
Kuvio. Alle 15-vuotiaiden ja yli 64-vuotiaiden prosenttiosuudet kunnittain vuonna 2021
Lähde: Kuntien avainluvut, taulukko Kuntien avainluvut 1987−2021 (vuoden 2021 aluejaolla)
Tutkakuvio muodostuu useasta eri suuntaan osoittavasta mittayksikköakselista, jolla kuvattujen mittauspisteiden arvojen välille on piirretty viiva tai viivoja. Tutkakuviota käytetään tilanteissa, joissa kunkin akselin mittayksikkö on sama. Lisäksi mittaustiedot ovat järjestysasteikollisia ja ne muodostavat keskenään sulkeutuvan syklin kuten kalenterikuukaudet tai kellonajat. Jos tutkakuviota käytetään muille kuin syklisille aineistoille, se saattaa vääristää tulkintaa.
Seuraavassa tutkakuviossa on esitetty liikennevahinkojen määrät vuorokausittain vuonna 2020. Kyseessä on siis liikennevakuutuksesta korvatut vahingot. Viivan punertuvaa väritystä on tässä kuviossa hyödynnetty korostamaan ääriarvoja. Toisaalta tutkakuvion tehtävänä on usein myös kokonaiskertymän painopisteiden osoittaminen kyseisen syklin (tässä tapauksessa kalenterivuoden) suhteen. Värejä (ja akseleita) paremmin hyödyntämällä olisi voitu molemmat näistä näkökulmista nostaa esiin ehkä vieläkin tehokkaammin. Keksitkö sinä, kuinka?
Kuvio. Liikennevahinkojen lukumäärät vuoden 2020 eri päivinä
Avainluku on jokin aineistosta esiin nostettu yksittäinen lukuarvo tai tunnusluku. Tässä esimerkkinä on eläköityneiden lukumäärä vuonna 2020.
Avainlukuja käytetään silloin, kun käyttäjille on tärkeämpää saada jonkin indikaattorin tarkka lukuarvo kuin varsinaisesti verrata sitä mihinkään muuhun lukuun tai edes nähdä kyseisen indikaattorin koko kehitystrendiä. Avainlukuja hyödynnetään esimerkiksi talouden suhdannelukuja tai vaikkapa väestörakennetta kuvaavissa esityksissä.
Infografiikka on käsitteenä melko uusi ja vakiintumaton. Nimityksen käyttö on kuitenkin yleistynyt huomattavasti 2010-luvulla internetin ja sosiaalisen median käytön yleistymisen myötä. Sananmukaisesti ymmärrettynä infografiikalla voidaan tarkoittaa mitä tahansa esitystä, jossa mitä tahansa tietoa välitetään millä tahansa visuaalisella esitystavalla. Tässä esimerkkinä on eri kokoisten asuntokuntien osuudet vuonna 2021.
Tilastodataa visualisoitaessa infografiikka pitää siis laajasti tulkittuna sisällään myös kaiken tilastografiikan. Toinen esimerkki biotalouden ekonomiasta pohjaa piirakkakuviotyyppiseen esitystapaan, jossa on hyödynnetty lisäksi infograafisia elementtejä.
Kuvio. Esimerkki biotalouden ekonomiaa esittelevästä infograafista
Lähde: Työ- ja elinkeinoministeriö (TEM): Biotalouden materiaalipankki (englanninkielinen)
Infograafinen kuvio voi olla myös laajempi kokoelma keskenään hyvinkin erilaisia kuvituksia, kaavioita ja symboleita kiteytetyn tiedon havainnollistamiseksi. Kapeasti tulkittuna infografiikkatermiä on kuitenkin käytetty kuvaamaan juuri niitä tilastoaineistoihin pohjautuvia esityksiä, jotka eivät täytä tilastografiikan keskeisintä elementtiä eli visuaalista vertailtavuutta. Käytännössä samaan näkymään voidaan tuoda vaikkapa erilaisia avainlukuja, joilla ei ole yhtenäistä käsitteistöä taustallaan. Infografiikkaa tulkitessasi kannattaakin kiinnittää huomiota juuri visuaaliseen vertailtavuuteen
Kuva. Esimerkki merenkulun avainlukuja kokoavasta infograafista
Lähde: Suomen varustamot: Merenkulun avainluvut
Kaavio yhdistää useita taulukoita yhdeksi kokonaisuudeksi. Joskus aineiston tilastoluvut voivat olla keskenään niin eri tasoisia tai sisältävät niin monimutkaisia sisäisiä hierarkioita tai muita oleellisia riippuvuussuhteita, ettei mikään tilastokuvio suoraan vastaa tarpeeseen.
Kuva. Kaavio väestöstä syntyperän ja kielen mukaan vuonna 2020
Dashboard on yhteen verkkosivunäkymään koottu kokoelma yksittäisiä tilastokuvioita, -taulukoita, avainlukuja, listoja tai muita infografiikoita. Dashboard tarjoaa nopean yleisnäkymän laajaan tietokokonaisuuteen samanaikaisesti monesta eri näkökulmasta. Dashboard toimii parhaiten silloin, kun sen sisällön kaikki sisäiset riippuvuudet noudattavat keskenään samoja loogisia visuaalisia sääntöjä, esimerkiksi yhtenäisiä värikoodauksia, asteikkoskaaloja ja valintalaatikoita.
Tilastokuviot toimivat luonnollisesti parhaiten, kun ne ovat tarpeeksi suuria, jotta niiden elementit ja tekstit ovat selvästi hahmotettavissa. Siksi hyvän vuorovaikutteisen dashboard-näkymän keskeinen toiminnallisuus on tarjota zoomausvaihtoehto yksittäisen tilastokuvion tarkastelemiseksi koko ruudun kokoisena. Lisäksi dashboardeissa on usein paljon muitakin vuorovaikutteisia toiminnallisuuksia ja linkityksiä alkuperäisiin tietolähteisiin. Organisaatioiden ulkoiseen käyttöön tarkoitetut dashboardit ovatkin usein samalla niin sanottuja portaalipalveluita.
Kuva. Esimerkki dashboardista
Dynaamiset, vuorovaikutteiset ja animoidut tilastokuviot eivät ole varsinaisesti omia kuviotyyppejään, vaan ne ovat jo olemassa olevien kuviotyyppien hyödyntämistä erilaisilla lisäominaisuuksilla. Niitä käytetäänkin vain silloin, kun ne aidosti tarjoavat käyttäjälle lisäarvoa kuvattavan asian tai ilmiön tulkintaan. Väärinkäytetyt tai väärissä paikoissa lisätyt vuorovaikutteiset toiminnallisuudet voivat johtaa käyttäjää harhaan ja heikentää näin asian ymmärrettävyyttä.
Kuvioon voidaan tuoda dynaamisuutta monella tavoin, esimerkiksi niin sanotun mouse−over-toiminnon avulla. Tällöin kohde suurentuu, kun hiiren osoitin viedään sen päälle. Kuviosta voidaan tuoda lisäinformaatiota myös piilottamalla se. Taustalla voidaan tarjota hyvinkin paljon kuvailevaa tai muun tyyppistä oleellistakin tietoa ilman, että kaikki tiedot olisivat koko ajan näkyvissä häiritsemässä itse kuvion elementtien kokosuhteiden arviointia.
Vuorovaikutteisuutta voidaan hyödyntää myös siten, että jonkin staattisen, analyysitekstiin sidotun tilastokuvion yhteyteen tarjotaan käyttäjälle alasvetovalikko. Siitä valitsemalla käyttäjä pääsee tutkimaan samaa ilmiötä jonkin muun osajoukon, indikaattorin tai eri mittayksikön näkökulmasta.
Animoinnilla saadaan aikasarjatoiminnallisuus normaalisti yhden yksittäisen viiteajankohdan tilannetta kuvaavaan tilastokuvioon (esimerkiksi vaakapylväs-, piirakka- tai hajontakuvioon). Käytännössä animointi on kuin tilastokuviovideo: se koostuu useasta peräkkäisestä kuviosta, jotka kuvaavat eri ajankohtien mukaista tilannetta.
Animoiduissa kuvioissa tulee säilyttää mitta-asteikkojen skaalat samoina, jotta visuaalinen vertailtavuus säilyy eri ajankohtien yli. Tärkeää on, että animaation käyttöliittymä tarjoaa mahdollisuuden tutkia eri ajankohtien sisältöjä myös rauhassa niin sanottuun step-by-step -tyyliin eikä pelkästään jatkuvasti pyörivänä videona.
Kuvio. Väestöpyramidi vuodesta 1865 alkaen (kuvio ei ole täysin saavutettava)
Lähde: Väestörakenne, Väestö iän (5-v.) ja sukupuolen mukaan 1865– (StatFin)
Animointeja tai vuorovaikutteisuutta hyödyntämällä voidaan lisätä tilastojen ja tilastokuvioiden käyttöä ja ymmärrettävyyttä. Pelinomaisilla toiminnallisuuksilla yllätetään ja tuotetaan ahaa-elämyksiä. Katso tästä Ylen esimerkki Kyllä ennen oli nuoriso kunnollista − vai oliko? (yle.fi).
Vuorovaikutteisilla valinta- ja vertailumahdollisuuksilla voidaan tarjota tilastoja kohdennetusti eri elämäntilanteisiin ja käyttökontekstiin. Esimerkiksi erilaiset laskurit helpottavat monimutkaistenkin ilmiöiden, käsitteiden, indikaattorien tai tilastojen ymmärrettävyyttä.
Animoinneilla ja muilla tehokeinoilla kuten väreillä, kuviomatriiseilla ja dynaamisesti linkitetyillä kuvioilla luodaan helposti hyvinkin moniulotteisia kuvioita ja monipuolisia näkökulmia aineistoihin.