Siirry pääsisältöön
Tilasto-oppaat
Tilastokeskuksen etusivulle

Tilastokuviot tutuksi

1 Miksi tilastokuvioita tehdään?

1.1 Kuvio on taloudellinen ja tehokas esittämisen tapa

Tilastokuviossa lukumäärätietoa esitetään erilaisten kuviotyyppien avulla, esimerkiksi pylväillä ja aikasarjaa kuvaavilla viivoilla. Kuviosta saa nopean käsityksen tilastotiedon kuvaamasta ilmiöstä, siinä tapahtuneista muutoksista ja kehityksestä. Kuviomuotoinen tieto on helppo muistaa, mutta siinä voi piillä myös pieni riski. Jos kuvio aiheuttaa vääränlaisen mielleyhtymän keskeisistä tuloksista, se saattaa jäädä paremmin mieleen kuin vaikkapa tekstissä esitetyt perustellut faktat. 

Tilastokuviolla havainnollistetaan keskeisiä tietoja. Voit vertailla tietoja esimerkiksi eri alueiden välillä, naisten ja miesten välisiä osuuksia tai vaikkapa talouden suhdanteiden mukaan aikasarjassa nähtäviä poikkeamia työllisyydessä. Kuviolla voidaan esittää suurikin määrä tietoa pienessä tilassa, toisin kuin jos kirjoittaisi saman tietosisällön auki tekstiksi. 

Tilastokuviolla voi osoittaa mm.

  • määrien ja osien suhteita
  • asioiden kehitystrendejä
  • säännönmukaisuuksia
  • toistuvia ilmiöitä
  • riippuvuussuhteita
  • poikkeavia havaintoja
  • alueellisia keskittymiä ja eroja.

Ruotsalainen jo edesmennyt väestö- ja terveystilastotieteeseen perehtynyt lääkäri Hans Rosling oli edellä aikaansa monella tapaa. Yksi hänen merkittävimmistä saavutuksistaan liittyy kekseliääseen tapaan havainnollistaa tilastotietoa. Luennoillaan hän saattoi esimerkiksi demonstroida väestönkehityksen muutoksia pinoamalla laatikoita torneiksi. Seuraavalla englanninkielisellä videolla Rosling tiivistää neljään minuuttiin väestöhistorian 200 vuotta hyödyntäen virtuaalisia graafisen esittämisen keinoja.

1.2 Tekstillä, taulukolla ja kuviolla on jokaisella oma tehtävänsä

Tilastotietoa voidaan esittää eri tavoilla riippuen kontekstista ja siitä, mitä asioita halutaan tuoda esille. Teksteillä, taulukoilla ja kuvioilla voidaan havainnollistaa eri tyyppisiä asioita ja niitä käytetäänkin eri tilanteissa. 

Teksti esittää tulkittua tietoa

Teksti on esitystavoista subjektiivisin eli se on jo tulkittua tietoa. Aineistosta voisi tehdä ehkä myös muitakin tulkintoja. Tilastotekstissä on yleensä paljon lukuja, mikä tekee tekstistä vaikean ymmärtää. Varsinkin suuria lukuja on vaikea hahmottaa.

Teksti 

  • sisältää tiedon ohella myös sen tulkinnan
  • mahdollistaa taustoituksen, analyysit ja asioiden välisten suhteiden kuvaamisen
  • kuvaa tai sen tulisi kuvata ilmiötä eikä suoraan kuvion tai taulukon sisältöä
  • on esityksen runko, joka sitoo tilastoesitykset yhteen.

Taulukko sopii massatiedon esittämiseen

Tilastotaulukko on perinteinen tapa järjestää numeerinen aineisto tiiviiseen ja helposti omaksuttavaan muotoon. Tyypillisin taulukkotyyppi on havaintotaulukko eli matriisi, mutta tilastotietoa voidaan esittää myös muunlaisessa taulukossa, esimerkiksi hierarkkisessa taulukossa. Taulukkoon voidaan kerätä tietoja useammasta eri lähteestä, ja se, mitä taulukkoon on valikoitunut, on tekijän subjektiivinen tulkinta alkuperäisestä datasta. Yleisenä periaatteena on hyvä muistaa, että jokaisen kuvion luvut voi esittää taulukkona, mutta jokaista taulukkoa ei voi esittää kuviona tai ainakaan yhtenä kuviona.

Taulukossa käytetään erilaisia merkintätapoja. Näin tehdään esimerkiksi silloin, jos tietoa ei ole saatu, se on liian epävarma esitettäväksi tai kyseessä on ennakkotieto. ​​​​​​Taulukkoesimerkkeihin voit tutustua esimerkiksi Suomi lukuina -palvelussa, jossa on tilastotietoa saatavilla kattavasti eri aihealueilta sekä lisäksi kansainvälistä vertailutietoa.

Lisätietoja taulukoista:

Taulukko

  • on hyvä massatiedon esittämisessä
  • sisältää tarkat luvut
  • mahdollistaa eri luokkien numeerisen vertailun
  • summaa yhteen havaintojen ominaisuuksien frekvenssit (jakaumat)
  • tiivistää muuttujia tunnusluvuiksi (keskiarvo, mediaani jne.)
  • välittää tietoa myös useampiulotteisena
  • voi vaikeuttaa kokonaisuuden ja lukujen suhteiden hahmottamista
  • ei ole esitysmuotona yhtä havainnollinen kuin kuvio.

Tilastokuvio keskittyy olennaiseen

Tilastokuvio tarjoaa jonkin kiinnostavan näkökulman, keskeisen tuloksen tai huomiota herättävän muutoksen lukijalle visuaalisessa muodossa. Se on hyvin havainnollinen, mutta usein epätarkka. Yksittäinen kuvio sopii parhaiten yhden tai korkeintaan muutaman tärkeimmän asian esiin nostaamiseen. Taulukoiden ja tilastokuvioiden tulee toimia aina myös itsenäisinä esityksinä ilman selittävää tekstiä.

Esimerkki 1. Tilastokuviona viivakuvio

Tässä esimerkissä inflaation kehitystä esitetään viimeisen vuosisadan ajalta viivakuviona. Se havainnollistaa hyvin ilmiön muutosta ajassa. Viivakuvioihin pääset tutustumaan tarkemmin osiossa 3.1 Viivakuvio.

Kuvio. Inflaation kehitys itsenäisyyden aikana

Esimerkissä 1, Tilastokuviona viivakuvio, selitteessä kerrotaan kuvion välittävän tietoa inflaation kehityksestä.

Lähde: Inflaatioluvut on laskettu elinkustannusindeksin perusvuodella 1914:1-6=100.

Yleisimmät kuviotyypit ovat viiva-, pystypylväs-, vaakapylväs- ja piirakkakuvio. Näihin tutustut seuraavassa osiossa 3 Yleisimmät kuviotyypit. Muita tavallisimpia kuvioita ovat pinotut pylväät, pyramidikuvio sekä teemakartta eli kartogrammi. Näitä ja muutamia muita käsitellään tarkemmin osiossa 4 Muita kuviotyyppejä.

Tilastokuvio

  • antaa mielikuvan trendeistä, määristä ja suhteista
  • on helposti ja nopeasti omaksuttava ja muistettava
  • välittää tiedot visuaalisesti
  • jää helposti mieleen (myös antaessaan väärän mielikuvan)
  • ei sovellu esittämään tarkkoja arvoja
  • esittää tiedon rajatusta näkökulmasta.

1.3 Tilastokuvion konteksti eli asiayhteys

Tilastokuvio syntyy tilastollisen tiedon tuottamisen prosessissa. Tilastokuvio vaatii suunnittelua, laskentaa ja pohdintaa sekä ymmärrystä tilastoitavan ilmiön luonteesta. Onnistunut kuvio edellyttää tekijältä lisäksi tilastollisten peruskäsitteiden ja määritelmien tuntemusta. Tehokas tilastotiedonhaku -oppaasta voit lukea lisää sekä näistä että näkökulman merkityksestä. Samasta oppaasta opit myös tilastotiedon taustoista, kuten metatiedoista ja viiteajankohdan merkityksestä.

Tilastot kuvaavat ilmiötä ennalta yhteisesti sovittujen ja tarkoin määriteltyjen käsitteiden, määritysten ja rajausten pohjalta. Tilastotiedot voivat vaikuttaa joskus vääriltä varsinkin, jos vertaat niitä omaan arkikokemukseesi. Hyvä esimerkki on vaikkapa rikosten määrä. Se kuva, mikä median otsikoita ja sosiaalisen median keskustelupalstoja seuraamalla ilmiöstä helposti välittyy, ei välttämättä ole yhdenmukainen tilastojen valossa tehtävien päätelmien kanssa. Tilastokeskuksen Faktanvartija -podcast (Soundcloud) tarttuu aiheeseen mielenkiintoisella tavalla ja avaa rikosten tilastointiin liittyviä haasteita.  

Tilastotieto kuvaa asioita yleisellä tasolla, eikä siitä ole mahdollista tehdä yksilötason päätelmiä. Vaikka suvussasi kaikki ovat eläneet satavuotiaaksi, koko väestöä koskeva elinajanodote kertoo ihan muuta. Tilastolliset käsitteet eivät myöskään välttämättä tarkoita samaa kuin arkikielen käsitteet ja niille annetut merkitykset. Tilastokuviossa voidaan kertoa nuorisotyöttömyyden jakautumisesta alueittain, mutta mitä oikeastaan tarkoitetaan nuorisotyöttömyydellä? Määrittelystä riippuu, miten suuresta joukosta puhutaan.  

Seuraavissa kuvioissa havainnollistetaan viivakuvioin ajankohdan merkitystä. Esimerkissä 2 näkyy selvästi työllisyysasteen säännönmukainen vaihtelevuus, kun taas esimerkissä 3 esitetään samasta ilmiöstä selvästi lyhyempi ajanjakso, jolloin vaihtelua on mahdoton nähdä. 

Esimerkki 2. Ajankohdan merkitys, osa I

Alla olevassa tilastokuviossa esitetään työllisyysasteen vaihtelua vuosittain. Työllisyysaste vaihtelee kuukausittain, ja selvä piikki työllisyyden lisääntymisessä osuu aina kevääseen maalis‒toukokuun kohdalle. Tämä ilmiö johtuu valmistuvien opiskelijoiden siirtymisestä tuolloin työmarkkinoille.

Millainen kuvio olisi, jos ajankohdaksi valittaisiin vain aikaväli kesäkuusta 2021 tammikuuhun 2022? Hahmottaisitko siitä koko ilmiön? Katso esimerkki 3. 

Kuvio. Työllisyysaste vuosina 2010–2022

Esimerkissä 2, Ajankohdan merkitys, osa 1, selitteessä kerrotaan kuvion välittävän tietoa työllisyysasteesta.

Lähde: Tilastokeskus, työvoimatutkimus, taulukko 135z. Työvoimatutkimuksen tärkeimmät tunnusluvut, niiden kausitasoitetut aikasarjat sekä kausi- ja satunnaisvaihtelusta tasoitetut trendit, 2010M01– (StatFin)

Seuraavassa esimerkissä aihe säilyy samana mutta tällä kertaa tarkasteluajankohta on aiempaan esimerkkiin verrattuna selvästi lyhyempi. Viivojen muodot ja luonne poikkeavat merkittävästi toisistaan, vain erilainen aikajänne erotuksena. Miten nyt tulkitsisit kuviota? 

Esimerkki 3. Ajankohdan merkitys, osa II

Alla olevassa kuviossa esitellään työllisyysasteen kehitys kesäkuusta 2021 tammikuuhun 2022. Tästä kuviosta voisi saada käsityksen, että työllisyys on romahtanut, jollei tuntisi koko ilmiötä eli työllisyyden kausivaihtelua. Kuviolla välittää virheellisen päätelmän työllisyydestä, ja sen käyttöä tällaisessa muodossa kannattaisikin välttää. 

Kuvio. Työllisyysaste kesäkuusta 2021 tammikuuhun 2022

Esimerkissä 2, Ajankohdan merkitys, osa 2, selitteessä kerrotaan kuvion välittävän tietoa työllisyysasteesta.

Lähde: Tilastokeskus, työvoimatutkimus, taulukko 135z. Työvoimatutkimuksen tärkeimmät tunnusluvut, niiden kausitasoitetut aikasarjat sekä kausi- ja satunnaisvaihtelusta tasoitetut trendit, 2010M01– (StatFin)


Tunnetko visuaaliseen esittämiseen liittyvät käsitteet?

Huomaa, että monet numeerisen tiedon visualisoinnin käsitteistä eivät ole vielä vakiintuneita, ja eri aloilla saatetaan käyttää termejä hieman eri merkityksissä.

  • Data-analytiikka tarkoittaa numeerisen tai laadullisen datan käsittelyä sellaiseen muotoon, missä sitä voi hyödyntää. Prosessi sisältää useita vaiheita, esim. datan tallennusta, tietovarastointia, käsittelyä, mallinnusta ja visualisointia sekä laskentaa.
  • Infografiikka on yleistermi graafisille esityksille, joiden tarkoitus on vahvistaa välitettävää viestiä. Infografiikka on usein ns. käsin koottua ja eroaa näin tilastografiikasta, jonka on tuottanut jokin laskentaohjelma. Joskus infografiikaksi kutsutaan myös sitä, kun samaan esitykseen on koottu useita tilastograafisia esityksiä vierekkäin.
  • Informaatiomuotoilu tarkoittaa kaikkea tiedon esitystavan jäsentelyä ja muotoilua mahdollisimman selkeäksi.
  • Tilastografiikka tarkoittaa sellaista tilastotiedon visualisointia, jonka tekemisessä noudatetaan tilastotieteen piirissä muodostuneita sääntöjä ja hyviä käytäntöjä.
  • Visualisointi tarkoittaa laajimmillaan minkä tahansa näkyväksi tekemistä. Yleensä visualisoinnin tarkoitus on paljastaa aineiston piileviä ominaisuuksia, ei niinkään välittää tiettyä viestiä samassa mielessä kuin infografiikan.