Tilastokuviot tutuksi
Tilastokuviossa lukumäärätietoa esitetään erilaisten kuviotyyppien avulla, esimerkiksi pylväillä ja aikasarjaa kuvaavilla viivoilla. Kuviosta saa nopean käsityksen tilastotiedon kuvaamasta ilmiöstä, siinä tapahtuneista muutoksista ja kehityksestä. Kuviomuotoinen tieto on helppo muistaa, mutta siinä voi piillä myös pieni riski. Jos kuvio aiheuttaa vääränlaisen mielleyhtymän keskeisistä tuloksista, se saattaa jäädä paremmin mieleen kuin vaikkapa tekstissä esitetyt perustellut faktat.
Tilastokuviolla havainnollistetaan keskeisiä tietoja. Voit vertailla tietoja esimerkiksi eri alueiden välillä, naisten ja miesten välisiä osuuksia tai vaikkapa talouden suhdanteiden mukaan aikasarjassa nähtäviä poikkeamia työllisyydessä. Kuviolla voidaan esittää suurikin määrä tietoa pienessä tilassa, toisin kuin jos kirjoittaisi saman tietosisällön auki tekstiksi.
Tilastokuviolla voi osoittaa mm.
Ruotsalainen jo edesmennyt väestö- ja terveystilastotieteeseen perehtynyt lääkäri Hans Rosling oli edellä aikaansa monella tapaa. Yksi hänen merkittävimmistä saavutuksistaan liittyy kekseliääseen tapaan havainnollistaa tilastotietoa. Luennoillaan hän saattoi esimerkiksi demonstroida väestönkehityksen muutoksia pinoamalla laatikoita torneiksi. Seuraavalla englanninkielisellä videolla Rosling tiivistää neljään minuuttiin väestöhistorian 200 vuotta hyödyntäen virtuaalisia graafisen esittämisen keinoja.
Tilastotietoa voidaan esittää eri tavoilla riippuen kontekstista ja siitä, mitä asioita halutaan tuoda esille. Teksteillä, taulukoilla ja kuvioilla voidaan havainnollistaa eri tyyppisiä asioita ja niitä käytetäänkin eri tilanteissa.
Teksti on esitystavoista subjektiivisin eli se on jo tulkittua tietoa. Aineistosta voisi tehdä ehkä myös muitakin tulkintoja. Tilastotekstissä on yleensä paljon lukuja, mikä tekee tekstistä vaikean ymmärtää. Varsinkin suuria lukuja on vaikea hahmottaa.
Teksti
Tilastotaulukko on perinteinen tapa järjestää numeerinen aineisto tiiviiseen ja helposti omaksuttavaan muotoon. Tyypillisin taulukkotyyppi on havaintotaulukko eli matriisi, mutta tilastotietoa voidaan esittää myös muunlaisessa taulukossa, esimerkiksi hierarkkisessa taulukossa. Taulukkoon voidaan kerätä tietoja useammasta eri lähteestä, ja se, mitä taulukkoon on valikoitunut, on tekijän subjektiivinen tulkinta alkuperäisestä datasta. Yleisenä periaatteena on hyvä muistaa, että jokaisen kuvion luvut voi esittää taulukkona, mutta jokaista taulukkoa ei voi esittää kuviona tai ainakaan yhtenä kuviona.
Taulukossa käytetään erilaisia merkintätapoja. Näin tehdään esimerkiksi silloin, jos tietoa ei ole saatu, se on liian epävarma esitettäväksi tai kyseessä on ennakkotieto. Taulukkoesimerkkeihin voit tutustua esimerkiksi Suomi lukuina -palvelussa, jossa on tilastotietoa saatavilla kattavasti eri aihealueilta sekä lisäksi kansainvälistä vertailutietoa.
Lisätietoja taulukoista:
Taulukko
Tilastokuvio tarjoaa jonkin kiinnostavan näkökulman, keskeisen tuloksen tai huomiota herättävän muutoksen lukijalle visuaalisessa muodossa. Se on hyvin havainnollinen, mutta usein epätarkka. Yksittäinen kuvio sopii parhaiten yhden tai korkeintaan muutaman tärkeimmän asian esiin nostaamiseen. Taulukoiden ja tilastokuvioiden tulee toimia aina myös itsenäisinä esityksinä ilman selittävää tekstiä.
Tässä esimerkissä inflaation kehitystä esitetään viimeisen vuosisadan ajalta viivakuviona. Se havainnollistaa hyvin ilmiön muutosta ajassa. Viivakuvioihin pääset tutustumaan tarkemmin osiossa 3.1 Viivakuvio.
Kuvio. Inflaation kehitys itsenäisyyden aikana
Lähde: Inflaatioluvut on laskettu elinkustannusindeksin perusvuodella 1914:1-6=100.Yleisimmät kuviotyypit ovat viiva-, pystypylväs-, vaakapylväs- ja piirakkakuvio. Näihin tutustut seuraavassa osiossa 3 Yleisimmät kuviotyypit. Muita tavallisimpia kuvioita ovat pinotut pylväät, pyramidikuvio sekä teemakartta eli kartogrammi. Näitä ja muutamia muita käsitellään tarkemmin osiossa 4 Muita kuviotyyppejä.
Tilastokuvio
Tilastokuvio syntyy tilastollisen tiedon tuottamisen prosessissa. Tilastokuvio vaatii suunnittelua, laskentaa ja pohdintaa sekä ymmärrystä tilastoitavan ilmiön luonteesta. Onnistunut kuvio edellyttää tekijältä lisäksi tilastollisten peruskäsitteiden ja määritelmien tuntemusta. Tehokas tilastotiedonhaku -oppaasta voit lukea lisää sekä näistä että näkökulman merkityksestä. Samasta oppaasta opit myös tilastotiedon taustoista, kuten metatiedoista ja viiteajankohdan merkityksestä.
Tilastot kuvaavat ilmiötä ennalta yhteisesti sovittujen ja tarkoin määriteltyjen käsitteiden, määritysten ja rajausten pohjalta. Tilastotiedot voivat vaikuttaa joskus vääriltä varsinkin, jos vertaat niitä omaan arkikokemukseesi. Hyvä esimerkki on vaikkapa rikosten määrä. Se kuva, mikä median otsikoita ja sosiaalisen median keskustelupalstoja seuraamalla ilmiöstä helposti välittyy, ei välttämättä ole yhdenmukainen tilastojen valossa tehtävien päätelmien kanssa. Tilastokeskuksen Faktanvartija -podcast (Soundcloud) tarttuu aiheeseen mielenkiintoisella tavalla ja avaa rikosten tilastointiin liittyviä haasteita.
Tilastotieto kuvaa asioita yleisellä tasolla, eikä siitä ole mahdollista tehdä yksilötason päätelmiä. Vaikka suvussasi kaikki ovat eläneet satavuotiaaksi, koko väestöä koskeva elinajanodote kertoo ihan muuta. Tilastolliset käsitteet eivät myöskään välttämättä tarkoita samaa kuin arkikielen käsitteet ja niille annetut merkitykset. Tilastokuviossa voidaan kertoa nuorisotyöttömyyden jakautumisesta alueittain, mutta mitä oikeastaan tarkoitetaan nuorisotyöttömyydellä? Määrittelystä riippuu, miten suuresta joukosta puhutaan.
Seuraavissa kuvioissa havainnollistetaan viivakuvioin ajankohdan merkitystä. Esimerkissä 2 näkyy selvästi työllisyysasteen säännönmukainen vaihtelevuus, kun taas esimerkissä 3 esitetään samasta ilmiöstä selvästi lyhyempi ajanjakso, jolloin vaihtelua on mahdoton nähdä.
Alla olevassa tilastokuviossa esitetään työllisyysasteen vaihtelua vuosittain. Työllisyysaste vaihtelee kuukausittain, ja selvä piikki työllisyyden lisääntymisessä osuu aina kevääseen maalis‒toukokuun kohdalle. Tämä ilmiö johtuu valmistuvien opiskelijoiden siirtymisestä tuolloin työmarkkinoille.
Millainen kuvio olisi, jos ajankohdaksi valittaisiin vain aikaväli kesäkuusta 2021 tammikuuhun 2022? Hahmottaisitko siitä koko ilmiön? Katso esimerkki 3.
Kuvio. Työllisyysaste vuosina 2010–2022
Seuraavassa esimerkissä aihe säilyy samana mutta tällä kertaa tarkasteluajankohta on aiempaan esimerkkiin verrattuna selvästi lyhyempi. Viivojen muodot ja luonne poikkeavat merkittävästi toisistaan, vain erilainen aikajänne erotuksena. Miten nyt tulkitsisit kuviota?
Alla olevassa kuviossa esitellään työllisyysasteen kehitys kesäkuusta 2021 tammikuuhun 2022. Tästä kuviosta voisi saada käsityksen, että työllisyys on romahtanut, jollei tuntisi koko ilmiötä eli työllisyyden kausivaihtelua. Kuviolla välittää virheellisen päätelmän työllisyydestä, ja sen käyttöä tällaisessa muodossa kannattaisikin välttää.
Kuvio. Työllisyysaste kesäkuusta 2021 tammikuuhun 2022
Huomaa, että monet numeerisen tiedon visualisoinnin käsitteistä eivät ole vielä vakiintuneita, ja eri aloilla saatetaan käyttää termejä hieman eri merkityksissä.