Siirry pääsisältöön
Tilasto-oppaat
Tilastokeskuksen etusivulle

Kuinka teen tilastotutkimuksen?

2 Tietojen kerääminen

2.1 Keneltä keräät tietoja?

​Tutkimuksen suunnittelun ja kysymysten muotoilun jälkeen seuraava työvaihe on tietojen kerääminen.

Oletetaan, että luokallasi on 20 oppilasta. Tilastotieteen termein luokan oppilaita kutsutaan perusjoukoksi. Koska kyseessä on kohtalaisen pieni vastaajajoukko, on järkevää kysyä samat kysymykset kaikilta oppilailta. Tilastotieteen termein kyseessä on tällöin kokonaisotos

Voit kerätä tiedot oppilailta jakamalla heille kysymykset paperilla tai tekemällä nettikyselyn.

Olisi hyvä, jos oppilaat voisivat vastata kysymyksiin samaan aikaan ja samassa tilanteessa, esimerkiksi samalla tunnilla. Näin saat vastaukset kontrolloidusti yhdenmukaisina ja vastaamiseen mahdollisesti vaikuttavat ulkoiset olosuhteet ovat kaikille samat.

Kuvassa lemmikkikani istuu tarkkaavaisena pitkän ruohikon keskellä.

 

2.2 Entä jos joku ei vastaa?

Saattaa olla, että luokan oppilaista esimerkiksi kaksi on sairaana tutkimuspäivänä. Nämä oppilaat kuitenkin ovat luokan oppilaita ja kuuluvat perusjoukkoon. Samoin perusjoukkoon kuuluu myös sellainen oppilas, joka ei halua vastata kyselyyn. Nämä puuttuvat vastaukset edustavat tilastollisin termein katoa.

Oletetaan, että sinä itse tiedät tai muut oppilaat tietävät oikeat vastaukset näihin puuttuviin vastauksiin. Tällöin voit täydentää eli tilastollisin termein imputoida nämä vastaukset aineistoosi vastaamalla puuttuvien oppilaiden puolesta. Sinun pitää kuitenkin huolehtia siitä, että näin saadut tiedot ovat riittävän luotettavia. Jos esimerkiksi vastaat luokkakaverisi puolesta kyselyyn, sinun tulee oikeasti tietää, mitä hän vastaisi, eikä vain arvailla. Voit esimerkiksi tarkistaa kännykällä, miten koulukaverisi vastaisi kyselyyn. Lähtökohtaisesti jokaisen tulisi kuitenkin vastata kyselyyn itse.

Seuraavaksi tutustutaan yhteen keskeiseen tilastolliseen termiin, havaintomatriisiin.

2.3 Kokoa vastaukset havaintomatriisiksi

Siirrytään seuraavaan työvaiheeseen. Kun olet saanut vastaukset kyselyysi kaikilta, ne kootaan taulukoksi eli tilastollisin termein havaintomatriisiksi. Tämä on tutkimuksesi onnistumisen kannalta tärkeä työvaihe.

Sinun tulee käydä vastaukset läpi ja tarkistaa, onko kaikkiin kysymyksiin vastattu, ovatko vastaukset luettavissa ja ovatko ne järkeviä. Harvalla on norsua tai leijonaa lemmikkinä, ehkei myöskään 20 lemmikkiä. Kaikista tilastoaineistoista etsitään virheitä ja korjataan niitä. Tämä on aineiston korjailua eli tilastollisin termein editointia. Tätä vaihetta et voi myöskään ohittaa.

Otetaan esimerkki. Oletetaan, että kysyt luokaltasi kolme suunnittelemaasi tutkimuskysymystä, ja kaikki 20 oppilasta vastaavat niihin. Kukaan ei ole poissa, eikä kukaan kieltäydy vastaamasta. Kokoat saamasi vastaukset havaintomatriisiksi aineistosi tarkistamista varten.

Alla on havaintomatriisi, johon on koottu 20 oppilaan vastaukset. Lyhenne EV tarkoittaa, ettei oppilas ole antanut vastausta.

Taulukko. Havaintomatriisi
Kysymys Oppilas 1 Oppilas 2 Oppilas 3 Oppilas 4 Oppilas 5 Oppilas 6 Oppilas 7 Oppilas 8 Oppilas 9 Oppilas 10 Oppilas 11 Oppilas 12 Oppilas 13 Oppilas 14 Oppilas 15 Oppilas 16 Oppilas 17 Oppilas 18 Oppilas 19 Oppilas 20
1. Onko sinulla jokin lemmikkieläin? Kyllä Ei Kyllä Kyllä Kyllä Kyllä Ei Ei Kyllä Kyllä Ei Kyllä Kyllä Ei Kyllä Kyllä Kyllä Kyllä Kyllä Kyllä
2.1 Onko lemmikkisi koira? Kyllä Ei Kyllä Kyllä Kyllä Kyllä Ei Ei Kyllä Kyllä Ei Kyllä Kyllä Ei Ei Kyllä Ei Kyllä Ei Kyllä
2.2 Onko lemmikkisi kissa? Ei Ei Ei Kyllä Ei Ei Ei Ei Ei Ei Ei Ei Ei Ei Kyllä Ei Kyllä Ei Kyllä Ei
2.3 Onko lemmikkisi kani? Kyllä Ei Ei Ei Ei Ei Ei Ei Ei Ei Ei Ei Ei Ei Kyllä Ei Ei Ei Ei Ei
2.4.a Onko lemmikkisi jokin muu? Ei Ei Ei Ei Ei Kyllä Ei Ei Ei Ei Ei Ei Ei Ei Kyllä Ei Ei Ei Ei Ei
2.4.b Mikä muu lemmikkisi on? [ei muuta] [ei muuta] [ei muuta] [ei muuta] [ei muuta] Käärme [ei muuta] [ei muuta] [ei muuta] [ei muuta] [ei muuta] [ei muuta] [ei muuta] [ei muuta] Marsu [ei muuta] [ei muuta] [ei muuta] [ei muuta] [ei muuta]
3. Jos sinulla on lemmikki, pidätkö siitä? Kyllä [EV] Kyllä Kyllä Kyllä Ei [EV] [EV] Kyllä Kyllä [EV] Ei Kyllä [EV] Kyllä Kyllä Kyllä Kyllä Kyllä Ei

Kertaa käsitteitä

  • Editoiminen tarkoittaa tilastoaineiston virheiden etsintää ja korjaamista.
  • Havaintomatriisi on taulukko, jonka kukin rivi vastaa perusjoukon alkiota (kuten henkilöä) ja jonka kukin sarake sisältää tiedot jonkin ominaisuuden mittauksista (esim. henkilöiden pituus).
  • Imputointi tarkoittaa keinoa paikata havaintoaineistossa olevia puutteita tai korvata poikkeavuuksia. Imputointimenetelmiä on useita. 
  • Kato tarkoittaa niitä otokseen kuuluvia, joilta ei ole saatu kerätyksi tietoja: osaa ei tavoiteta, osa kieltäytyy vastaamasta tai ei kykene vastaamaan esimerkiksi puutteellisen kielitaidon vuoksi. 
  • Kokonaisotos käsittää kaikki tutkimuksen kohteena olevan perusjoukon alkiot.
  • Otos tarkoittaa varsinaisesta kohderyhmästä poimittua näytettä, jonka perusteella voidaan saada kuva koko kohderyhmän ominaisuuksista.
  • Perusjoukko on tutkimuksen kohteena oleva ryhmä, jota koskevia tietoja halutaan kerätä, esimerkiksi Suomen peruskouluissa opiskelevat oppilaat.