Käytämme sivustollamme evästeitä. Välttämättömiä evästeitä tarvitaan, jotta sivusto toimii oikein. Muita evästeitä tarvitaan videoiden, podcastien ja palautepalvelun esittämiseen.
Lähtöaineistojen valinnassa on monia seikkoja, joita pitää ottaa huomioon.
Tämä osio perehdyttää sinut siihen, millaisia erilaisia aineistoja on olemassa, mistä niitä saat ja millaista aineistoa kannattaa käyttää tilastoteemakartan laadinnassa. Saat vinkkejä myös tilasto- ja kartta-aineistojen yhdistämiseen. Lopussa on lyhyt katsaus karttaprojektioista ja koordinaatistoista.
Tilastoteemakartan laadinnassa tarvitaan sijaintitiedon sisältäviä tilastoaineistoja tai tilastoaineistoja, joihin kartta-aineistoja voidaan yhdistää. Näille aineistoille on olemassa tiettyjä vaatimuksia.
Tilastoaineisto voi sisältää jo lähtökohtaisesti sijaintitiedon eli yleisimmin osoite- tai koordinaattitiedon. Jos sijaintitieto ei sisälly tilastoaineistoon, voidaan hyödyntää olemassa olevia kartta-aineistoja ja yhdistää ne tilastoaineistoon. Aineiston tietojen tulee vastata toisiaan, kun yhdistetään eri lähteiden ja eri vuosien tietoja. Vastaavuus tarkoittaa esimerkiksi sitä, että kartta- ja tilastoaineistossa on saman ajankohdan aluejako eli esimerkiksi saman vuoden kuntajako.
Aineistoa etsittäessä aineiston tietolähde ja lähteen luotettavuus tulee arvioida. Samalla tulee pohtia, sopiiko kyseinen aineisto luotettavan karttaesityksen laatimiseen.
Aineiston on oltava alueellisesti riittävän kattava ja aihetta kuvaava. Voidaan kysyä, edustaako aineisto koko tarkastelualuetta vai jääkö karttaan paljon tuntemattomia kohtia. Jos aineisto on kerätty otospoiminnalla, on aina selvitettävä, voidaanko aineistoa esittää alueellisesti ja mikä aluetaso (postinumeroalue, kunta, maakunta jne.) soveltuisi esittämiseen.
Alueyksikköä kohti tulee myös olla riittävästi tapauksia niin, että tieto antaa luotettavan kuvan kustakin alueyksiköstä. Jos tietoja ei sellaisenaan voida esittää jollain aluetasolla, voidaan miettiä, saisiko tiedot jollain luotettavalla menetelmällä vastaamaan kyseessä olevaa aluetasoa.
Tietosuoja eli henkilöiden yksityisyyden suojaaminen henkilötietojen käsittelyssä on tilastotoimen keskeinen perusperiaate. Alueilla, joilla väestöä tai muuta kuvattavaa ilmiötä on vähän, tietosuoja saattaa asettaa rajoituksensa tiedon esittämiselle. Osa väestöön liittyvistä tiedoista voi olla sisällöltään arkaluonteisia (esim. tulotiedot), joten ennen niiden esittämistä on varmistettava, etteivät yksittäisen henkilön tiedot ole tunnistettavissa. On siis tilanteita, joissa kaikkea tietoa ei voi esittää kaikilla aluetasoilla, vaikka tiedot olisivatkin saatavissa.
Paikkatietoaineistojen saatavuutta Suomessa on edistänyt Euroopan yhteisön paikkatietoinfrastruktuurin INSPIRE-direktiivin kansallinen toteuttaminen. Tavoitteena on ollut luoda paikkatiedon infrastruktuuri, joka koostuu eri organisaatioiden tuottamista paikkatietoaineistoista ja -palveluista.
Olemme koonneet tähän sekä avoimia ja ei-avoimia että maksuttomia ja maksullisia aineistolähteitä.
Suurimpia avoimien paikkatietoaineistojen tuottajia Suomessa ovat Maanmittauslaitoksen lisäksi muun muassa Väylävirasto, Luonnonvarakeskus, Suomen ympäristökeskus, Tilastokeskus ja Helsingin kaupunki.
Tilastokeskuksen avoimia paikkatietoaineistoja ovat mm. kuntapohjaiset tilastointialueet, väestöruutuaineistot kahdessa ruutukoossa ja tieliikenneonnettomuudet. Avoimet tilastotietokanta-aineistot löytyvät StatFin-tietokannasta. Maksullisia aluetuotteita ovat esimerkiksi Ruututietokanta ja Väestötilastopalvelu, minkä lisäksi tilastoaineistoja voi tilata myös erityisselvityksinä. Näiden aineistojen julkaiseminen, merkittävä hyödyntäminen tai kaupallinen käyttö tulee aina sopia erikseen Tilastokeskuksen kanssa.
Aineistoja koskevat Tilastokeskuksen maksuttomien tietojen yleiset käyttöehdot. Käyttöehdoissa myönnetään lupa tietojen veloituksettomaan ja vapaaseen hyödyntämiseen. Myös kaupallinen hyödyntäminen on näiden aineistojen osalta luvallista ilman erillistä sopimista Tilastokeskuksen kanssa. Näistä tiedoista laadittuun tilastoteemakarttaan on lisättävä lähdemaininta (Tilastokeskus, tilasto/palvelu, aineisto, vuosi).
Tilastoaineistoja tuottavat kansallisten tilastoviranomaisten lisäksi monet muut organisaatiot. Esimerkki seudullisesta palvelusta on Helsingin, Espoon, Vantaan ja Kauniaisten kaupunkien yhteinen avoimen datan palvelu. Palvelussa on tarjolla muun muassa Helsingin seudun väestöä, taloutta, hyvinvointia, työllisyyttä ja liikkumista koskevaa tietoa.
Tilastoteemakartan lähtöaineisto voi yksinkertaisimmillaan sisältää kartta-aineiston lisäksi vain aluetunnuksen eli aluetta yksilöivän tunnisteen (esimerkiksi kuntanumeron) ja kartassa esitettävän tilastomuuttujan (esimerkiksi väkiluvun). Tilasto- ja kartta-aineistojen yhdistämisen edellytyksenä on, että kartantekijällä on käytettävissään sellainen kartta-aineisto, jonka aluejaot vastaavat tilastoissa käytettyjä aluejakoja.
Aluejakoihin perustuvat kartta-aineistot voidaan karkeasti jakaa kahteen ryhmään:
Tilastoaineiston ja kartta-aineiston yhdistäminen tehdään yleensä paikkatieto-ohjelmalla. Tilastoaineistoa voit joskus joutua muokkaamaan jo ennen paikkatieto-ohjelmaan vientiä esimerkiksi Excelissä. Jos kuntatunnus on kartta-aineistossa tekstimuotoinen (016) ja tilastoaineistossa numeerinen (16), aineistojen yhdistäminen ei ilman muokkausta onnistu. Etunolla on tässä tapauksessa tärkeä säilyttää, joten tilastoaineistoa on muutettava.
Kuvio havainnollistaa, kuinka vasemmanpuoleinen kuntakartta-aineisto on yhdistetty oikeanpuoleiseen väestötilastoaineistoon. Näin muodostuu alimpana oleva taulu, jossa on tiedot molemmista aineistoista. Yhdistäminen on tehty kummassakin taulussa olevan kunta-sarakkeen perusteella.
Kuvio. Kartta- ja tilastoaineiston ominaisuuksien yhdistäminen
Tilastoaineiston muuttujan arvot vastaavat tietyn ajankohdan tilannetta kyseessä olevalla alueella. Esimerkiksi kuntien välillä tapahtunut osakuntaliitos ei välttämättä näy alueluokituksessa, mutta se on kuitenkin vaikuttanut tilastomuuttujan arvoihin ja kartta-aineiston aluejakoon. Toisin sanoen aiemman ajankohdan tilastoaineistot yhdistyvät uuteen kartta-aineistoon teknisesti, mutta laatunäkökulmasta aineistojen aluejaot eivät vastaa toisiaan.
Tilastovuosi ja tilastoissa käytetyn aluejaon ajankohta ovat usein eriävät. Tilastovuosi tarkoittaa ajankohtaa, jonka poikkileikkaustilanne tilastoaineisto on. Tilastoaineisto kuvaa sisällöllisesti tätä ajankohtaa, esimerkiksi väestön määrää vuonna 2024. Tilaston aluejaon ajankohta taas on yleensä sen vuoden aluejako, jonka aikana kyseinen tilasto tuotetaan. Esimerkiksi vuoden 2024 väestön lukumäärä ilmoitetaan vuoden 2025 kuntajaossa.
Tilastovuoden ja tilastoinnissa käytetyn aluejaon käytännöt voivat vaihdella tilastoittain. Luokituksen ajankohta kuvataan yleensä tilastoaineiston metatiedoissa.
Karttaprojektion avulla maapallon kolmiulotteinen pinta voidaan kuvata kaksiulotteisella karttatasolla. Maailmalla on kehitetty useita erilaisia projektioita, jotka soveltuvat eri käyttötarkoituksiin. Tunnettuja ovat esimerkiksi Mercatorin, Gauss-Krügerin ja Lambertin projektiot. Käytettävä karttaprojektio ja koordinaattijärjestelmä on otettava huomioon erityisesti silloin, kun käytetään samanaikaisesti useita eri kartta-aineistoja.
Koko maapallon kattavissa aineistoissa käytetään usein Yhdysvaltain puolustusministeriön määrittelemää ja ylläpitämää WGS84 (World Geodetic System) -tasokoordinaattijärjestelmää, joka on myös GPS-paikannusjärjestelmän käyttämä koordinaattijärjestelmä.
Suomen kartoissa käytetään yleiseurooppalaista ETRS89 (European Terrestrial Reference System 1989) -koordinaattijärjestelmää, jonka kansallisia realisaatioita eli toteutumia ovat ETRS-TM35FIN- ja ETRS-GK-tasokoordinaatistot. ETRS89 on helpottanut kansainvälistä tietojenvaihtoa esimerkiksi Euroopan unionin INSPIRE-direktiivin puitteissa.
Koko maan laajuisissa kartoissa käytetään yleensä ETRS-TM35FIN-koordinaatistoa, jossa Suomi on kuvattu yhdelle projektiokaistalle, jossa koordinaatisto jatkuu yli koko maan. Paikallisella tasolla, kuten kunnissa, sen sijaan käytetään usein ETRS-GK-koordinaatistoa, jossa kapeamman projektiokaistan ansiosta projektiovirheet jäävät pienemmiksi. Tilastokeskuksen paikkatietoaineistot ovat ETRS-TM35FIN-koordinaatistossa.