Tutkimusaineistot etäkäytössä
Tilastoinnin kohteiden ts. tilastoaineistoissa esiintyvien havaintojen kannalta tietosuojasta huolehtiminen on tärkeää. Yksittäistä henkilöä, kotitaloutta, yritystä tai muuta tilastoyksikköä koskevien tietojen paljastuminen ulkopuolisille on estettävä.
Tietosuoja kattaa muun muassa:
Tutkijana sinun on osaltasi huolehdittava käytössäsi olevan aineiston tietosuojasta siten, etteivät aineisto tai sen sisältämät yksikkökohtaiset tiedot paljastu ulkopuolisille aineiston käsittelyvaiheessa tai tutkimustuloksia julkaistaessa. Tietosuojasäännökset, kuten EU:n yleinen tietosuoja-asetus ja tietosuojalaki (2018/1050), suojaavat tutkimuksen kohteina olevia henkilöitä. Lisätietoa tietosuojasta tieteellisessä tutkimuksessa löydät Tietosuojavaltuutetun toimiston tieteellistä tutkimusta koskevilta sivuilta.
Tilastokeskuksen oikeus kerätä rekisteri- ja kyselytietoja on taattu lainsäädännöllä. Kerätyt aineistot ovat laajasti yhteiskuntaa kuvaavia ja sisältävät hyvin arkaluontoisiakin tietoja.
Tilastokeskus voi tilastolain (280/2004) nojalla antaa käyttöoikeuden hallussaan oleviin, tilastointia varten kerättyihin salassa pidettäviin tietoihin tieteellistä tutkimusta ja yhteiskuntaoloja koskevaa tilastollista selvitystä varten.
Tilastolaissa Tilastokeskuksen tilastotarkoituksiin keräämien tietojen luovutuksesta tutkimuskäyttöön säädetään pykälässä 13. Kyseisen pykälän perusteluissa todetaan seuraavaa[1]:
"Tietoja luovutettaessa olisi henkilötietojen sekä liike- ja ammattisalaisuutta koskevien tietojen suoja varmistettava tapauskohtaisesti käytännön toimenpiteillä kuten esimerkiksi edellyttämällä riittäviä tietoturvamenettelyjä sekä huolehtimalla tarvittavan tietojen käyttöä koskevan valvonnan ja seurannan järjestämisestä. – – Koska tieteellisen tutkimuksen lopputulokset ovat yleensä julkisia, tulisi niiden julkaisemisen yhteydessä lisäksi aina erikseen varmistaa, ettei tutkimuksen perustana olleita yksittäisiä tilastoyksiköitä olisi mahdollista tunnistaa tutkimuksen julkisista lopputuloksista.”
[1] Hallituksen esitys eduskunnalle laeiksi tilastolain sekä maaseutuelinkeinotilastoista annetun lain 2 ja 3 §:n muuttamisesta (HE 154/2012).
Tilastokeskuksen yksikkötason aineistojen käyttö edellyttää käyttölupaa. Tietoja saa käyttää ainoastaan käyttöluvan saanut henkilö ja vain käyttölupapäätöksessä hyväksyttyyn tarkoitukseen. Tietojen kohteita ei saa yrittää tunnistaa aineistosta.
Allekirjoittamalla tutkimushanketta tai SISU-mikrosimulointimallin käyttöä koskevan sopimuksen sekä salassapitositoumuksen sitoudut siihen, ettet ilmaise etkä käytä omaksi hyödyksesi tutkimuksen yhteydessä tietoosi saamia, salassapidettäviksi säädettyjä tietoja (eli tutkimusaineistoon sisältyviä yksikkötason henkilö- ja yritystietoja).
Tilastolliset tietosuojamenetelmät ovat menetelmiä, joiden avulla julkaistava (aggregoitu) aineisto muokataan muotoon, josta yksittäisen tiedonantajan tai tilastoyksikön (henkilö, kotitalous, yritys, toimipaikka yms.) tietoja ei paljastu. Koska taulukkoaineisto on yleinen tutkimustulosten esittämistapa, saat tästä osiosta tietoa taulukkoaineistojen tilastolliseen tietosuojaan liittyvästä käsitteistöstä, paljastumisriskistä ja suojausmenetelmistä.
Tutkimustulos voi olla muukin aggregoitu aineisto kuin taulukkoaineisto, kuten esimerkiksi graafi tai yksittäinen jakaumatunnusluku. Näihin sovellettavista tietosuojasäännöistä löydät lisää tietoa Tutkijapalveluiden säännöistä ja ohjeista sekä osiosta 3.4 Tutkimustulosten tietosuojavaatimukset. Huomaathan, että tietosuojaa on noudatettava kaikissa julkaistavissa tiedoissa.
Taulukkoaineistojen (lyh. taulukko) suojaukseen on vaikea antaa tarkkoja, kaikkiin taulukoihin soveltuvia ohjeita, sillä taulukkoaineistoja on hyvin monenlaisia. Taulukot voivat poiketa toisistaan niin sisällön, rakenteen, julkaisukonseptin kuin käyttötarkoituksenkin perusteella, joten pahimmillaan jokainen taulukko muodostaa suojauksen kannalta oman erikoistapauksensa. Mitä paremmin olet ottanut huomioon kunkin taulukon erityispiirteet, sitä paremmin voit suojata taulukon säilyttäen samalla sen suunnitellun käyttötarkoituksen kannalta tärkeät ominaisuudet.
Taulukkoaineistolla tarkoitetaan taulukkomuotoon järjestettyä aggregoitua aineistoa. Taulukot voidaan jakaa frekvenssitaulukoihin ja määrätaulukoihin.
Myös esimerkiksi jakaumatunnuslukuja voidaan esittää koottuna yhteen taulukkoon, mutta tällaisen tunnuslukutaulukon suojaamiseen sovelletaan siinä esiintyvien jakaumatunnuslukujen tietosuojasääntöjä. Lisätietoja Tutkijapalveluiden säännöistä ja ohjeista.
Taulukkoaineistosta paljastuminen tarkoittaa mahdollisuutta määritellä yksikön identiteetti tai jokin ominaisuus tarkemmin kuin ilman taulukon julkaisemista. Paljastuminen voi olla joko tarkkaa tai likimääräistä.
Määrätaulukoissa paljastuminen tarkoittaa yleisimmin sitä, että tietyn tilastoyksikön taulukoitavan muuttujan arvo pystytään estimoimaan liian tarkasti taulukon lukujen ja rakenteen avulla. Varsinkin yritysaineistojen kohdalla likimääräinen paljastuminen voi olla aivan yhtä haitallista kuin tarkka paljastuminen.
Ensimmäisessä vaiheessa arvioidaan taulukon suojaustarve, eli tunnistetaan paljastumisriskissä olevat, eli ns. herkät solut, valitun herkkyyssäännön avulla. Toinen vaihe esitellään kohdassa Taulukkoaineistojen suojausmenetelmät.
Yleisimmät herkkyyssäännöt ovat seuraavat:
Frekvenssitaulukossa solu on herkkä, jos siihen kuuluu vain vähän tilastoyksiköitä, eli toisin sanoen soluun liittyvä luokittelevien muuttujien arvokombinaatio on harvinainen. Tällaiset pienen solufrekvenssin takia herkäksi määriteltävät solut löydät kynnysarvosäännön avulla. (katso Esimerkki 1).
Kynnysarvon käyttö on suositeltavaa, kun ainoastaan tarkalta paljastumiselta (esim. henkilö voidaan tarkasti identifioida) suojaaminen katsotaan riittäväksi.
Teet taulukon, jossa on ristiintaulukoituna henkilön ikäluokka, asuinkunta ja siviilisääty. Solujen herkkyyden määrittelyssä olet päättänyt käyttää kynnysarvoa 3. Taulukoituasi tiedot huomaat, että alle 20-vuotiaita leskiä on kunnassa X vain kaksi kappaletta.
Tällöin luokittelevien muuttujien kombinaatio:
on kynnysarvosäännön mukaan liian harvinainen, sillä solufrekvenssi 2 on pienempi kuin kynnysarvo 3. Tähän soluun kuuluvien henkilöiden paljastumisriski on siis liian suuri, joten solun tiedot on suojattava ennen taulukon julkaisua.
Määrätaulukossa solun voi määritellä herkäksi myös, jos yksi tai muutama yksikkö dominoi solun arvoa, eli on arvoltaan selvästi suurempi muihin yksiköihin verrattuna. Tällöin voi olla mahdollista estimoida dominoivien yksiköiden arvot liian tarkasti (vaikkei välttämättä aivan tarkasti). Liian tarkalta estimoinnilta suojaaminen tarkoittaa likimääräiseltä paljastumiselta suojaamista, ja sen voit toteuttaa käyttämällä dominanssisääntöä suojattavien solujen määrittelyyn (katso Esimerkki 2 ja Esimerkki 3).
Voit käyttää rinnakkain useampaa herkkyyssääntöä. Tällöin solu on herkkä, jos se yhdenkin käytetyn herkkyyssäännön mukaan on herkkä.
Taulukon erään solun kokonaisarvon X muodostaa kolme havaintoa, joiden arvot suuruusjärjestyksessä ovat seuraavat:
Solun kokonaisarvo on tällöin x1 + x2 + x3 = 59 + 27 + 14 = 100. Haluat tutkia, dominoiko jokin tai jotkin havainnot solun arvoa X. Käytät dominanssisääntöä parametrein n = 1 ja k = 75 eli tarkistat muodostaako yksi (suurin) havainto solun arvosta vähintään 75 prosenttia. Solun suurin havainto x1 muodostaa x1/ X = 59/100 = 0,59 eli 59 % solun kokonaisarvosta. Koska 75 > 59, niin valitun dominanssisäännön mukaan suurin havainto ei dominoi (eikä näin ollen mikään muukaan havainto) solun arvoa tarpeeksi, jotta solu vaatisi suojausta.
Taulukon erään solun kokonaisarvon X muodostaa kaksitoista havaintoa. Suurimman havainnon arvo on x1 = 61 ja toiseksi suurimman havainnon arvo on x2 = 20. Loppujen kymmenen havainnon yhteenlaskettu arvo on x3‒12 = 19.
Onko solu suojattava, kun käytössä on:
a. dominanssisääntö n = 1 ja k = 60
b. dominanssisääntö (2,90)
c. kynnysarvo 3 ja dominanssisääntö (1,60)?
Ratkaisu: Solun kokonaisarvo X on 61 + 20 + 19 = 100.
a. Suurin havainto muodostaa x1 /X = 61/100 = 0,61 eli 61 % solun kokonaisarvosta. Koska 61 > 60, niin solu on suojattava.
b. Kaksi suurinta havaintoa muodostavat (x1 + x2) / X = (61 + 20)/100 = 0,81 eli 81 % solun kokonaisarvosta. Koska 81 ≤ 90 niin solua ei tarvitse suojata.
c. Kun käytössä on yhtä aikaa kaksi herkkyyssääntöä, solu on suojattava, jos vähintään toinen säännöistä edellyttää suojausta. Kuten a-kohdassa jo todettiin, solu on suojattava dominanssisäännön (1,60) ollessa käytössä. Tästä seuraa, että solu on suojattava myös kun käytössä ovat molemmat, sekä kynnysarvo 3 että dominanssisääntö (1,60). Pelkän kynnysarvon 3 perusteella solua ei tarvitsisi suojata.
Taulukon suojausprosessin toisessa vaiheessa herkkien solujen tiedot suojataan valitulla suojausmenetelmällä. Ensimmäinen vaihe eli suojaustarpeen arviointi esiteltiin kohdassa Paljastuminen taulukkoaineistosta. Suojausmenetelmän valinnassa tärkeimmät kriteerit ovat vaaditun suojaustason saavuttaminen ja taulukon tärkeiden ominaisuuksien säilyttäminen. Näin taulukko on riittävästi suojattu, mutta se on hyödyllinen suojauksen jälkeenkin.
Usein menetelmän valintaan vaikuttaa paljon käytettävissä olevat resurssit, kuten aika ja saatavilla oleva ohjelmisto, jolla suojaus toteutetaan. Suojausmenetelmän tulisi olla lisäksi läpinäkyvä siten, että suojatun taulukon käyttäjä ymmärtää käytetyn suojausmenetelmän pääpiirteet ja näin osaa ottaa huomioon suojauksen mahdollisesti aiheuttamat muutokset taulukossa.
Peittämiseen kuuluu ensisijainen, paljastumisriskissä olevien solujen peittäminen ja toissijainen peittäminen. Toissijaisella peittämisellä varmistat, ettei taulukon rivi- tai saraketotaalien avulla pystytä paljastamaan ensisijaisesti peitettyjen solujen arvoja. Peittämisen voit tehdä myös rivikohtaisesti. Jos taulukon johonkin rivitotaaliin kuuluu vain pieni määrä tilastoyksiköitä (vähemmän kuin käytetty kynnysarvo), peität kyseisen rivin kokonaisuudessaan huomioimatta sen eri soluissa olevien tilastoyksiköiden lukumäärää.
Luokitusta muuttamalla taulukosta pyritään hävittämään paljastumisriskissä olevat solut yhdistämällä niitä sisältävät luokat muihin taulukon luokkiin. Luokituksen muuttaminen tarkoittaa usein käytännössä koko luokituksen karkeistamista.
Taulukoiden suojausmenetelmänä voit käyttää myös paljastumisriskissä olevien solujen arvojen muuttamista. Tällaisia menetelmiä ovat esimerkiksi pyöristäminen ja alkuperäisen soluarvon korvaaminen likimääräisellä satunnaisluvulla.
Taulukoiden ja muun tyyppisten tulosteiden suojaus etäkäyttöjärjestelmässä tarkoittaa käytännössä sitä, että tutkija huolehtii tulosteiden tarvittavasta suojauksesta ennen niiden tarkastukseen lähettämistä. Suojaus on toteutettava käyttämällä tarpeeksi karkeita luokituksia tai muuten suunnittelemalla tulosteiden sisältö tietosuojan kannalta hyväksyttäväksi. Tarkastukseen lähetettäviin tulosteisiin ja taulukoihin ei saa enää kohdistua paljastumisriskiä, eikä tarkastaja siis enää tee lisäsuojauksia tulosteisiin. Tarkemmin tutkimustulosten suojaamisesta ja tarkastusmenettelystä kerrotaan osiossa 3.4 Tutkimustulosten tietosuojavaatimukset.
Esimerkki 4:n avulla voit pohtia lisää taulukkoaineiston suojaukseen liittyviä käytännön haasteita.
Taulukossa 1 on taulukoitu tietyssä ammatissa toimivien henkilöiden lukumäärät alueittain ja tuloluokittain. Suojaus on aiheuttanut kaikkien nollasta poikkeavien sisäsolujen peittämisen. Myös nollasoluja on saatettu joutua peittämään.
Onko suojaus riittävä? Voidaanko taulukosta selvittää peitettyjen solujen arvoja? Olisiko joku muu taulukointi mielekkäämpi? Jos, niin millainen?
Tuloluokka | Alue A | Alue B | Alue C | Alue D | Alueet, yhteensä |
---|---|---|---|---|---|
1 | 0 | x1 | x2 | 0 | 25 |
2 | x3 | 0 | 0 | x4 | 15 |
3 | x5 | 0 | 0 | x6 | 30 |
4 | 0 | x7 | x8 | x9 | 30 |
Tuloluokat yhteensä | 35 | 10 | 15 | 40 | 100 |
Esimerkkiratkaisu:
Taulukko ei voi sisältää negatiivisia lukuja, sillä kyseessä on frekvenssitaulukko. Nollasolujen ei myöskään ole katsottu tarvitsevan suojausta, sillä niitä on taulukossa näkyvissä. Taulukon rivi- ja sarakesummista on pääteltävissä seuraavaa:
Kun tiedät, että x1 = 10, voit päätellä arvot myös soluille x2 = 15, x7 = 0 ja x8 = 0. Koska 0 + x7 + x8 + x9 = 30 niin täytyy olla x9 = 30. Solujen x1, x2, x7, x8 ja x9 peittäminen on siis ollut turhaa, koska niiden arvot pystytään laskemaan tarkasti peittämisen jälkeenkin.
Huomioitavaa on myös, että jos oletetaan suojauksessa käytetyn pientä kynnysarvoa (alle 10) ensisijaisesti peitettävien solujen määrittelyyn, niin yksikään näistä soluista ei ole ensisijaisesti peitetty. Näiden tietojen avulla tapahtuu kuitenkin niin sanottu ryhmän paljastuminen. Ryhmän paljastumisella tarkoitetaan sitä, ettei yksikään taulukossa esiintyvä havainto yksilöidy, mutta tietystä yksilöitävissä olevasta ryhmästä paljastuu jokin ominaisuus.
Tämän taulukon tapauksessa paljastuu, että kaikki tarkasteltavat alueen B ja C henkilöt kuuluvat tuloluokkaan 1. Ryhmän paljastumista ei aina pidetä arkaluonteisena tai suojausta vaativana asiana ja sen huomioiminen yleensä vaikeuttaa suojauksen tekemistä.
Jäljelle jäävät peitetyt solut on esitetty taulukossa 2 alkuperäisen taulukon osataulukkona.
Tuloluokka | Alue A | Alue D | Alueet yhteensä |
---|---|---|---|
2 | x3 | x4 | 15 |
3 | x5 | x6 | 30 |
Tuloluokat yhteensä | 35 | 10 | 45 |
Osataulukon rivi- ja sarakesummien avulla saadaan solujen X3 ja X5 arvoille seuraavat vaihteluvälit:
Jos tiedettäisiin, että suojaustarpeen määrittelyssä on käytetty kynnysarvoa 5 (tai pienempi), niin kumpikaan soluista x3 tai x5 ei olisi ensisijaisesti suojattava. Tällöin solun x4 tai x6 on oltava suojausta vaativa, jotta suojaukseen olisi ylipäätään ryhdytty. Taulukon avulla voidaan päätellä että kummankin solun arvo on korkeintaan 10, mutta tarkempia arvoja ei pystytä päättelemään.
Yhteenveto
Esimerkkivastaukset alkuperäisiin kysymyksiin yllä esitettyjen laskelmien ja pohdinnan perusteella olisivat seuraavat:
Edellä mainittujen vastausten lisäksi opit tästä esimerkistä seuraavat asiat:
Salassapitovelvoitteen mukaan sinun on pidettävä huolta siitä, että tutkimustuloksissasi ei ole yksikkötason tietoja tai mahdollisuutta niiden paljastumiseen. Julkaisemiesi tulosteiden tulee noudattaa tietosuojan osalta Tilastokeskuksen linjauksia taulukkomuotoisten tietojen suojaamisesta. Lisätietoja linjauksista löydät ohjeesta Tietosuoja ja tulosten tarkastusmenettely (pdf). Alla on esitetty keskeisimmät ohjeet tulosteiden tietosuojavaatimuksista.
Pääsääntönä yritystietojen suojaamisessa on, että kussakin solussa tai ryhmässä on oltava aina vähintään 3 (painottamatonta) havaintoa. Kynnysarvosäännön rinnalla tulee soveltaa dominanssisääntöä (1,75) tuoreissa yritystiedoissa (alle 15 kk viiteajankohdasta). Toimipaikkatason tietoja suojatessa on varmistettava myös yritystason suojaus, eli kussakin solussa on oltava toimipaikkoja vähintään kolmesta eri yrityksestä. Samoin konsernitason suojaus on otettava huomioon sellaisissa yritysaineistoissa, joissa on tietoja konsernisuhteista.
Henkilötietojen suojaamisessa on noudatettava solukohtaista kynnysarvoa 3 ja kiinnitettävä erityistä huomiota taulukoitavien muuttujien arkaluonteisuuteen. Yhdistetyissä työntekijä–työnantaja-aineistoissa on suojattava sekä henkilö- että yritystaso, eli kussakin taulukon solussa on oltava työntekijöitä vähintään kolmesta eri yrityksestä. Taulukkomuotoisissa yritystilastoissa esiintyviin ammatinharjoittajatietoihin sovelletaan samoja suojauskäytäntöjä kuin muihinkin yritystietoihin.
Maksimi ja minimi liittyvät yleensä yhteen havaintoon. Jos tämä havainto on mahdollista tunnistaa, et voi julkaista maksimia tai minimiä.
Jakaumapisteet (pl. minimi ja maksimi) muodostavat erikoistapauksen taulukosta, jossa solufrekvenssejä vastaavat jakaumapisteiden väliin jäävien havaintojen lukumäärät. Mikäli nämä lukumäärät ylittävät kynnysarvon 3, voit julkaista jakaumapisteet.
Moodin voit julkaista, mikäli (lähes) kaikki havainnot eivät saa samaa arvoa.
Keskiarvon, muut suhdeluvut ja jakaumatunnuslukujen korkeammat momentit (esim. varianssi) voit julkaista, mikäli niiden laskennassa on käytetty vähintään kolmea havaintoa.
Osuuksia julkaistaessa on kynnysarvon 3 toteuduttava kaikkien osuuksia muodostavien ryhmien osalta. Toisin sanoen, jos halutaan julkaista esim. naisten osuuden olevan 58 prosenttia koko populaatiosta, niin tuon 58 %:n, samoin kuin miesten 42 %:n, on sisällettävä vähintään kolme henkilöä. Ei siis riitä, että naisia ja miehiä on yhteensä koko populaatiossa vähintään 3.
Indeksipisteluvut, korrelaatiokertoimet ja testisuureet (t, F, khiin neliö, yms.) voit yleensä julkaista, mikäli laskennassa on käytetty tarpeeksi (vähintään 10) havaintoja.
Regressiomallin kokonaisuudessaan voit julkaista, mikäli mallin taustalla on riittävästi havaintoja ja malli ei kuvaa aikasarjaa yhteen yritykseen/henkilöön perustuvista havainnoista. Mallin yksittäisiä kertoimia voit yleensä aina julkaista.
Aineistoista piirretyt kuviot ja kuvat ovat sallittuja, jos yksittäinen kuvapiste ei voi paljastaa sen taustalla olevaa yksittäistä havaintoa. Vie kuviot tarkastettavaksi taulukoiden tapaan selkeästi ja täsmällisesti dokumentoituna. Tarkastettavaksi soveltuvia kuvaformaatteja ovat esimerkiksi PNG, BMP, JPEG, TIFF, EPS, PS, PDF, SVG ja WMF/EMF.
Pylväsdiagrammit ja muut luokitellun aineiston esittämiseen käytetyt kuviot ovat tyypillisesti sallittuja julkaistaviksi, kunhan kussakin luokassa on riittävästi havaintoja.
Tällaisen kuvion informaatio voidaan yleensä esittää myös taulukkomuodossa ja siihen voidaan soveltaa samoja tietosuojasääntöjä kuin muihinkin taulukkoaineistoihin (ks. yllä kohta Frekvenssi- ja määrätaulukot).
Jakaumakuvat sisältävät toisinaan poikkeavia havaintoja tai ääriarvoja, jotka voivat paljastaa havaintoyksikön tietoja. Tasoitetut tai riittävän karkealla asteikolla esitetyt jakaumat, histogrammit ja kertymäfunktiot ovat sallittuja.
Hajontakuvia käytetään tyypillisesti kahden jatkuvan muuttujan arvojen esittämiseen, jonka vuoksi ne ovat tietosuojan kannalta edellisiä kuvaajia hankalampia. Hajontakuvien kohdalla tulee kiinnittää erityistä huomiota aineiston luonteeseen mm. otoksen koon, tiedon arkaluonteisuuden ja poikkeavien havaintojen esiintymisen kannalta.
Seuraavat gallerioissa selattavat harjoitukset antavat sinulle käytännön vinkkejä siitä, miten parannat tulosteiden tietosuojaa ja kuinka lopuksi arvioit tulosten tietosuojaa.
Tilastokeskuksen tutkijapalveluilla on käytössään tutkimustulosten manuaalinen tarkastusmenettely ja pistotarkastusmenettely, joilla varmistetaan tietosuojan toteutuminen.
Tarkastuksessa ei hyväksytä tulostetta, jonka sisältö on liian epäselvä tai laaja tietosuojan toteutumisen arvioimiseksi. Tarkempaa tietoa tulosteiden tietosuojavaatimuksista ja tarkastusmenettelystä löydät tutkijapalveluiden säännöistä ja ohjeista. Säännöt ja ohjeet ovat sitovia kaikille tutkimushankekohtaisen tai SISU-mikrosimulointimallin käyttöä koskevan sopimuksen allekirjoittaneille tutkijoille. Huomaa, että tarkastusmenettelystä huolimatta sinä tutkijana olet viimekädessä vastuussa tietosuojan toteutumisesta julkaisemissasi tutkimustuloksissa
Tutkijapalveluiden etäkäytössä ja mikrosimulointimallin etäkäytössä noudatetaan toisistaan poikkeavia tarkastusmenettelyjä. Manuaalisen tarkastuksen piirissä olevissa tutkimushankkeissa etäkäytössä tuotetut tulosteet tarkastetaan tietosuojan osalta ennen tietojen luovuttamista tutkijalle. Etäympäristöstä ei voi siirtää tiedostoja omalle työasemalle itse, vaan tiedonsiirto tapahtuu erillisellä pyynnöllä sähköpostin kautta. SISU-mikrosimuloinnissa ja pistotarkastuksen piirissä olevissa tutkimushankkeissa puolestaan käyttäjä siirtää tutkimustuloksia sisältäviä tiedostoja suoraan omalle työasemalle ilman etukäteen tehtävää tarkastusta.
Etä- ja tutkimuslaboratoriokäytössä tuotetut tutkimustulokset tarkastetaan tietosuojan varmistamiseksi. Tarkastuspyynnöt lähetetään sähköpostitse tutkijapalveluihin. Etäkäytön sääntöjen mukaisesti kaikki järjestelmästä pyydettävät tulostiedostot tarkastetaan. Huomioithan siis tutkijapalveluiden resurssit palvelupyyntöä lähettäessäsi. Kiinnittämällä huomiota tulostiedostojen laatuun ja noudattamalla kohtuutta tarkastuspyyntöjen määrässä voit sujuvoittaa ja nopeuttaa tarkastusmenettelyä merkittävästi. Etäkäyttöjärjestelmän ylläpitoon ja siihen liittyviin tehtäviin irrotetaan työresursseja päivittäisen tarpeen mukaan tutkijapalveluiden henkilöstön muusta työajasta.
Pyri ennakoimaan tietotarpeesi ja lähetä tarkastuspyyntö hyvissä ajoin. Tarkastuspyynnöt ja tiedostojen siirtäminen käsitellään aina seuraavana arkipäivänä. Vastaukset korjaus- tai selvityspyyntöihin tiedostojen sisällöstä käsitellään seuraavana arkipäivänä.
Mikrosimuloinnin etäympäristöstä voit siirtää tutkimustuloksia sisältäviä tiedostoja etäympäristöstä omalle työasemallesi. Jokaisella käyttäjällä on etäkäyttöympäristössä oma henkilökohtainen Mail-sähköpostikansio, jonka kautta tiedostoja voit siirtää omalle työasemallesi.
Tilastokeskus tarkastaa siirretyt tiedostot mikrosimuloinnin sähköpostista jälkikäteen. Olet velvollinen noudattamaan siirrettäviin tietoihin liittyen tutkijapalveluiden etäympäristöä koskevia ohjeita ja pelisääntöjä:
Kiinnitä erityistä huomiota siihen, ettei mikrosimulointiympäristöstä siirrettävissä tiedoissa ole vahingossakaan yksilötason tietoja tai mahdollisuutta niiden paljastamiseen.
Kun haluat siirtää tuloksia ulos etäkäytöstä, täytä FIONAn työpöydältä löytyvä lomake ulos siirrettävistä tuloksista. Tämän jälkeen tulokset joko tarkastetaan etukäteen manuaalisesti, tai olet pistotarkastusten piirissä, voit saada tulokset sähköpostiisi välittömästi. Uusien käyttäjien kaikki tulokset tarkastetaan etukäteen. Todennäköisyys pistotarkastusten piiriin pääsemisestä nousee, kun käyttäjälle kertyy hyväksyttyjä perättäisiä etukäteistarkastuksia.
Rikkeet ja virheet nollaavat tilanteen ja etukäteistarkastukset alkavat alusta. Vakavista ja toistuvista rikkeistä on sanktiona poisto pistotarkastusmenettelyn piiristä, sekä muut tietosuojaloukkauksista seuraavat toimenpiteet. Jos olet epävarma tulosteen tietosuojasta, kannattaa olla yhteydessä tutkijapalveluihin jo ennen tulosteen järjestelmästä ulos vientiä.
Ethän lähetä seuraavia tulosteita tarkastukseen: