Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

Anonyminoisnti vs. agregointi #2

Open
apoikola opened this issue Oct 18, 2013 · 2 comments
Open

Anonyminoisnti vs. agregointi #2

apoikola opened this issue Oct 18, 2013 · 2 comments

Comments

@apoikola
Copy link

Haasteen nimessä ja ohjeissa puhutaan anonymisoinnista, mutta se on käytännössä hyvin vaikeaa, ellei mahdotonta. Eikö agregointi, eli datan karkeistaminen olisi parempi lähtökohta - käykö agregointiin pohjautuvat ehdotukset vastauksina tähän haasteeseen.

Tämä oli Aleksi Rossin @naleksi kyssäri perjantain session jälkeen.

@jtuomist
Copy link

Hei.

Aggregointi on yksi mahdollisuus joten siihen pohjautuvia ideoita voi kyllä esittää. Kuitenkin sen soveltuvuus on kovin rajallinen, koska haasteessa nimenomaan koetetaan ratkaista ulkopuolisen tutkijan tarve päästä analysoimaan yksilötason ilmiöitä ja niiden syitä. Karkeistaminen hyvin nopeasti tuhoaa mahdollisuuden yksilöilmiöiden tutkimiseen.

Jouni

Jouni Tuomisto, johtava tutkija, chief researcher
THL, Ympäristöterveyden osasto
THL, Dept of Environmental Health
PL 95, FI-70701 Kuopio, Finland
Puh/phone +358 295246305

"Antti Poikola" <[email protected]mailto:[email protected]> kirjoitti 18.10.2013 kello 12.20:

Haasteen nimessä ja ohjeissa puhutaan anonymisoinnista, mutta se on käytännössä hyvin vaikeaa, ellei mahdotonta. Eikö agregointi, eli datan karkeistaminen olisi parempi lähtökohta - käykö agregointiin pohjautuvat ehdotukset vastauksina tähän haasteeseen.

Tämä oli Aleksi Rossin @naleksihttps://github.com/naleksi kyssäri perjantain session jälkeen.


Reply to this email directly or view it on GitHubhttps://github.com//issues/2.

@spqs
Copy link
Member

spqs commented Oct 22, 2013

@apoikola , @naleksi, Aggregointia (hieman eri nimellä) on tarkasteltu paljonkin, mm. lähteessä Fung et al.
https://github.com/apps4finland/haaste-anonymisointi/blob/master/data/linkkeja.md . Aggregointi ei auta esim. silloin, jos data-alkioiden jakauma on voimakkaasti piikittynyt. Tästä taas päästään eettisiin hyväksyttävyyskysymyksiin, kuten 'onko sillä väliä, jos aggregoinnin tuloksena minulla tiedetään olevan sairaus X todennäköisyydellä y' (missä y lähestyy ykköstä eli lähes varmaa tietoa). Toisille on, toisille ei.

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Labels
None yet
Projects
None yet
Development

No branches or pull requests

3 participants