Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

"Näkymättömän" datan käyttöliittymä #1

Open
jtervola opened this issue Sep 19, 2013 · 4 comments
Open

"Näkymättömän" datan käyttöliittymä #1

jtervola opened this issue Sep 19, 2013 · 4 comments

Comments

@jtervola
Copy link

Erilaisilla datakeskuksillahan on omia analyysityökalujen käyttöliittymiä, joissa käyttäjää on estetty näkemään dataa. Usein myös mahdolliset porsaanreiät on estetty. Yksi esimerkki tästä on LIS-datakeskuksen LISSY-käyttöliittymä, jolla pääsee käsiksi LIS:n mikrodatoihin (http://www.lisdatacenter.org/data-access/lissy/job-submission/how-to-jsi/). Käyttäjä voi valita, minkä tilasto-ohjelman (SAS/Stata/SPSS) kieltä hän käyttää. Käyttäjälle näytetään vain analyysin output. Toimintaa valvotaan jonkin verran. LIS-datojen käyttäminen ei maksa mitään, mutta tunnusten saaminen vaatii hakemusta, jossa täytyy vähän esitellä tutkimussuunnitelmaa. Tällaisessa käyttöliittymässä datan dokumentoinnilla ym. metadatalla on suuri merkitys.

@spqs
Copy link
Member

spqs commented Sep 19, 2013

Kiitos hyvästä huomiosta. En ole ihan varma onko haasteen rajapintaa koskevan osan määrittelyssä jollakulla ollut mielessä jokin tarkempi rajoite tms. mitä ko. rajapinnan läpi voi tehdä. Mulla itselläni ei ole käytännön tietoa siitä mitä rajoituksia analyysiin tulee enkä ole itse tällaisia analyysejä rajapintojen läpi tehnyt, joten on hyvä että tässä vaiheessa tulee palautetta ja täsmentäviä kommentteja myös muualta kuin haasteen asettajilta. Sait mut nyt aprikoimaan että pitäisikö nimenomaan tätä rajapintaa koskevaa osaa jotenkin täsmentää tai peräti jättää se pois, koska näin argumentoiden joku voi väittää että ongelmahan on jo ratkaistu.
Kuten sanoit, metadatojen dokumentointi on tällaisessa tapauksessa tärkeää, joten kyllä tässäkin jotenkin pitää pystyä estämään sellaiset (yhdistelmä)queryt, joista voi välillisesti päätellä populaatiosta "liikaa", ja tätä on varmaan vaikea saada automatisoitua (tätä haasteessa tarkoitettiin sillä että pitää ottaa kantaa myös muihin kuin tietoteknisiin aspekteihin, mikä on "liikaa"?).

@spqs
Copy link
Member

spqs commented Sep 19, 2013

@jtuomist , mitä mieltä olet, täsmennetäänkö? Siirsin osan tekstistä tuonne inspiraatioksi.md-osaan ja varsinaisesta lyhyessä haastetekstissä ei nyt ole näkyvissä noita eettisiä ym. asioita, jotka tekevät haasteen epätriviaaliksi. Toisaalta liikaakaan ei saa vaikeuttaa, koska silloin ongelmaan ei tartu kukaan. Tämä vaati nyt vähän tasapainottelua.

@jtuomist
Copy link

Hei. En ole yllättynyt, että joku on jo kehittänyt tähän jotain systeemiä, koska kysymys on mielestäni aika ilmeinen. En tosin tiennyt LIS:stä joten kiitos linkistä. Mutta ratkaisu ei ole yhtä ilmeinen, koska olen tätä haastetta esitellyt muutamassa paikassa ja monet ovat hämmästelleet, että miksi joku haluaisi tehdä tuolla tavalla (kun meillä on jo data ja noille emme haluakaan antaa). Tekninen rajapintaratkaisukin tarvitaan, mutta tässä on myös kulttuurisia ongelmia kuten se, miten vakuutetaan datan omistajat siitä, että a) tällaista avaamista kannattaa tehdä ja b) oikein toteutettuna ei ole pelkoa tietovuodosta.

@spqs
Copy link
Member

spqs commented Sep 20, 2013

Pohdin asiaa ja lisäsin seuraavan kappaleen "inspiraatioksi.md"-tiedostoon:
"Halusipa haasteen ratkaisuksi haluaa esittää
jotain jo käytössä olevaa valmista rajapintaa (esim. http://www.lisdatacenter.org/data-access/),
tai jotain omaa ratkaisuansa, on suositeltavaa esittää jonkinlaista verifioitavissa
olevaa mittausdataa ratkaisunsa tueksi tai muuten pyrittävä vakuuttaavasti argumentoimaan,
miksi ko. rajapinta soveltuu nimenomaan erityyppisten terveysdatojen analysointiin
ja suojaamiseen. Kilpailutyössä on siis hyvä pohtia toteutusta sekä datan että metadatan
ominaispiirteisiin kantaa ottaen."

Halusin tasapainotella liian tarkan tehtävänannon ja liian ylimalkaisuuden välillä. Toivottavasti nyt jää tilaa luoville ratkaisuehdotuksille. Valmiitakin voi tarjota, jos pystyy esittämään argumentaatiota sen puolesta että ko. pakettiratkaisu toimii jossakin erityistapauksessa tai yleisemmin. Erilaisia ratkaisuja pitäisi syntyä jo siitä yksinkertaisesta syystä, että jo termien "riittävä suoja", "hyväksyttävissä oleva laskentaaika", "riittävän luotettava tiedonvälittäjä" yms. tulkintaa voi tehdä monella tavalla, ja yksi vasara ei sovi jokaiselle naulalle.

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Labels
None yet
Projects
None yet
Development

No branches or pull requests

3 participants