Название: Kuidas mõista andmestunud maailma
Автор: Anto Aasa, Mare Ainsaar, Mai Beilmann, Marju Himma Muischnek,
Издательство: Eesti digiraamatute keskus OU
Жанр: Руководства
isbn: 9789985588949
isbn:
Ühiskondlikult oluliste tegevuste kvantifitseerimises pole iseenesest midagi uut: valitsejad on maksukogumiseks andmeid kogunud tuhandeid aastaid, kirikud kogusid ja avaldasid aastasadu surnute andmebaase. Ka nende näidete puhul võib väita, et andmesubjektide kohta teadmiste koondamisega kaasnes võimu koondumine nende kätte, kelle kätte koondusid andmed (D’Ignazio, Kelin 2020). Siiski võib tänase andmestumise üheks alguspunktiks märkida arvutustehnoloogiate kasutuselevõtu rahvaloendusandmete töötlemisel. Herman Hollerithi 1890. aastal USA-s välja töötatud arvutusmasin (vt nt Whitby 2020) võimaldas rahvaloenduse tulemustest kokkuvõtte teha mõne kuuga varasema kaheksa aasta asemel. Seega võib andmestumist selgitada lainetena toimuva tehno-sotsiaalse muutusena (Schot, Kanger 2018), mis digitaliseerumise (Archer 2015), meediastumise3 (Hepp 2020) ja ühenduvusega (connectivity) (Couldry, Meijas 2019) seoses on järjekordse transformatsiooni läbi teinud. Käimasolevat andmestumiselainet peetakse eripäraseks (Just, Latzer 2017) johtuvalt selle skaalast ja ulatusest, mistõttu on praeguse andmestumisega kaasnenud suurem killustumine, kaubastumine, ebavõrdsus ja riigipiiride hägustumine ning vähenenud andmetega seotud protsesside läbipaistvus, kontrollitavus ja ennustatavus. Andmestumine ei ole passiivne (datafied), vaid aktiivne protsess (datafying), milles on oma võitjad ja kaotajad.
Eestis on andmestumine nähtavamaks muutunud seoses Euroopa andmekaitseseadusega (EP 2016), mille jõustumise ning kaasnevate piirangute tõttu on era- ja avaliku sfääri institutsioonid, aga ka n-ö andmesubjektideks peetavad indiviidid, kelle isikuandmeid kogutakse, hoitakse või töödeldakse (sageli mh nende enese teadmata), saanud teadlikumaks andmekasutamisega seotud võimalustest, ohtudest ja piirangutest. Selline areng on Eestis tõstatanud järgmised küsimused: Kas ja mis tingimustel on lubatud erafirmadel andmeid kasutada ja analüüsida? Kuidas teha andmed kättesaadavaks teadusuuringute jaoks? Kuidas tagada avatud andmete liikumine avaliku sektori institutsioonidele ja kodanikuaktivistidele? Kas ärilistel ja teaduslikel eesmärkidel andmete kogumisele peaks rakenduma erinevad piirangud? Ka siinses raamatus käsitletakse andmete kasutamise printsiipe, näiteks andmete õiguslikku kaitset ja kasutamist (ptk 1.3), andmete kasutamisega seotud eetilisi põhimõtteid (ptk 1.4) ning andmetega seotud sotsiaalse õigluse küsimusi (ptk 1.1). Sellest lähtuvalt oleme sõnastanud ka andmestunud maailma uurimise kolmanda postulaadi: andmestunud maailmas pole andmetaristu üksnes institutsionaalne omand, vaid võimalus avaliku hüve loomiseks, andmetes leiduva mitmekesisuse kaudu sotsiaalse mitmekesisuse tagamiseks ning andmepõhiste muutuste strateegiliseks juhtimiseks.
Raamatu koostajatena väidame, et andmed ja andmetes esindatud isikud pole teineteise teisikud (data doubles; vt Raley 2013; Goriunova 2019). Pigem peegelduvad andmekogudes uurijate väärtused ning (kohati aegunud) arusaamad sotsiaalsete kategooriate (sugu, rass, sissetulek, vanusegrupp, haridustase) tõlgendusjõust. Kuigi andmestumine loob loendamatud andmekogud ja teoreetilise võimaluse haarata ühiskondlikku elu kogu selle mitmekesisuses, jääb andmete mitmekesisuse küsimus sageli tähelepanuta. Andmestumine lähtub suuresti põhimõttest, et sotsiaalne reaalsus jaotatakse piiratud kategooriatesse. Ka klassikaline arvutusteaduslik meetod baseerub dihhotoomsele ehk 0–1 jaotusele ja arusaamale maailmast. Varasemalt kasutatud binaarsed kategooriad (nt 1 – õige, 2 – vale) on andmete puhastamisel, korrastamisel ja tõlgendamisel endiselt kasutusel, selmet püüelda andmete lõpmatus mitmekesisuses leiduva intersektsionaalsuse kajastamise poole (Hopkins 2019). Andmestunud ühiskonna teadmusloome (Shaw 2015; Wagner-Pacifici et al. 2015) eeldab andmete käsitlemist nii epistemoloogilise kui ka ontoloogilise nähtusena, ent tekitab lisaks hulga andmeõigluslikke (data justice) küsimusi, mille eesmärk on kindlustada, et andmed tagaks senisest suurema, mitte väiksema sotsiaalse õigluse. Nende diskussioonide põhjal oleme sõnastanud andmestunud maailma mõistmise neljanda postulaadi: lisaks tavapärastele teaduseetika nõuetele (uuritavate kahjustamise vältimine) peab andmete kogumine, analüüsimine ja tõlgendamine olema andmesubjekti ja ühiskonna seisukohalt õigustatud ja õiglane.
Eesti ühiskond pakub suurepärase võimaluse andmestumisega seotud arengusuundade analüüsiks – ühest küljest ollakse Eestis andme- ja tehnoloogiausust kannustatuna altid katsetama uudseid andmetehnoloogiaid (Runnel et al. 2009; Shaw 2015), teisalt on Eesti maailma kontekstis olnud suhteliselt tagasihoidlik valitsuse avaandmete arendamisel (McBride et al. 2018). Probleemiks on olnud eelkõige era- ja avaliku sektori ebavõrdne juurdepääs andmeressurssidele, aga ka erinevad arusaamad avalikest väärtustest ja sotsiaalsetest normidest andmelahenduste väljatöötamisel (Männiste, Masso 2020). Meil on eeskujulik digitaalne riigihaldus ja e-valitsemise taristu, ent erasektori digiteeritus on ebaühtlane ning kultuuripärandi lausdigiteerimise ja avaandmestamise algatused kipuvad venima (vt ptk 5.1).
Siiski on Eesti olnud teerajaja mitut tüüpi andmete kasutuselevõtmisel ja nende analüüsiks vajalike meetodite arendamisel. Mobiiltelefonide kõnetoiminguandmed ja mobiilpositsioneerimine sotsiaal-ruumilise segregatsiooni analüüsimiseks (Ahas et al. 2007) on üks eredaim näide (vt ptk-d 5.4 ja 2.1). Eesti digitehnoloogiate edusamme ja uuenduslikke andmelahendusi on kasutatud isegi riigi rahvusvaheliseks brändimiseks (Tammpuu, Masso 2018; Männiste, Masso 2020). Selle hiljutiseks näiteks on Eesti tehisintellekti ehk krattide lahendused.
Paljud Eesti teadlased ja selle kogumiku autorid on oma erialal uurimismeetodite edasiarendamises ja nendega eksperimenteerimises esirinnas, luues lahendusi, mida kasutavad kolleegid ja tudengid rahvusvaheliselt. Käesolev raamat esitab ülevaate Eestis välja pakutud andmestunud maailma uurimise viisidest, mis on kohandatavad rahvusvaheliselt, kuid eelkõige loodud Eesti ühiskonda arvestades. Kuna andmelahendused on loodud konkreetses sotsiaalses kontekstis, on ka andmestunud maailma mõistmise viiside korral oluline lähtuda konkreetse riigi kontekstist. Nende eelduste põhjal oleme sõnastanud viienda postulaadi: andmestunud maailma mõistmiseks – uuringu planeerimisel, andmete kogumisel, analüüsimisel ja tõlgendamisel – on oluline arvestada uuritava nähtuse ja andmete sotsiaal-kultuurilise kontekstiga.
Andmete mitmetähenduslikkusest
Kui ühiskonna andmestumisest rohkem rääkima hakati, peeti silmas eelkõige n-ö suurandmeid,4 mida defineeriti algselt eelkõige kasvanud andmemahu (volume) kaudu (ülevaateks vt nt Schäfer 2016). Hilisemad käsitlused on iseloomustanud suurandmeid viie V-ga ehk mahule lisati sellised omadused nagu mitmekesisus (variety), kiirus (velocity), tõepärasus (veracity) ja väärtus (value; Gupta et al. 2012). Viimastel aastatel on hakatud suurandmeid kirjeldama, mainides suuremat hulka omadusi (Lupton 2015), mida tuntakse ka suurandmete 13 P-na, väites et suurandmed võivad olla kõikehõlmavad (portentous), pahelised (perverse),5 isiklikud (personal), loovad (productive), osalised (partial), praktikaga seotud (practices),6 ennustavad (predictive), СКАЧАТЬ
3
Meediastumine on sotsiaalse maailma ja selle eri protsesside aina tihenev seotus meediaga.
4
Suurandmeid on eesti keeles nimetatud ka mahtandmeteks; mõlema nimetuse korral on tegemist metafoorse konstruktsiooniga, mis ei anna üheselt edasi nähtuse mitmetähenduslikkust. Sel põhjusel oleme siinses kogumikus eelistanud seotud sotsiaalsetele protsessidele viitavat terminit „andmestumine“.
5
Andmete pahelisus tähendab siin andmetega seotud representatsioonide ambivalentsust – suurandmed ei tekita mitte ainult suurt elevust seoses tekkivate võimalustega, vaid ka hirmu ja ärevust, sest andmete loomine ja kasutamine ei pruugi suure mahu, lakkamatu loomise ja kasutamise tõttu olla kontrollitav.
6
Andmete seotus praktikaga tähendab, et suurte andmekogude loomine ja kasutamine hõlmab mitmesugust üksikisikute ja organisatsioonide andmepraktikat, sealhulgas enda kohta teadlikult teabe kogumist (nt nutikellaga), aga sageli ka enesele teadvustamata andmete loomist näiteks sotsiaalmeedia lehele sisu lisades.