Andmed on isiklikud. Mida me õppisime 42 intervjuust Maa-Ameerikas.

See postitus põhineb meie tööl ACM CHI 2019 (parima paberi auhind!) - andmed on isiklikud: Evan M. Pecki, Sofia Ayuso ja Omar El-Etri andmetel on Pennsylvania maapiirkonna andmete visualiseerimise hoiakud ja ettekujutused. Meie andmete, materjalide ja muude selle töö kokkuvõtete saamiseks külastage meie projekti veebisaiti.

Alates aitidest kuni tulpdiagrammideni Ameerika maapiirkondades

Pennsylvania keskosa on seal, kus töötan, ilus. Kui sõidate 2–3-tunnise autosõidu kaugusel Philadelphiast, New Yorgi või Baltimore'ist, sisenete maastikku, mille on vorminud roheliste küngaste veeremine ja „mudelrongide“ talud. Kui näete väikestest, tihedalt seotud kogukondadest ringi liikudes, näete amiši hobuste ja vankrite jalutuskäike ning mööda teed, mööda teed, mööda maantee äärseid talude stendisid, konföderatsioonide lippe ja omatehtud usumärke (mõnikord kõrvuti). Antratsiidi söepiirkonna kõrval asuv Kesk-PA on piirkond, mis võltsis kivisöe hääbuva energiaallika kõrval oma identiteeti.

Seal on üks vana nali, et Lewisburg on “keskselt nihestatud”. See on 2–3-tunnise autosõidu kaugusel New Yorgi osariiki, Baltimore'i, DC-sse ja Philadelphiasse ... aga te ei kavatse mööda teid ühtegi linna sõita. See fantastiline visualiseerimine on pärit https://pudding.cool/2018/10/city_3d/

Kuid maa topoloogia mõjutab rohkem kui seda, milliseid töökohti me töötame või seda, kui kaugele India restorani jõuame. See võib põhjalikult mõjutada viisi, kuidas me andmetele juurde pääseme. Mõelge sellele tsitaadile dr Jenna Burrelli imelisele tööle Californias:

Ma väidan, et halb Interneti-ühendus ei ole lihtsalt maapiirkondade demograafilise olukorra loomulik tagajärg, kus elanikud on tavaliselt madalama sissetulekuga, madalama haridusega ja vanemad. See on välistamise küsimus. Seda tõrjutust kujundavad geograafia, kaugus ja rahvastiku tihedus, mis tulenevad konkreetsest Ameerika poliitilisest majandusest, kus ühenduvus on suuresti turupõhine.
- Jenna Burrell, "Mõeldes digitaalselt ebavõrdsusest Ameerika Ühendriikide maapiirkondades".

See, mil määral võib meie juurdepääs teabele meile 2019. aastal mõjuvõimu anda või ebasoodsasse olukorda sattuda. Ja kuigi dr Burrell räägib ebavõrdsusest Interneti-ühenduse kontekstis, tahame kaaluda välistamist andmeside kontekstis - see, kuidas me esitleme, andmed visualiseerimise kaudu aitavad mõnel inimesel andmeid paremini mõista või mõista neid rohkem kui teised?

Ehkki võite uskuda, et maaelanike andmetega põhjendamine ei erine, võtab vaid pilk 2016. aasta presidendi hääletuskaartidele, et näha, et mõnes mõttes ei tõlgenda me kõik maailma ühtemoodi. Ja samu demograafilisi rühmi, mida ülaltoodud tsitaadis mainiti - madalama sissetulekuga, madalama haridusega, vanemas eas -, on andmete visualiseerimise kirjandusest raske leida. Mida me ei tea?

On vaja vaid põgusalt vaadata 2016. aasta presidendikaarti, et näha, et me ei vaata kõiki maailma ühtemoodi. See pilt on pärit New York Timesist: “Äärmiselt üksikasjalik kaart 2016. aasta valimistest”

Ja nii, siin ilusas, maapiirkonna keskses PA-s alustasime teadusprojekti, milles uuriti suuri küsimusi: kes meie andmetele tähelepanu pöörab ja kellele mitte? Miks nad andmetele tähelepanu ei pööra? Mida nad usaldavad… ja miks?

Palusime 40+ inimesel Pennsylvania maapiirkonnast järjestada 10 graafiku komplekt. Siis me rääkisime sellest.

Põllumeeste turul, ehitusplatsil ja ülikooli söögikohtades küsitlesime 42 meie kogukonna liiget graafikute ja diagrammide kohta, et saada aru, kuidas nad saavad aru ja kuidas neid andmetega seostada.

  • Näitasime inimestele kümmet andmete visualiseerimist uimastitarbimise kohta, mis varieerusid visuaalsete kodeeringute, stiili ja allika osas.
  • Palusime neil järjestada kümme graafikut (ilma lähteteabeta!) Nende kasulikkuse põhjal.
  • Pärast graafikute allikate paljastamist anti inimestele võimalus visuaale visandada.
10 graafikut ja graafikut, mida me palusime inimestel järjestada. Alguses järjestati inimesed ilma nende allikat teadmata. Pärast seda avalikustati graafilised allikad ja neile anti võimalus oma andmeid uuesti uurida.

Inimesed, kellega rääkisime, polnud just noored ega olnud lihtsalt ülikoolis. Nad olid hariduse (60% kunagi lõpetanud) ja vanuse poolest erinevad (26% olid vanemad kui 55 aastat, 33% olid vanuses 35–44). Läbi paljude tundide kestnud vestluste on siin see, mida leidsime ...

Koondandmed on räpane, varjates isikuid

Kõrgetasemelise ülevaate saamiseks alustame kõigepealt sellest, kui palju inimesi andis igale graafikule iga asetuse:

Mitu korda sai iga graafik osalejatelt iga paremusjärjestuse. 1 on parim, 10 on halvim.

Ei läinud kaua, kui nägime, et järjestamise andmed olid räpased - ja segased, et koondatud vahendite või mediaanide jagamine oli kasutu. Meil on selle kohta oma dokumendis palju öelda, kuid selle postituse jaoks on individuaalsed eelistused ja tähelepanu keerulised. Infograafika on jagatav (joonis J sai kõige rohkem 1 ja kõige rohkem 10 paremusjärjestust!), Mõnele meeldib lihtsus, mõnele meeldib värv ja mõnele lihtsalt meeldib leida oma elukoht.

Kuid lisaks nendele umbkaudsetele suundumustele, kui me suhtume tõsiselt andmete edastamisse kõikidele inimestele, peame nende räpane levitamise kohta rohkem aru saama. Millised lood on andmete taga?

Andmed on isiklikud. Andmed on intiimsed.

Intervjuusid analüüsides ja kodeerides tuletati meelde midagi, mida sageli unustame - andmed võivad olla intiimsed ja isiklikud. Kui keegi leidis mõne graafikuga isikliku ühenduse, ei olnud sellel tähtsust värvil, stiilil ega tehnikal. Inimeste jaoks, kellega rääkisime, asendasid isiklike ühendustega diagrammid kõik muud kujundusmõõtmed.

Alkoholist mõjutatud inimesi joonistati alkoholiga graafikutele….

Teave alkoholi kohta [on kõige olulisem].
Tegelen toimiva alkohoolikuga. Minu elu tähtsaim inimene on alkohoolik.
Praegu on see minu jaoks oluline.
 - 65–74-aastane, ülikooli lõpetanud

Inimesed, keda opioidid mõjutasid, tõmmati opioididega graafikutele…

Mis puutub mõnda muusse [graafikusse], siis tean, et tean üsna paljusid inimesi, kellel on kahjuks probleeme opioididega ... ja see on midagi, mida te kaalute ... kas näete seda inimest homme või mitte?
 - 25–34-aastane, mõne gümnaasiumiga, diplomit pole

Ikka ja jälle (ja jälle) osutasid inimesed järjekoha otsustamise ratsionaliseerimiseks isiklikule kogemusele. Ja lood, mida nad meile rääkisid - teadlased, keda nad polnud kunagi kohanud - olid sageli intiimsed ...

Mul on vähe sõpru, kes surid [opioidide tõttu], nii et [Graafik F] pani mind seda nii ütlema.
 - 25–34-aastane, keskkooli lõpetanud

Me leiame, et nende vestluste puhul pole silmatorkav see, et need üldse aset leidsid, vaid see, kui sageli nad vestlusi kavandasid, kuid ei otsinud neid. On väga võimalik, et paljud teised inimesed, kellega vestlesime, said sarnaseid kogemusi, mis jäid sõnatuks. Ja see jätab meile murettekitavaid küsimusi ... kuidas saaksime oma kujunduses arvestada nii võimsate, isiklike teguritega?

Andmed on isiklikud: asjakohane geograafia

Ehkki nende isiklike lugude kujundamine võib osutuda keerukaks, nihutavad teised meid selgemate disainimõjude poole. Mõelge ühe osaleja vastusele, kui teilt küsiti, miks ta otsustas vasakul asuvat jooned paremal asetsevast joonest kõrgemale paigutada.

Hindasin selle kõrgemale lihtsalt selle lihtsa fakti tõttu, et elan Ameerikas, nii et ma arvasin, et see on üsna asjakohane… rohkem kui teine.
 - 45–54-aastane, kaastöötaja kraad

Selguse huvides on mõlemad need graafikud seotud Ameerika Ühendriikidega. Kuid pange tähele, kuidas ainult ühel neist on selge pealkiri, mis muudab andmete ühenduse USA-ga selgesõnaliseks? See on lihtne kujundusvalik, kuid meie osaleja jaoks oli see tükk oluline.

Andmed on isiklikud: kus on kodu?

Kui olete meie moodi, võite arvata, et meie leiud viitavad sellele, et kaardi visuaalsused on selge ja ilmne võitja. Lõppude lõpuks hõlmavad Ameerika Ühendriikide ülevaated Pennsylvaniat (PA).

Ja tegelikult tegi Pennsylvania meie osalejate jaoks oluliseks. Kuid see avaldus üllataval viisil ...

Need kaks [USA riigi] kaarti on madala asetusega, kuna mulle meeldivad need vähem. See on kogu riik; see on nii tohutu. Sa vaatad loomulikult oma olekut. See on liiga hõivatud. Ma pole neist vaimustatud.
 - 65–74-aastane. gümnaasiumi lõpetanu.
Mõnele osalejale ei meeldinud kaardivaated, mis ei keskendunud Pennsylvaniale. Nad arvasid, et üleriigiline ülevaade häirib otsitud lugu (oma kodu).

See ei olnud kõrvaline asi. Meie kauneid ülevaatekaarte kritiseeriti rutiinselt, sageli viidati neile kui “segadusele” või “hõivatud”. Kuigi Pennsylvania on kaardil, on see ümbritsetud tihedate andmetega piirkondadest, mida meie osalejad ei huvitanud.

See on huvitav, kuna meil on kalduvus kõvasti üle vaadata ülevaate → Nõudmise üksikasjad kujundusmustrit. Kuid näeme siin seda, et mõned inimesed leiavad, et ülevaade hoiab tähelepanu olulisest teabest. Kui meil on juurdepääs isiklikule teabele (nagu brauseril oli juurdepääs geograafilisele asukoha määramisele), võib meid kõige paremini aidata kujundada uus muster: Isiklikud üksikasjad → Ülevaade.

Paljud inimesed näevad andmeid objektiivsetena. See on ohtlik.

Selle hetkeni hindasid inimesed visualiseeringuid allikat teadmata. Kuid kui nad olid oma esialgse paremusjärjestuse esitanud, paljastasime meie 10 visualiseerimise allika. Need ulatusid valitsuse allikatest (riiklik uimastite kuritarvitamise instituut) ülikoolidest (Drexeli ülikool) kuni uudiste väljastusteni (The New York Times, The Economist, BreitBart).

Kuid enamiku küsitletud inimeste jaoks polnud allikatel vahet. Tegelikult otsustas 60% meie osalejatest oma paremusjärjestust mitte muuta, olenemata sellest, kust visualiseerimine pärit oli.

Miks?

Leidsime, et paljud inimesed leidsid, et teabel on objektiivne kvaliteet, mis on muutumatu, sõltumata sellest, kus neid andmeid võidakse tutvustada ...

Arvan, et teave on teave, olenemata sellest, kust see pärineb.
- 18–24-aastane, mõni ülikoolikrediit (kraadi pole)

Tegelikult olid paljude inimeste jaoks andmed ja visualiseerimine sünonüümid. Nende inimeste jaoks on torustik andmete kujundamisest puhas ja selge, ilma eelarvamuste ja retoorikata.

Me teame, et see pole tõsi ... kuid inimesed usuvad seda ikkagi. Kuidas saaksime oma süsteeme kujundada, et võidelda objektiivsuse valede ettekujutustega?

Kes teeb neid otsuseid?

Demograafiliste andmete kaevudes nägime, et inimesed, kellega me rohkem intervjueerisime, vahetasid palju tõenäolisemalt oma paremusjärjestust.

Paremini haritud inimesed olid suurema tõenäosusega valmis pärast visualiseerimise allika nägemist oma paremusjärjestust muutma

Muster on huvitav, kuid olge nende leidudega ettevaatlik. Valimi suurus on liiga väike, et üldistustega ringi joosta.

Kuid siin on üks mõte, mida tasub kaaluda: suur osa meie visuaalseid kujundusi suunavatest uurimistöödest ja juhenditest töötati välja õpingute käigus inimestega, kellel oli vähemalt mõni kolledži kogemus. Vaadake hoolikalt, kuidas oleks meie leiud muutunud ilma nende inimesteta ...

Sama graafik, kuid eemaldades kõik inimesed, kellel polnud kolledžiga kogemusi.

Lugu on väga erinev. Milliseid eeldusi me oma uurimistöödesse, protsessidesse ja kujundusjuhistesse sisestame, millest me ehk ei tea? Millised lood võivad meil puudu olla?

Usaldusküsimused. Inimeste jaoks, kes otsivad allikat, võib poliitiline identiteet kujundada nende usalduse.

Inimestest, kes otsustasid oma paremusjärjestust muuta, ei pruugi olla üllatus, et mõned nende otsused vastavad nende poliitilisele identiteedile. Inimesed, kes leidsid end liberaalsematena, nimetasid The New York Timesi graafikuid ja diagramme kõrgemaks kui konservatiivid. Samal ajal kohandasid mõned konservatiivid BreitBarti graafikuid ja diagramme kõrgemalt kui liberaalid.

Iga 10 graafiku kohta näitame, kuidas osalejad pärast allikate ilmumist oma paremusjärjestust muutsid. Võrreldes neid muudatusi oma poliitilise kuuluvusega, selgub, et poliitiline identiteet võib muuta seda, kuidas inimesed väärtustavad või usaldavad andmete visualiseerimist.

Nende tagajärgedega maadlemine on oluline. Kuigi tähistame ajalehes The New York Times või Washington Post jutustatud andmelugusid (mõjuval põhjusel!), Arvan, et peame ka mõtlema selle üle, kes nendesse tegelikult tähelepanu pöörab. Kas me vaatame samu andmeid? Kas me usaldame seda samamoodi? Kas mäletame seda samamoodi?

Lisaks poliitilisele identiteedile soovitas üks inimene isegi, et nad pööraksid rohkem tähelepanu kohalike uudiste allikate kui riiklike uudiste allikatele:

Ma ei loe [The New York Timesit], aga isegi kui mulle see pilt meeldis, ei osta ma ikkagi ajalehte, sest ma ei ela New Yorgis. Sunbury paber, mis on siin lähedal. Siis ma loeksin seda ... aga ma ei loeks seda ikkagi
 - 45–55-aastane. Assotsieerunud kraad

Jällegi isiklikud asjad. Ja kuigi meil on kalduvus analüüsida visualiseeringuid isoleeritud, hästi kontrollitud keskkonnas, on meie platvormid samuti olulised.

Mis on andmete visualiseerimise lugu?

Kui ma õpetan õpilastele andmete visualiseerimist, siis juhin sageli seda, mis minu arvates on valdkonna kaalukaid lugusid. See läheb midagi sellist ...

  • Andmete põhjendamine on kõigi jaoks vajalik oskus aastal 2019. Ükskõik, kas tegemist on laenude otsimisega, kolledži valimisega või kliimamuutustest arusaamisega ... Peame mõistma andmeid, et teha teadlikke otsuseid nii meie enda kui ka kogukondade jaoks.
  • Andmete visualiseerimine on kriitiline vahend, mis võimendab andmete mõistmist ja põhjendamist. Kõige kõrgemal tasemel on sellel potentsiaali andmeid demokratiseerida ja muuta need rohkematele inimestele kättesaadavamaks. See on põnev!

Aga…

Kui usute seda lugu samamoodi nagu mina, tähendab see ka seda, et peame esitama andmete visualiseerimise kohta raskeid küsimusi samal viisil, kui esitame 2019. aastal raskeid küsimusi muu tehnoloogia kohta.

Meid võimendavatel tööriistadel - sealhulgas andmete visualiseerimisel - on ka potentsiaal lahkarvamusi süvendada, kui need pole mõeldud kõigile.

Me vajame paremat mõistmist selle kohta, keda visualiseerimine võimendab ja keda see endast maha jätab.

Milline on parim viis selleks?

See postitus põhineb meie tööl ACM CHI 2019 (parima paberi auhind!) - andmed on isiklikud: Evan M. Pecki, Sofia Ayuso ja Omar El-Etri andmetel on Pennsylvania maapiirkonna andmete visualiseerimise hoiakud ja ettekujutused. Meie andmete, materjalide ja muude selle töö kokkuvõtete saamiseks külastage meie projekti veebisaiti.