7. Tiedon visualisointi

Julkaistu

©Juhani Linna, Aulikki Hyrskykari

Tiedon visualisoinnilla tarkoitetaan yleisesti kaikkia niitä visuaalisia keinoja, joilla pyritään parantamaan tiedon ymmärrettävyyttä. Teemassa II tarkoitamme tiedon visualisoinnilla erityisesti taulukkomuotoisen datan ymmärrettävyyden parantamista visuaalisilla keinoilla. Näillä keinoilla tavoitellaan usein jonkun näkökulman korostamista – kuten tietyn kynnysrajan ylittäviä tai alittavia arvoja, muutostrendiä tai eroja ja yhtäläisyyksiä eri datasettien välillä. Isoja datamääriä hyödynnetään eri tavoin yhä useammassa tehtävässä, ja datan luettavuuden ja ymmärrettävyyden parantaminen on keskeinen huolenaihe monella työpaikalla.

Soluarvojen korostaminen – ehdollinen muotoilu. Excelissä on monipuolinen ja suhteellisen yksinkertainen työkaluvalikoima erityyppisten soluarvojen eli työkirjan lomakkeiden tietojen korostamiseen. Mikäli haluat esimerkiksi korostaa lomakkeelta tietyn arvon sisältävät, ylittävät tai alittavat solut, tai korostaa solualueen arvojen suhteellista pienuutta tai suuruutta, Ehdollinen muotoilu (Conditinal formatting) -työkalun valmiiden sääntöpohjien avulla (kuva vasemmalla) tämä hoituu parilla klikkauksella. Mikäli tarvitset monipuolisempia korostussääntöjä, voit luoda omia valinnalla Uusi sääntö… (New rule…).

Esimerkiksi oikealla näkyvässä mallitaulukossa kaikki sarake A:n solut, joissa on lukua 60 suurempi arvo, on korostettu vihreällä pohjavärillä, lihavoinnilla ja reunaviivoilla. Tämä tehdään valitsemalla solualue ja sen jälkeen valinnalla Ehdollinen muotoilu/Solujen korostussäännöt/Suurempi kuin…, syöttämällä arvo (60) ja valitsemalla haluttu muotoilu. Sarake B:n solut taas värjätään sitä punaisemmaksi, mitä lähempänä ne ovat solualueen maksimiarvoa (91). Tämä tehdään valitsemalla haluttu solualue ja sen jälkeen Ehdollinen muotoilu/Väriasteikot… ja haluttu tapa. Sarake C:ssä kaikki solut joissa on teksti ”Jaakob” väritetään keltaisella. Tämän muotoilun saa aikaiseksi valitsemalla Ehdollinen muotoilu/Solujen korostussäännöt/Teksti joka sisältää… ja syöttämällä haluttu teksti.

Peruskaaviot. Peruskaavioilla tarkoitetaan tässä palkki-, ympyrä- ja viivakaavioita. Kaaviotyyppejä ja visualisoinnin tapoja on useita, mutta useimmiten on tarkoituksenmukaista pysytellä näissä perusvaihtoehdoissa. Visualisoinneilla on toki myös esteettinen arvo ja ne voivat olla jopa taidetta, mutta esimerkiksi tutkimustulosten esittelyssä liika erikoisuuden tavoittelu yleensä heikentää ymmärrettävyyttä ja voi jopa olla harhaanjohtavaa. Yksinkertainen on usein kaunista.

Kaaviot luodaan Excelissä yksinkertaisesti valitsemalla kaavioon tuleva data-alue – useimmiten mukaanlukien rivi- ja sarakeotsikot, ja valitsemalla sen jälkeen Lisää (Insert) välilehdeltä sopiva kaavio. Mikäli valinta on symmetrinen (yhtä paljon rivejä ja sarakkeita koko alueella), ja se ei sisällä tyhjiä soluja, kaavion tekeminen on useimmiten sangen suoraviivaista. Huomioitavaa on kuitenkin, että sarake- ja riviotsikkojen yläkulman yleinen ”tyhjä solu” on useimmiten fiksua sisällyttää valintaan – kuten ylläolevassa kuvassa solu A4. Mikäli taulukossa on ylimääräistä tai lopputulos ei ole haluttu, taulukkoa kannattaa siivota tai järjestellä.

Palkki- tai pylväskaavio (bar chart, column chart) on peruskaavioista suosituin. Usein termeistä palkkikaavio tarkoittaa vaakatasossa olevia pylväitä ja pylväskaavio pystyssä olevia. Niistä on useita erilaisia sovelluksia, joista Excelissä käytetyimpiä ovat ryhmitelty pylväskaavio (stacked column) ja summapylväskaavio (100% stacked column). Perinteinen pylväskaavio kuvaa yhtä muuttujaa, kun taas ryhmitelty pylväskaavio kuvaa useaa muuttujaa ja summapylväskaavio useamman muuttujan suhteellista osuutta. Palkkikaaviot kuten muutkin kaaviot voivat olla perusasettelultaan kaksi- tai kolmiulotteisia, mutta jälkimmäisiä suositellaan välttämään koska ne ovat usein vaikeammin hahmotettavia. Palkki- ja pylväskaaviot ovat hyviä kuvaamaan arvojen järjestystä, koska palkit ovat vasemmalta oikealle tai ylhäältä alas, sekä arvojen eroja, jotka on helppo erottaa palkki- ja pylväskaavioista silmämääräisesti.

Ympyräkaaviota (pie chart) käytetään yleensä kuvaamaan muuttujien suhteellista osuutta kokonaisuudesta, joka usein on 100 % . Ympyräkaavioita tulisi käyttää todella harkiten, mikäli kaikki kokonaisuuden osat eivät ole mukana. Se on yksi käytetyimpiä kaaviomuotoja, mutta tarkkojen erojen kuvaamiseen se ei sovellu. Esimerkiksi oikeanpuoleisessa esimerkissä eri arvojen hahmottaminen on helppoa kaikissa muissa kaavioissa, mutta ympyräkaaviossa se on hankalaa.

Viivakaavio (line chart) on kolmas yleinen kaaviotyyppi ja sitä käytetään usein kuvaamaan muuttujaa suhteessa aikaan, jolloin aika on vaaka-akselilla – tunnettuja esimerkkejä esimerkiksi pörssikurssit ja EKG. Viivakaavio tuottaa pisteiden väliin kulman ja sen avulla on palkkikaaviota helpompi hahmottaa muutostrendiä ja sen jyrkkyyttä eri arvojen välillä.

Edistyneempiä kaavioita ovat esimerkiksi Excelistä löytyvät pistekaavio (scatter plot), sädekaavio (radar chart) ja pörssikaavio (stock chart). Niitä ei käsitellä tällä kurssilla.

Suositeltavaa lisälukemista:

Aki Taanilan menetelmäblogin visualisointipaketti.