Cluster art and articles.

Klusteri tieteen ja taiteen välineenä

Käynnistin oman opiskeluni ja ensimmäisen opinnäytetyöni faktoroimalla (fakrorianalyysi) ensin kyselylomakkeeni vastaukset ja vastaajien tilastoista saatavat tiedot sekä sen jälkeen pisteyttämällä ne kunkin vastaajan kohdalla kullakin faktorilla erikseen. Tietokoneella faktorit näkyvät akseleina. Niitä voi kiertää ja hakea tutkijalle sopivinta mallia ja selittävyyttä. Kyse on usein tutkimuksen alusta ja aineiston jäsentelystä jatkotutkimuksia varten.  Seuravana klusteroin (ryhmittelin) nämä pisteet (havainnot/vastaajat/ihmiset, rottakokeiden rotat jne.) klusterianalyysillä (ryhmittelyanalyysi). Ilmiö muistuttaa algoritmien tapaa toimia kohdallamme ja antaa tutkijalle mahdollisuuden käyttää määrätöntä määrää havaintoja (ihmisiä) ja heihin liitettäviä ominaisuuksia (muuttujia, vastauksia kysymyksiin jne.) sekä vaihdella samalla myös moniulotteista faktoriakseleiden suuntaa.

Kaikki tämä oli mahdollista jo hyvin varhain ja tietokoneen tullessa osaksi tutkimusta. Ennen tietokoneita sama tehtiin käsin ja graafisina malleinamme. Käsitteet Cluster art ja art of custers sekä cluster analysis tai cluster articles ovat siten samaa ilmiötä ja sen kanssa operointia. Tiede ja taide voidaan siirtää myös tietokoneelle ja hakea ratkaisuja, jotka ovat oman aikamme tuotetta. Oma tieteeni ja tutkimus sekä taide ovat ikään kuin samaa poikki- tai monitieteistä tai taiteista prosessia.

Cluster articles avaa googlaten noin 6-7 miljardia havaintoa, Cluster art vähemmän. Suomalaiset vastineensa hyvin vähän ja ilmiö on meille vieraampi. Näin julkaisutkin on syytä tehdä kirjoiksi Saksassa ja myynnin hoitaa Amazon. Ne on voitavat niin ikään klusteroida hakien niille oikeat lukijatkin. Algorimit ovat osa tätä samaa ilmiötämme ja sen oivaltamista pohdittaessa, kuka saa ja millaista postia sivuilleen.

Ilmiö liittyy tieteeseen ja tutkimuksen alkuvaiheisiin ja helpottaa valtavan suurien aineistojen jäsentelyä ja käsittelyä. Myös sellaisten, jotka ovat eri tieteenaloja tarkoittavia ja siis poikki- tai monitieteisiä. Ennen tietokoneita tätä tehtiin käsipelillä ja kaksiulotteisesti. Ei nyt enää vuosikymmeniin. Faktoriakseleita voi myös siirrellä useampiulotteisessa tutkimuskohteen kentässämme, jolloin tutkija saa tai löytää sellaisia ratkaisuja, jotka helpottavat ongelman ratkaisua. Usein hänellä on hypoteettinen kuva, jonka pohjalta hän pohdinnoissaan etenee. Hypoteesi voi olla myös tiedeyhteisön omaa historiaa.

Toki tämä suurten aineistojen käsittely oli mahdollista jo 1970-luvulla tietokoneineen. Synnyin siten aikaan, jolloin opinnäytetyöt tehtiin tietokoneen avustamana ja jouduin myös kouluttamaan oppilaani tähän työhön ja aikaan. Ero sotasukupolveen oli valtava. Omat professorini opettajina eivät tienneet mistä on kyse ja uskoivat sen menevän ohi tietokoneineen. Ei mennyt.

Kun aineistot olivat kovin suuria, jouduimme yhdistämään yliopistojen koneita toisiinsa. Sekin oli tehtävä salaa. Tänään koneet ovat vain nopeampia ja suorituskyky moninkertainen, mutta idea ilmiöiden yhdistämisessä on toki sama. Käynnistän tämän prosessin tutkijana aina ensimmäisenä hankkien näin tutkimusaineistostani ne ulottuvuudet ja klusterit (ryhmät), joiden kohdalla myöhempi työ etenee.

Tästä syntyi myös käsite Cluster art ja art of clusters siinä missä cluster articles ja algoritmit. Mediassa ja sen tutkimuksessa edetään periaatteessa siis samoin kuin vaikkapa lääkärin rottakokeissa ja sen tulosten tulkinnassa. Tai yhdistäen luonnontieteen tuloksia psykologin saamiin vastauksiin. Kone käsittelee ne sähköisesti digikielellään (on ja off). Aivan riippumatta siitä, oliko kyse luonnontieteistä tai ihmistieteistämme. Näin tapahtui siirtymä, jota kutsutaan maailmankuvat muuttavaksi, paradigmaiseksi. Se suosi matemaattista älyä.

Politiikassa tapahtui niin ikään samoin luokiteltaessa samoihin kysymyksiin vastanneiden poliitikkojen tai äänestäjien vastauskäyttäytymistä faktorianalyyseillä ja klusterianalyyseillä. Tosin tuloksena on enemmän kuin ryhmittely liberaaleihin tai konservatiiveihin tai talousoikeistoon ja vasemmistoon. Niin yksinkertainen tietokone ei ole, olkoonkin että kysymykset on aseteltu valmiiksi vahvistamaan näitä poliittisia ennakkoluulojamme.

Sama pätee toki poliitikkoon tai hänen äänestäjiinsä aikana, jolloin ulottuvuuksia (faktoreita) on monin verroin enemmän kuin nämä kaksi sekä niistä laadittu nelikenttä. Ne ovat ajoilta, jolloin muuta ei osattu. Nyt sitten osataan. Kun stereotyyppisten alueiden ja ihmisryhmien rakentelu on menossa yhä rasistisempaan suuntaan, sitä tulisi paheksua myös toimittajien työssä medioissamme.

Suomalainen Wikipedia avaa klusteria hieman toisin kuin englanninkielinen. Samoin käsite Cluster ja Cluster articles saavat liki kymmenen miljardia löydöstä, mutta vastaavat suomalaiset vain muutaman tuhannen tapausta. Nekin voisi tutkia ja klusteroida erikseen. Lainaan kuitenkin suomalaista tekstiä sitä hieman vain muuttaen:

Klustereita (Clusters) esiintyy lähes jokaisessa päivittäisessä elämässä. Otan esimerkiksi esineitä ruokakaupassa. Erityyppisiä tuotteita käytetään aina samassa tai lähiympäristössä – liha, vihannekset, sooda, vilja, paperituotteet jne. Tutkijat haluavat usein tehdä samoilla tiedoilla, tai aiheilla klustereita, jotka ovat osa perinteisen tutkimuksen jo löytämiä havaintoja tai filosofisia rakenteita.

Näin silloinkin, kun maailmankuva on paradigmaisella tavalla muuttunut tai muuttumassa. Se onnistuu vaikkapa valitsemalla oikeita tuotteita, joita kuluttaja käyttää varmasti juuri tietyillä alueilla. Tai vastauksia, joita on helppo manipuloida juuri tietyn alueen vastauksina.

Yhteiskuntatieteistä esimerkkinä Wikipediassa on valittu aiheet, joissa tarkastelemme maita ja kansoja ryhmitellen ne klustereiksi varmasti odotetulla tavalla, perustuen vaikkapa sellaisiin ominaispiirteisiin, kuten työ, työnjako, sotilaisiin, teknologiaan tai koulutettuun väestöön tai poliittisesti meille entuudestaan tuttuun nelikenttään.

Niinpä meidän mielestämme Britanniassa, Japanissa, Ranskassa, Saksassa ja Yhdysvalloissa on samankaltaisia ​​piirteitä ja ne kootaan sitten muuttujina yhteen. Jos tietokone suorittaisi tämän ryhmittelyn toisin, silloinkin kun muuttujat on valittu tukemaan ennakkoasenteitamme, joudumme pohtimaan uusia muuttujia tukeaksemme aiempia asenteitamme ja samalla myös opinnäyte on siten valmis myös hyväksyttäväksi.

Uganda, Nicaragua ja Pakistan olisi myös ryhmitelty yhteen eri klusterissa, koska niillä on erilaiset ominaispiirteet, mukaan lukien alhaiset varallisuuden tasot, yksinkertaisempi työnjako, suhteellisen epävakaat ja epädemokraattiset poliittiset instituutiot ja matala tekninen kehitys. Ilmiö on omaa päättelyämme mutta ei toki tietokoneen tekemää. Tulokseen päästään hakemalla siis oikeat muuttujat, joita mitata.

Toimittaja medioissamme tekee omia päätelmiään, jotka ovat kulttuurisia ja stereotyyppisiä. Näin myös henkilö, joka kirjoittelee meistä ja maista sekä kansoista Wikipediaan. Uutinen ei ole tietokoneen tekemä pohdinta ja tapa ratkaista ongelma, vastata samaan kysymykseen käyttäen algoritmeja ja määrätöntä määrää muuttujia ilmiön ratkaisemiseen.

Uutinen on toimittajan tekemä kyhäelmä, jossa Kiina ja monet muut Aasian maat ja kansat ovat hänelle tuntemattomia. Samoin Kiinan jakautuminen jopa Suomen tapaan pienempii osa-alueisiin ja niiden tulkintaan erikseen.

Kiusaus stereotyyppisten ryhmien ja klustereiden rakenteluun on menneen maailman tuomaa painolastia ja sitä tulisi paheksua rasistisena ilmiönä. Yksilöiden luokittelu, etenkin tietyn alueen sisällä asuen, tiettyyn ennalta arvattavaan ryhmään ihmistyyppeineen luokitellen, on oman maailmankuvamme ja rasististen mielikuvien tuotetta. Niillä ei ole mitään tekemistä tieteen kanssa.

Sama pätee vaikkapa poliittisiin liikeisiin ja niitä äänestäviin ihmisiin. Heidän leimaamisensa jopa persoonallisuutensa osalta nelikenttään on naiivia ja usein myös vihamielistä pilkkaamista. Mediamme tekee tätä yhtenään siinä missä maakuntien ja kansakuntien luokittelua ihmistyyppeineen.

Klusterianalyysiä käytetään tyypillisesti tutkimustyön vaiheessa, jolloin tutkijalla ei ole ennakkoon muodostettuja ja hypoteeseiksi rakentuvia ennakkoasetelmia (ennakkoluuloja). Yleensä se ei ole ainoa tilastomenetelmä, ja se tehdään hankkeen varhaisvaiheessa, jotta se auttaisi muita analyysejä ohjaamaan tutkimusta kohti haluttua päämäärää. Tutkija haluaa rajata aiheensa, jota hän voi käsitellä jatkossa.

Löydöksen kun on oltava myös osapuilleen sellainen, joka on ko. tieteen ja sen perinteen myös hyväksyvä (traditio). Politiikkatutkimuksessa äänestäjät ja poliitikot on voitava vaikkapa luokitella talousvasemmalle ja oikealle tai liberaaleiksi tai konservatiiveiksi. Se miten tuo mittaus tapahtuu, ei ole tietokoneen tekemä, vaan tutkijan omaan maailmankuvaan rakentuva ja palvelee tieteen traditiota ja sen ylläpitoa (konservatismi ja ennakkoluulot).

Vastaajista kun voitaisiin saada myös paljon tästä poikkeavia ulottuvuuksia, joista olisi enemmän myös käyttöä alan tutkimuksessa, saati politiikanteon arjessa, uusien yhteiskunnallisten uudistusten ja innovaatioiden avaamisessa.

Oikeammin tietokoneet eivät tällaisia perinteisiin kiinnittyneitä faktoreita tai tutkimustuloksia klustereineen edes tunnista. Sen sijaan syntyy ryhmiä, joiden kohdalla politiikanteon pohdinta olisi monin verroin hyödyllisempää kuin siinä nelikentässä, joka on syntynyt ennen tietokonetta ja faktoreita, algoritmeja, klustereita jne.

By Matti Luostarinen

Prof, PhD, ScD Matti Luostarinen (natural and human sciences) birth: 100751, adress: Finland, 30100 Forssa, Uhrilähteenkatu 1 matti.luostarinen@hotmail.com Publications: Monographs: about one hundred, see monographs, Cluster art.org Articles: about two thousand, see all publications, Cluster art.org Art: Cluster art (manifest in 2005), see Art, Cluster art.org CV, see Cluster Art.org Blog: see blog, Cluster art.org (Bulevardi.fi)

Vastaa

Related Posts