29/10/2024
Olen vertaillut generatiivisia kuvatekoälyjä nyt jonkin aikaa. Kolme 😆 pointtia:
1. Kuvatekoälyt eivät vapauta visuaalisen ajattelusta. Päinvastoin. Jo kuvan tuotantoa ohjaavien promptien laatiminen vaatii paitsi käytännöllistä tietoa tekoälyn toiminnasta, myös taitoa sanallistaa toivottu kuvallinen lopputulos. On hahmotettava visuaalista maailmaa, tunnettava erilaisia kuvagenrejä, rajauksia, tekniikoita, väriratkaisuja. Ennen kaikkea on perehdyttävä olemassa olevaan kuvalliseen todellisuuteen – myös ja ennen kaikkea silloin, jos haluaa rikkoa esittämisen konventioita. Tämän postauksen kuvan prompti: tiny, cute horse character on the hill with a soft pastel palette and playful, smooth design, 3D rendered impression. (ChatGPT/DALL·E 3)
2. Kuvatekoälyjen "kouluttamiseen" käytetty data on aina vinoutunutta ja noudattaa jo olemassa olevia visuaalisia järjestyksiä. Jotain on paljon, jotain minimaalisesti. Jos esimerkiksi naiset tai jotkin etniset ryhmät ovat aliedustettuja koulutusdatassa, ne ovat sitä myös tekoälyn tuottamassa kuvastossa. Datan vinoumien ymmärtäminen ja niiden kääntäminen visuaalisen viestinnän voimavaraksi on kova haaste visuaaliselle ajattelulle.
3. Kuvatekoälyt tuottavat lähes säännönmukaisesti "tekoälytapettia" eli kuvia, jotka kuvaavat – niin – ennen kaikkea tekoälyä itseään. Kuvaston jalostaminen erottuviksi visuaalisiksi ratkaisuiksi vaatii graafisten työkalujen hallintaa, ammattitaitoa ja kykyä nähdä tekoälyn rakentamassa kuvassa idullaan oleva viestinnällinen potentiaali. Osaaville valokuvaajille ja graafikoille on jatkossakin kysyntää, JOS siis halutaan laatua ja erottuvaa visuaalista viestintää – mitä oheinen kuva ei ole.