Om kunstig intelligens, film og fantasi

31 august, 2025 er det 70 år siden begrepet «artificial intelligence» (AI) — eller kunstig intelligens (KI) på norsk — først dukket opp i offentligheten. Siden den tid har begrepet vært kjent og omdiskutert i forskningsmiljøer som har jobbet med å utvikle KI, men det var først når OpenAI lanserte DALL-E 2 i januar 2022 og ChatGPT i november samme år at offentlighetens oppmerksomhet for alvor vendte seg mot KI. Spesielt ChatGPT har satt fyr på diskusjoner om KI, og for mange er ChatGPT og tilsvarende språkmodeller synonyme med KI.

I filmbransjen er vi godt kjent med streikene som preget Hollywood i 2023. Der var bruk at KI i forskjellige deler av produksjon et sentralt tema. Selv om WGA kunne rapportere de har innkassert en sier der, og at produsenters anledninger til å erstatte manusforfattere med KI vil bli sterkt begrenset forteller mange i bransjen at bruk av KI er mer utstrakt enn de fleste vil innrømme.

Sanser, fantasi og kognisjon

I film — og kunst forøvrig — snakker vi ofte om det sanselige. Verket berører oss på måter som ikke er begrenset til det intellektuelle men heller taler til sansene våre og til det emosjonelle. Dette gjelder ofte også for de som skaper kunstverk; en kunstner tar i bruk sanser, intuisjoner og det emosjonelle for å skape. Derfor er jeg, i mitt arbeid med å utvikle en dypere forståelse for hvordan vi utdanner kunstnere, opptatt av en utvidet forståelse av vår kognisjon og kognitiv utvikling. Denne utvidete forståelsen omfatter det som de siste drøyt 30 årene er blitt beskrevet som “4E Cognition” i kognitiv vitenskap, psykologien og filosofien, hvor utgangspunktet er at vår kognisjon og sinn ikke er begrenset til hjernen men omfatter hele kroppen, sansene og verden rundt oss.

Dette betyr, blant annet, at det vi sanser og det kroppen opplever er vel så viktig for vår kognitive utvikling som det vi tradisjonelt fokuserer på, hjernen og intellektet. Videre forteller 4E kognisjonen at våre kognitive evner og kapasitet formes også av våre omgivelser og verktøy og måten vi tolker verden og vår plass i den som skapende mennesker vil påvirkes av de verktøyene vi bruker, de menneskene vi omgis av og det samfunnet vi lever i.

En beslektet teori handler om “perceptual learning“, som omfatter varige endringer i menneskers sanser, eller persepsjon, som resultat av øvelse eller erfaring. Et enkelt eksempel som ofte brukes av de som skriver om denne teorien er at en sommelier ikke bare tolker smaken av vinen på en mer avansert måte enn resten av oss, men gjennom gjentatt bruk av smaks- og luktesans vil utvikle disse sansene til å oppfatte andre ting enn det du og jeg kan. Overført til filmens verden kan man si at en fotograf vil utvikle synet sitt til å se og oppfatte ting som det gjennomsnittlige kinopublikum ikke oppfatter og en lydperson vil utvikle hørselen til å høre på en annen måte enn resten av oss. Dette frigjør også kognitiv kapasitet til å konsentrere seg om det som er essensen av faget, som de har behov for når de skaper.

Filosofer har lenge utforsket sammenhengen mellom erfaring og fantasi. Der opplysningstidens filosofer hevdet at den menneskelige fantasi er ubegrenset viser nyere undersøkelser at vår fantasi begrenses av både samfunnet rundt oss og av egen erfaring. Fantasi kommer ikke fra intet. For å kunne utvikle fantasien må vi både ha et erfaringsgrunnlag å bygge på og må arbeide for å utvikle våre evner til å bruke et vi erfarer og oppfatter som grunnlag for fantasiens skapelser. Nylig har filosofen Amy Kind (blant annet) videreutviklet dette i et bokkapittel publisert sommer 2024.

Felles for 4E kognisjon, perseptuell læring og fantasi er vekting av menneskelig, personlig erfaring. Læring, utvikling, forståelse, refleksjon, følelse, opplevelse er alle ting som krever et erfaringsgrunnlag, hvor individet på en eller annen måte har kommet i kontakt med eksterne omgivelser og bearbeidet den kontakten.

Men hva har alt dette med KI å gjøre?

For å begynne å forstå det må jeg først spesifisere hva slags KI det er snakk om. Begrepet “kunstig intelligens” brukes populært for å omtale en rekke forskjellige verktøy. Felles for dem er de bruker avanserte algoritmer, stor datakraft og maskinlæring for å utføre spesifiserte oppgaver. I filmverden har leverandører som Avid og Adobe integrert KI i programmene de lager. Flere selskap, som, for eksempel, Colourlab, har også begynt å lage KI-verktøy for grading. Det finnes mange flere eksempler som omfatter de fleste områder av filmproduksjon.

Det de fleste mener når de snakker om KI er generativ kunstig intelligens, eksemplifisert av verktøy som ChatGPT, Dall-E, MidJourney, Suno, Sora, med flere, hvor brukeren skriver en “prompt” som tolkes av KI og gir et resultat bestående av tekst, lyd eller bilde, avhengig av hvilken modell som brukes. Spesielt ChatGPT (og hovedkonkurrentene Anthropics Claude, Googles Gemini, Microsofts Copilot, Metas Llama og, i norske offentlige virksomheter, Sikt KI-chat — heretter når jeg skriver “ChatGPT” mener jeg alle slike språkmodeller) har fått mest oppmerksomhet, og de brukes til å skrive tekster, lage oppsummeringer av eksisterende tekster, idéutvikle i skriveprosesser, og mer.

Mange i filmen, også på Filmskolen, vedgår å ha tatt i bruk ChatGPT i idéfasen av en skriveprosess, hvor den kan fungere som en virtuell sparringpartner og kanskje også som en enkel redaktør i faser av skriveprosessen. Internasjonalt er det også et kjent fenomen at mange bruker ChatGPT på nettopp denne måten.

Juli 2024 kom en studie som undersøkte sammenhengen mellom bruk av ChatGPT i skriveprosesser og kreativitet. Dette var ikke den første studien, men det var den første som undersøkte effekten ChatGPT har på variasjonen i fortellingene som skapes når flere bruker verktøyet.

Og hva viser denne studien? Jo, den viser at KI kan bidra til økt kreativitet og produktivitet for en enkeltperson, og gi en støtte i en skriveprosess hvor man sitter fast eller sliter med kreativiteten. Men — og i mine øyne er dette et stort men — det finnes en bieffekt: når flere bruker KI på denne måten blir den samlede variasjonen i fortellingene mindre. Altså, bruk av KI homogeniserer fortellingene som skapes.

Her kommer vi til en annen egenskap ved ChatGPT. Selv om språkmodellene er trent opp på en enorm mengde tekst er de i bunn og grunn statistiske modeller. Selv om KI kan skape tilsynelatende original tekst har den ingen forståelse for innholdet i det den produserer. Datagrunnlaget har gitt den mulighet til å analysere hvordan tekster bygges opp rent statistisk, og den bruker dette til å generere tekst. I tillegg har programmererne skapt en del sperrer som skal forhindre bestemte typer skadelig innhold. Videre er de store språkmodellene i stor grad trent opp på engelsk-språklig materiale med de kulturelle normene det innebærer.

Resultatet av dette er der den enkelte forfatter kan finne idéer de kanskje selv ikke ville kommet på gjennom bruk av KI, vil alle forfattere som bruker det finne idéer som ligner på hverandre gjennom kombinasjonen av statistisk sannsynlighet og kulturelle normer. Og vi får mindre mangfold i fortellingene som skapes.

Det vil også kunne ha en negativ effekt på den enkelte forfatter over tid. Som jeg skrev over, er vår kognitive utvikling, våre sanser og vår fantasi og kreativitet avhengig av personlig erfaring og bearbeiding av denne erfaringen for å utvikles og vedlikeholdes. Jo mer vi bruker KI, jo mer avhengig blir vi av den.

Språkmodeller har også en annen begrensning: den forstår ikke tekst. KIs evne til å generere tekst, og menneskets evne til å forstå tekst er tydelig illustrert i dette eksempelet, som testet ChatGPTs evne til å lage oppsummeringer av lange, komplekse tekster. Kort fortalt viser testene at KI generer en forkortet tekst basert på hyppigheten av forskjellige fraser og setninger (altså, statistikk), men den generer ikke en oppsummering basert på det vesentlige innholdet i teksten. Videre er oppsummeringene påvirket av kontekst — altså din nylige historikk med akkurat denne chatboten.

Denne effekten kan ha store konsekvenser. I eksempelet lagt frem er resultatet at KI-generte oppsummeringer av faglige tekster misvisende og kan, i verste fall, presentere en annen konklusjon enn den som er i teksten. For fiksjon er det også lignende problematikk, hvor essensen i fortellingen, samt vesentlig informasjon om karakter og handling kan forsvinne i en oppsummering basert på KI.

Etterhvert som generativ video har kommet i 2024 begynner vi å se en lignende trend i hva som kommer fra de verktøyene. OpenAI lanserte Sora til stor oppmerksomhet i mars, og juni lanserte Runway sin modell som heter Gen-3 Alpha. Tester av Runways modell viser noe av det samme vi så med Sora: den skaper lett surrealistiske og til dels artige videoer, men har store problemer med konsistens og bevegelse, blant annet. Samtidig er det det også noe annet som kommer frem: verken Sora eller Gen-3 Alpha er i stand til å skape noe nytt. De lager en form for collage av eksisterende elementer, men det visuelle uttrykket er konvensjonelt.

Former KI mennesker i sitt eget image?

En sentral del av vår erfaring baseres på hvilke verktøy vi bruker for bestemte oppgaver. Utsagnet “hvis alt man har er en hammer vil alt se ut som en spiker” sier mye om oss, da det viser hvordan vår oppfatning av verden formes av den måten, og med hvilke verktøy, vi møter verden. Når vi bruker KI vil det ikke bare være et verktøy for å utføre en oppgave, men det blir en del av vår kognitive utvikling og erfaring — vi formes av KI samtidig som vi bruker KI. Jo mer vi bruker et bestemt verktøy, jo større del av vår kognitive virkelighet vil dette verktøyet bli og jo mer avhengig av det verktøyet blir vi.

Kunstnere arbeider ikke i et vakuum. Vi formes av våre erfaringer, våre inntrykk, følelser og emosjonelle reaksjoner til det vi har erfart og det vi har møtt med sansene våre. En rik og nyskapende fantasi avhenger av nye og varierte inntrykk som bearbeides mens vi skaper. Som Kind viser i sin tekst jeg referer til over vil begrensninger av vårt erfaringsgrunnlag også føre til en innsnevring av fantasiens muligheter til å skape nye og grensesprengende verk. Der KI kan hjelpe den enkelte finne inspirasjon i enkeltsituasjoner vil KI og andre algoritmestyrte verktøy også gi en innsnevring av erfaringsgrunnlaget og kan dermed føre til at det man skaper er mer konvensjonelt og likt det andre skaper.

I januar 2024 organiserte jeg, sammen med kolleger fra Høgskolen i Innlandet, et seminar om KI og kunst. Blant innlederne var Tatjana Sampojan, som kunne fortelle at i hennes virker som manuskonsulent leser hun hundrevis, om ikke tusenvis av manus hvert år. Veldig mye av det hun leser er middelmådig, og i KI-sammenheng dukker et opplagt spørsmål opp: når en KI chatbot kan produsere middelmådig tekst raskere og mer effektivt enn en profesjonell manusforfatter, hvordan skal mennesket stå frem i konkurranse med maskinen?

Hennes svar? Fire. Altså, lidenskap eller glød — det som gjør oss til levende, følende, sansende, fantasifulle skapninger og er de egenskapene som former hvordan vi bruker språk og intellektet. Der KI gir oss det kjente, det forutsigbare og det statistisk sannsynlige må vi anvende hele vårt register for å skape og fortelle meningsfylte historier.

Den 22. juli 2024 kunne vi lese en kronikk i The Guardian hvor den tyske forfatter Daniel Kehlmann innleder med å skrive,

A short while ago, a screenwriter friend from Los Angeles called me. “I have three years left,” he said. “Maybe five if I’m lucky.” He had been allowed to test a screenplay AI still in development. He described a miniseries: main characters, plot and atmosphere – and a few minutes later, there they were, all the episodes, written and ready for filming. Then he asked the AI for improvement suggestions on its own series, and to his astonishment, they were great – smart, targeted, witty and creative. The AI completely overhauled the ending of one episode, and with those changes the whole thing was really good. He paused for a moment, then repeated that he had three years left before he would have to find a new job.

Her ligger et stort ansvar på produsenter og alle som finansierer film og tv. KI er billigere og raskere enn mennesker, enten det handler om tekst eller andre elementer. Effekten er foreløpig mer synlig i spillbransjen, hvor KI har hatt en stor effekt på antall mennesker som arbeider i bransjen.

At det enkelte produksjonsselskap tar i bruk verktøy som bringer ned kostnadene når de skaper kunst- og kulturuttrykk som er kostbare og ressurskrevende er forståelig fra et økonomisk perspektiv. Men hvis det blir normen blir vi alle fattigere.

css.php