Så blir orden verkliga

Text: Ulf Pettersson

Säkert har du suttit i en biosalong och sett en film baserad på en roman. Kanske tyckte du att det du såg inte riktigt stämde med boken. Rollfigurernas utseenden var inte de rätta, huset och miljön där någon bor motsvarade inte vad du hade tänkt dig.

Det är inte konstigt. Under läsprocessen producerar vi en mängd mentala bilder. Dessa bilder kommer ofta i konflikt med bilderna på bioduken. Men hur går det till när vi skapar de mentala bilderna? Hur kan bokstäver ge upphov till livfulla upplevelser?

För att besvara dessa frågor vill jag börja med ett citat ur den sydafrikanske Nobelpristagaren J.M. Coetzees roman Mr Foe:

”På tavlan ritade jag ett hus med dörr och fönster och skorsten, under det skrev jag bokstäverna h-u-s. ’Det här är bilden’, sade jag och pekade på bilden, ’och det här är ordet’. Jag uttalade ljuden i ordet hus ett efter ett, pekade på bokstäverna efter hand som jag framsade dem, och förde sedan Fredags finger över bokstäverna samtidigt som jag uttalade ordet, satte slutligen pennan i hans hand och styrde den till att skriva h-u-s under det h-u-s som jag hade skrivit. Sedan suddade jag tavlan ren, så att det ej fanns någon annan bild kvar än bilden i Fredags minne, och styrde hans hand till att skriva ordet en tredje och fjärde gång, tills tavlan var täckt av bokstäver. Jag suddade den ren igen. ’Gör det nu ensam’, sade jag, och Fredag skrev de tre bokstäverna h-u-s, eller tre figurer som någorlunda liknade dem. Endast han själv visste om det verkligen var de tre bokstäverna, och om de verkligen stod för ordet hus, och bilden jag hade ritat, och saken i sig.”

Mr Foe är en omskrivning av Daniel Defoes berömda berättelse om Robinson Crusoe, mannen som lever många år på en liten ö med vilden Fredag som enda sällskap. I citatet ovan försöker Robinson lära Fredag sitt språk genom att använda två typer av tecken som ska representera samma sak. Enligt filosofen och semiotikern Charles Sanders Peirces uppdelning är det hus som Robinson ritar ett ikoniskt tecken; det bygger på en likhetsrelation. Bokstäverna under bilden, h-u-s, och det ord de tillsammans bildar är symboliska tecken och bygger på konvention; de representerar något visst eftersom vi har bestämt att de ska göra det.

Den tredje teckentypen kallas av Charles Sanders Peirce för indexikala tecken. Den definition som dessa brukar ges är att de bygger på närhet eller orsakssammanhang; de pekar mot något annat eller är ett ”spår” efter något annat. När Robinson pekar är det ett indexikalt tecken som ska leda Fredags uppmärksamhet dels mot bilden av huset, dels mot bokstäverna, för att få honom att förstå att det ljud han hör när Robinson säger hus, ska kopplas samman med bokstäverna och med den bild som finns alldeles ovanför bokstäverna. Sedan går Robinson vidare i pedagogiken och använder Fredags eget finger som ett indexikalt tecken, medan han uttalar de ljud som bildar ordet hus.

Efter det att Fredag själv, med Robinsons styrande hand, fått skriva ordet några gånger suddar Robinson ut bokstäverna och till slut även bilden av huset, ”så att det ej fanns någon annan bild än bilden i Fredags minne”. När Fredag sedan på egen hand skriver tre tecken som förefaller vara de aktuella bokstäverna undrar Robinson (och läsaren) om tecknen ”verkligen stod för ordet hus, och bilden jag ritat, och saken i sig”.

De bokstäver som Fredag på egen hand skriver – h, u och s – är ett bevis på att han i sitt huvud har en mental visuell representation av dessa bokstäver. Hur skulle han annars kunna återskapa dem? Det är inte orimligt att förmoda att han inom sig också hör de ljud som Robinson uttryckte då denne lärde ut bokstäverna och ordet, vilket är ytterligare en mental representation.

Har Robinson lyckats helt med sin uppgift så har Fredag ännu en mental representation som aktiveras under skrivakten: den ikoniska representationen av det tecknade huset. Om så är fallet kommer Fredag, då han ser bokstäverna eller hör ljuden, att i fortsättningen troligen se det tecknade huset inom sig på nytt, som en visuell mental representation.

Eftersom Fredag förmodligen aldrig har sett något verkligt hus med dörr, fönster och skorsten, kommer representationen av den tecknade bilden att vara det enda han ser. Skulle han däremot i framtiden få se ett verkligt hus, som utseendemässigt i stort motsvarar det som Robinson tecknade, så skulle Fredag ganska snabbt kunna koppla samman mönstren från det verkliga huset med mönstren från det tecknade hus som bevarats i hans minne. Han skulle inse att han stött på något som han kan beteckna med bokstäverna och ljuden h-u-s.

Att koppla samman mönster på detta sätt är något grundläggande i mänsklig varseblivning och mänskligt tänkande. Som Peter Gärdenfors, kognitionsforskare i Lund, uttrycker det i sin bok Den meningssökande människan, är hjärnan ”ingen passiv mottagare av bilder och ljud från omvärlden. Den söker aktivt efter mönster och den tolkar omvärlden. Denna ständigt pågående process är grunden till all form av förståelse”.

Man kan säga att vi i vårt minne har lagrat vissa schematiska bilder som vi utnyttjar för att känna igen olika objekt. Dessa bildscheman är i grunden mycket enkla, och inte alls att jämföra med det vi i dagligt tal kallar bilder. Snarare kan de jämföras med streckfigurer eller skisser, ungefär som det hus Robinson ritade. Men om vi får mer information – till exempel när någon nämner Stockholms slott eller Vita huset i Washington – ja, då kan vi skapa en mer utvecklad mental bild, ifall vi sedan tidigare känner till dessa byggnader.

Låt oss nu gå lite närmare in på vad som händer när vi inte läser, utan i stället använder ögonen till att se oss omkring i vår omgivning. Den bild av omvärlden som finns på näthinnan är en tämligen komplett återgivning av vårt aktuella synfält. Men det som når hjärnan är något helt annat. Det beror på den manipulation av sinnesintrycken som äger rum i den så kallade perceptionsprocessen – det förlopp som hanterar intrycken och gör att vi förnimmer vår omvärld. Några av de grundläggande inslagen i perceptionen är vår förmåga att skilja mellan figur och bakgrund, och urskilja former, mönster och strukturer. I processen passar vi in de former och mönster som vi uppfattar via synen med former och mönster som redan finns lagrade i hjärnan.

De signaler som skickas från näthinnan och når den del i bakre hjärnan som kallas synbarken, behåller sin geometriska organisation. I experiment har man kunnat se att mönster och former finns bevarade där. Men därefter behandlas dessa sinnesdata i fragment utspridda i hjärnan. Data om form, färg, rörelse, relationer mellan delar och helhet med mera, sprids ut i olika delar av hjärnan, där de behandlas och lagras. För att vi ändå ska uppleva en helhet av dessa fragment krävs integration. Exakt hur denna går till är osäkert. Problemet kallas inom neurologisk forskning för bindningsproblemet.

När vi ser en häst, aktiveras alltså, på skilda platser i hjärnan, olika lagrade former, färger, mönster och strukturer. På något sätt integreras dessa till en upplevd helhet. Men att detta inte kan vara hela förklaringen framgår av att vi faktiskt oftast kan skilja åsynen av en ”ny” häst från alla andra hästar vi har sett. Vi noterar alltså även tidigare okända nyanser i form och struktur, och kan ge enskilda förnimmelser en individuell prägel.

Men hjärnan hjälper också till att konstruera de gestalter som vi uppfattar via våra sinnen. Exempelvis skapas konturer hos objekten under synprocessen, även om sådana inte finns i själva förnimmelsen. Enligt Peter Gärdenfors är det sådana ifyllningar som skapar de representationer som tänkandet arbetar med. Perceptioner är, med andra ord, konstruktioner av vad som händer i omvärlden.

En viktig fråga för psykologen och konsthistorikern Rudolf Arnheim har varit om vi med det verbala språket som medium använder ett annat medium, det visuella, i vårt tänkande. I sin bok Visual thinking skriver han att det verbala språket har sin grund i våra perceptuella erfarenheter av omvärlden. Genom sin ordning hjälper det oss också att skapa en stabil struktur i tänkandet.

Det som Rudolf Arnheim menar med ”ordning” är att det verbala språket är sekventiellt: ord, begrepp och meningar följer efter varandra. I skriftspråket följer rad efter rad, sida efter sida. Detta leder till en liknande ordning under den mentala läsprocessen. Språket leder oss från bild till bild. Men vi har också förmågan att koppla de bilder vi får när vi läser till andra bilder och mönster som vi har lagrat i hjärnan.

Rudolf Arnheim ger exemplet ”lejon är katter”. Orden lejon och katt har inte en enda bokstav gemensam, och det finns inte några likheter alls mellan själva orden, men genom de mentala bilder som de skapar kan vi se att de djur som orden representerar har släktskap.

Vi har också förmågan att koppla vissa ljud till vissa bilder. Om vi hör ett morrande ljud när vi är ute och går, kan vi lätt mentalt visualisera det djur som morrar, till exempel en hund, även om vi faktiskt inte kan se själva hunden. Man kan också tänka på hur lätt vi har att koppla en röst vi hör i telefonen till en viss person.

Den här förmågan att koppla samman ord eller ljud med bild är exempel på att våra perceptioner kan smälta samman. Sinnesdata kommer till oss antingen via hörsel, syn, känsel, lukt eller smak, men i hjärnans bearbetning har vi en väl utvecklad förmåga att göra sammansmältningar.

De ord vi läser påverkar oss också i ett mer kroppsligt perspektiv. Ett verb som sparka gör att den motoriska del av hjärnbarken som styr fötterna aktiveras. Och den del som styr händerna triggas av verbet kasta. Forskare visade redan för flera decennier sedan att samma delar av hjärnan är aktiva när vi föreställer oss en handling som när vi faktiskt utför den. Peter Gärdenfors pekar på betydelsen av detta då vi läser fiktiva berättelser:

”Den språkliga kommunikationens mekanismer gör att de inre objekten blir lika verkliga för oss som de yttre. Sagans värld går lika bra att dela med sig av som den verkliga. När vi förstår ett uttryck skapar vi en ’bild’ av betydelsen. En spekulation är att detta faktiskt svarar mot vad som händer i hjärnan när vi tolkar en verklig bild.”

I långtidsminnet lagrar vi inte bara enskilda sinnesintryck, utan hela serier med intryck. Ett ofta använt exempel är vår allmänna kunskap om hur ett restaurangbesök går till. Men dessa serier, eller scripts, kan också gälla rum, som vår allmänna föreställning om hur ett vardagsrum typiskt ser ut. Vi kan använda sådana scripts för att konstruera en mental representation av en väns beskrivning av ett restaurangbesök, eller när vi läser om någon i en roman eller novell som besöker en restaurang. Vi använder då våra memorerade restaurangbesök för att fylla i de luckor som finns i berättelsen, och skapar därigenom en mer komplett bild av textens innehåll.

När vi läser skapas flera mentala representationer i hjärnan. Dessa kan delas upp i tre nivåer. I ytstrukturen ges en mental representation av själva orden som de framträder för oss på boksidan. Denna mentala representation bevaras oftast inte någon längre tid i minnet. Nästa nivå kallas textbasen, och innebär en mental representation av den exakta betydelsen av textens ord och meningar. Den tredje mentala representationen kallas situationsmodell. På denna nivå använder läsaren sina egna erfarenheter och minnen för att få en levande modell av det som beskrivs och sker i texten.

Situationsmodeller är alltså mentala representationer av skeenden inom en begränsad tid och inom en avgränsad plats, som typiskt inbegriper minst en person samt något eller några objekt. Kognitionsforskaren Rolf Zwaan menar att situationsmodeller kan framkalla mentala representationer som gör att vi i vårt inre kan ”se” olika skeenden, som när vi läser om hur en glasflaska kastas mot en stenmur och splittras. Exakt hur detaljerade de mentala representationerna är under läsprocessen, råder det dock delade meningar om.

När vi läser produceras en rad sådana här situationsmodeller, allteftersom skeendena i texten fortskrider. Situationsmodellerna utvecklas och knyts till varandra. Detta gör att vi, i vårt inre, skapar fortlöpande mentala bilder av det som sker i berättelsen. Ibland är vi medvetna om det, och stannar kanske upp i läsningen för att fundera över de bilder vi får. Men ofta är det en process som pågår utan att vi är direkt medvetna om det. Ändå utgör de mentala bilderna och situationsmodellerna en viktig del av hur vi tar till oss texten: hur vi tolkar den.

När vi efter läsningen erinrar oss något ur berättelsen så är det dessa representationer, bilder och situationsmodeller, som vi minns, inte hur det exakt uttrycks i texten. Och dessa visuella representationer utgör grunden till att vi inte sällan upplever att den filmversion vi ser inte riktigt stämmer. Vi har ju på sätt och vis redan sett en annan visualiserad version av romanen i vårt inre under läsprocessen.

Ulf Pettersson är forskare i litteraturvetenskap vid Linnéuniversitet. Artikeln är baserad på hans avhandling Textmedierade virtuella världar. Narration, perception och kognition.