Därför är det så svårt med skrift

Det som skriften först och främst är till för är att symbolisera ljud och ord i språket. Något skriftsystem med en symbol för allt som finns eller alla idéer som kan tänkas existerar inte. Däremot kan man alltid skriva ner sådant som har ett språkligt uttryck.

Det ligger alltså i själva definitionen av ett skriftsystem att det kan förväntas representera just det som kan uttryckas på mänskligt språk – varken mer eller mindre. Ett skriftsystem med full språklig uttrycksförmåga måste alltså kunna referera direkt till ett språk.

Mellan alla skriftsystem som kan uppfattas som ”bildskrifter”, till exempel logografiska skriftsystem som det kinesiska teckensystemet och de egyptiska hieroglyferna, råder alltså en väsentlig likhet: Båda uttrycker språkliga utsagor. Det innebär att skriftsymbolerna primärt representerar ord eller morfem, betydelsebärande enheter, snarare än de företeelser, tankar eller idéer som dessa språkliga uttryck står för. Men genom språket aktualiseras just de företeelser, tankar och idéer som de språkliga uttrycken representerar. När vi skriver till exempel ek representerar vi ordet ek, vi avbildar inte en ek. Men ordet ek aktualiserar ett eller flera exemplar av trädet i fråga.

Vi kan utgå från att all skrift är glottografisk. Glotto kommer från grekiskan och står för ’språk’. Glottografisk skrift är alltså det som föregående stycke handlar om: ett sätt att avbilda ljud och ord i språket, inte saker eller tankar utanför språket. Den senare typen av system kan kallas semasiografiskt (semasia står i grekiskan för ’betydelse’). Pianonoter, kartor och matematisk notation är sammansatta av semasiografiska symbolsystem. Men eftersom de är oberoende av språk kan de inte gärna betraktas som skrift.

”Ljuden är i stora drag desamma från språk till språk”

I en alfabetisk skrift – det vill säga bokstavsskrift – som den grekiska, latinska och kyrilliska finns i princip ett direkt ett-till-ett-förhållande mellan ljud och bokstäver. Den alfabetiska skriften i svenska, grekiska och ryska är med andra ord baserad på det faktum att talade yttranden på alla språk kan betraktas som följder av konsonanter och vokaler. Alla språk kan alltså skrivas alfabetiskt, men så fungerar det inte alltid i praktiken. Många språk har ingen skrift. I en del används helt andra skriftsystem än det alfabetiska (syllabiska, logografiska eller en blandning av sådana system).

Även om talade yttranden på alla språk kan ses som följder av konsonanter och vokaler så motsvarar en given bokstav inte alltid entydigt ett givet ljud. Förhållandet mellan ljud och bokstäver kan bli ganska komplicerat. Ett notoriskt exempel på det vacklande förhållandet mellan tal och skrift är det svenska [ʃ]-ljudet – även kallat sje-ljudet – i ord som sjuk, sked, skjuta, stjärna, schäfer, chef och genera.

I en del andra språk kan det vara ännu svårare att veta hur ett ord ska skrivas. I engelska rimmar till exempel by, die och guy. Och kneal och Neill har samma uttal, medan dear och pear låter olika, [dɪə] respektive [peə]. I franska kan både ou ’eller’ och août ’augusti’ uttalas ungefär som det svenska namnet på bokstaven o. Irländska är ännu mera svårstavat än engelska. Betrakta till exempel frasen ní bhfaighfidh mé ’jag kommer inte att få’, där bhfaighfidh står för den enkla stavelsen [wı] (och låter ungefär som engelskans we och franskans oui).

Ljuden är i stora drag desamma från språk till språk. En komplicerande faktor i världens alfabet är att vissa bokstäver och sammanställningar av bokstäver kan representera olika ljud i olika språk. Exempelvis stavas [s]-ljudet med sz i ungerskan. Där står bokstaven s för [ʃ] – det vill säga sje-ljudet – som i polskan skrivs med sz.

Ett annat exempel är det nj-liknande ljud som i spanska skrivs med ñ som i España (den fonetiska beteckningen är [ɲ]). I andra romanska språk skrivs ljudet på diverse olika sätt: i katalanskan som i Espanya, i portugisiskan som i Espanha, i italienskan och franskan som i Spagna respektive Espagne. Hela tiden handlar det om ljud som är väldigt lika varandra. Men stavningarna är så olika att vi lätt kan inbilla oss att skillnaderna mellan språken är större än de är.

Allt detta är dock relativt marginellt. En grundläggande likhet ligger i det uppenbara att de nämnda språken – inklusive svenskan, grekiskan, franskan, ryskan, engelskan och spanskan – skrivs alfabetiskt; det vill säga att fonemen, de betydelsebärande språkljuden, återges med hjälp av bokstäver för konsonanter och vokaler. Om vi betraktar skriftprover från de flesta mer eller mindre västerländska språk, så finner vi detsamma. De latinska, grekiska och kyrilliska alfabeten skrivs i princip med en bokstav per fonem.

**I franskan finns gott om *homonymer*, ord som uttalas likadant men har olika stavning och betydelser.**

Men det förekommer att en viss bokstav eller kombination av bokstäver representerar olika ljud, till exempel svenskans o i lova som uttalas olika beroende på om det betyder ’styra en segelbåt upp mot vinden’ (där vokalen uttalas som bokstaven o) eller ’ge ett löfte’ (med uttalet å). När man hör ett ord kan man alltså inte alltid veta hur det ska stavas, och det är inte sällan oklart hur ett skrivet ord ska uttalas.

Att det har blivit så här beror i mycket på att språks uttal förändras med tiden, och att stavningsreglerna släpar efter. Exempelvis är engelskans stavning en rätt god avspegling av ett medeltida uttal, så för dagens språkbrukare är stavningen inte alls transparent. Man kan inte utifrån ett engelskt ords uttal veta hur det ska stavas, eller utifrån stavningen bestämt säga hur det ska uttalas – det syns ju till exempel inte att dear och pear har olika vokalljud – [dɪə] respektive [peə].

Hur är det med andra besläktade språk? Betrakta följande sex franska ord: verre ’glas’, vert ’grön’, vair ’pälsverk’ (i heraldik), ver ’mask’, vers ’vers’ och vers ’mot’. De uttalas alla [vɛr]. Alltså kan man inte från uttalet bestämma stavningen. Men i franska tycks det vara så att slutsatser om uttalet utan vidare kan dras av stavningen. Hur skulle man från någon av dessa stavningar kunna få ett uttal annat än [vɛr]?

Det finns också språk där relationen mellan stavning och uttal är betydligt genomskinligare. Finskan är ett paradexempel på enkel och förutsägbar ljudenlighet. Kommande uttalsförändringar lär ändra på den saken, förr eller senare. Det finns redan tecken i tiden.

”Man kan inte utifrån ett engelskt ords uttal veta hur det ska stavas”

Finskan har lånord som i de långivande språken innehåller andra konsonanter än dem som ingår i finskans grundläggande ljudinventarium. Lånord som banaani ’banan’, gaala ’gala’ och Belgia ’Belgien’ kan få uttal som [ˈpana:ni], [ˈka:la] och [ˈpelkia] eftersom [b] och [g] inte ingår i det traditionella finska ljudsystemet. Ett exempel på denna första reva i den strikta ljudenligheten är att första stavelsen i ord som banaani [ˈpana:ni] ’banan’ respektive pankki [ˈpaŋkki] ’bank’ låter lika men stavas olika.

Men än så länge kan vi på det stora hela taget lita på att varje finsk bokstav har sitt ljud och varje finskt ljud har sin bokstav.

Generellt är det finska konsonantsystemet mindre invecklat än det svenska. Finskan nöjer sig med konsonanter som har lämpliga bokstäver i det latinska alfabetet. Man slipper till exempel bekymra sig om stavningen av [ʃ]-ljudet, eftersom det inte används i språket.

Ljudenligheten i finskans stavning visar sig också i hur man handskas med skillnaden mellan långa och korta vokaler och konsonanter. Längdskillnaderna utgör ett mycket väsentligt inslag i språkets ljudsystem och deras uttryck i skrift hör till det konstanta i finskans stavning. Man skriver helt enkelt långa ljud med två likadana bokstäver i följd och korta med en enkel bokstav. I taka ’baksida’ visar stavningen att alla ljud är korta, i takka ’öppen spis’ ser man att [k]-ljudet är långt, och av taakkaa ’börda’ framgår att alla ljud utom det första t:et är långa.

Hur man skriver och hur man stavar är högst olika från språk till språk. Hur beter man sig då för att beskriva uttalet hos ord eller fraser så att det blir entydigt och begripligt för alla? Jo, man tillgriper ett alfabet som återger språkljuden på ett entydigt och konsekvent sätt, det vill säga ett alfabet som kommer runt stavningsskillnader som España och Espanha, kneal och Neill samt också uttrycker uttalsskillnader som i svenskans olika betydelser av lova och engelska ord som dear och pear.

Ljudskriften är det enda sättet att i skrift visa på likheter och skillnader mellan uttal i olika språk och dialekter. Och det var något som behövdes då vetenskapliga uttalsstudier (bland annat av svenskans dialekter) tog fart vid slutet av 1800-talet. Eftersom man inte kunde göra ljudupptagningar fick man återge observationerna så noggrant som möjligt med standardiserad fonetisk skrift. Med fonetisk skrift eller fonetisk transkription menar vi helt enkelt en konsekvent ljudenlig skriftlig återgivning av tal.

De flesta talforskare på den internationella scenen tillgriper vid behov numera det så kallade ipa-alfabetet, konstruerat mot slutet av 1800-talet av en grupp franska språklärare, Dhi fonètik tîtcerz’ asóciécon, som ville hjälpa småbarn att lära sig läsa och äldre elever att uttala främmande språk bättre. Senare tillkom den nuvarande benämningen L’association phonétique internationale.

Ipa-alfabetet använder de vanliga latinska bokstäverna kompletterade med grekiska bokstäver, vissa specialsymboler och olika så kallade diakritiska – det vill säga särskiljande – hjälptecken. Exempelvis skrivs det svenska ordet lova ’styra en båt upp mot vinden’ [ˈluːva] med o uttalat som i mos. Ordet lova ’ge ett löfte’ skrivs däremot [ˈlo:va] med o uttalat som i mås; mos och mås transkriberas alltså [mu:s] respektive [mo:s] i enlighet med stavningen i många språk. Ipa-tecknen motsvarar alltså ofta men inte alltid de svenska bokstäverna. Hakparenteserna visar att det rör sig om fonetisk transkription. Det diakritiska kolonet visar att vokalen är lång.

Ipa-symbolerna [u] och [o] ser ut som bekanta bokstäver, men de uttalas alltså annorlunda än man skulle vänta sig med utgångspunkt i svenskan. Ett sådant [u:] låter som svenskans o (som i mos) medan [o:] låter som svenskans å (som i mås). Tecken som [m], [s], [l] och [v] känner vi igen som vanliga latinska bokstäver med förväntade ljudvärden. Exempel på användning av grekiska bokstäver kan man få av [β] – grekiskans beta – som i ipa betecknar en bilabial tonande frikativa, ett ljud som uttalas när läpparna mer eller mindre stänger luftflödet som dessutom passerar en förträngning i talapparaten, som i det spanska ordet abajo [aˈβaxo], ’nedanför’.

”Många tror att språk med mystiska bokstäver är extra svåra att lära sig”

Många tror att språk med mystiska bokstäver – så uppfattas ofta exempelvis ryska och grekiska – är extra svåra att lära sig. Svaret är att det är både rätt och fel. Båda språken kan upplevas som ytterst svåra just när man håller på. Men det beror verkligen inte på bokstäverna! Den svensk som har lust kan lära sig det kyrilliska eller grekiska alfabetet på en kafferast.

Att lära sig dessa alfabet är superenkelt, speciellt när man redan kan ett av dem. Det är ett av de mindre problemen med att närma sig ett främmande språk. (Den logografiska kinesiska skriften är något helt annat – där gäller det att slå i sig flera tusen olika tecken för ett stort antal morfem.)

En del språk, till exempel polska, skulle man kunna tro är ovanligt komplicerade att döma av hur man skriver till exempel person- och ortnamn. Polska namn har vi till exempel i Zbigniew Brzeziński, polskfödd före detta amerikansk diplomat, och Jarosław Kaczyński, politiker. Och titta på polska ortnamn som Szczecin, Łódź och Świnoujście.

Men här handlar det inte om att ljuden skulle vara mer eller mindre omöjliga att uttala utan minst lika mycket om att bokstavskombinationerna och själva bokstäverna med sina streck och prickar ser ovanliga och något skrämmande ut för den som inte är van.

Det är inte helt ovanligt med språk som håller sig med tjogtals kontrasterande ljud. Det kan då bli svårt att hitta lämpliga bokstäver till alla ljud. Till de mera svårartade språken hör de kaukasiska – inte minst nordvästkaukasiska kabardiska med 47–48 konsonantfonem, varav nästan hälften är frikativor, och ubychiska med 84 konsonantfonem. Detta sägs vara världsrekord för språk som saknar klickar. Antalet vokalfonem är mycket litet i båda: enligt uppgift tre i kabardiska och två i ubych.

Ubycherna fördrevs från sina hemtrakter på Svarta havets östkust 1864. De slog sig efter hand ner i Turkiet. Ubychiska språket dog ut med sin siste talare, Tevfik Esenç, den 7 oktober 1992. Kabardiska har ungefär 650 000 talare. Det är huvudsakligen ett nordvästkaukasiskt språk, men talas också på andra håll i världen. Det har skrivits med både latinskt och kyrilliskt alfabet.

Konsonanterna är så många att bokstäverna inte räcker till. Somliga måste skrivas med bokstavskombinationer, i vissa fall med så många som fyra bokstäver. Här är ett exempel på kabardisk text, translittererad från kyrilliska alfabetet. Det är början av FN:s deklaration om de mänskliga rättigheterna:

Clyxu psori ščx’èxuitu, ja ščlyx’ymrè ja xuèfaščèхèmrèklè zèxuèdèu k”al”xur.

Som minst lika komplicerat framstår !xóõ (eller ǃkhong) i Botswana och Namibia. Av dess långt över hundra fonem är de flesta konsonanter, varav över hälften så kallade klickar. (Enligt uppgift har !xóõ cirka 4 000 talare i Botswana och ett par hundra i Namibia.) Klickarna bildas som ett slags ”smackljud”, men på olika ställen i munnen. De har en egenartat exklusiv utbredning i södra Afrika och härrör ursprungligen från xhoisanspråken, till exempel nama och !xóõ. Dessa språk har klickar i de flesta ord men har också många andra konsonanter.

Stavningen av !xóõ är ett av många exempel på de krångligheter som man måste hålla reda på i detta språk: Det som ser ut som ett utropstecken betecknar själva klickljudet som produceras med tungspetsen mot tandvallen. Själva klicken åtföljs av den tonlösa frikativan [χ], som bildas längst bak i munnen. Detta ljud kallas ett ”ackompanjemang”. !xóõ är ett ytterst invecklat språk som saknar skrift. I ett annat språk i regionen – även det tämligen komplicerat – har man dock lyckats med att skapa en skrift: det namibiska nationalspråket nama eller, med en annan term, khoekhoe. Språket talas av ett par hundratusen människor och är det mest spridda av de icke-bantuspråk i södra Afrika som excellerar i klickljud.

”Konsonanterna är så många att bokstäverna inte räcker till”

Nama har 31 konsonanter, varav 20 är klickar och bara 11 icke-klickar. Det är ett utbildningsspråk upp till akademisk nivå. Som sådant måste det självfallet ha en skrift. Namaskriften uttrycker fem orala och fem nasala vokaler (de senare markerade med tilde, alltså ~). Här representerar ǀ, ǃ, ǂ och ǁ olika klickljud (den sista ser ut som en tät följd av två ǀ):

Ob gye ǃũi-aoba ǁkhōse ǂkon ǂoms ãba xu ǂkei-ǂkeihe, tsĩ gye ǁgao tsĩb gye ǁeixa hãse uri-khài tsĩ beiraba gye ǃkhō, tsĩ ǁnāba gye ǀgūse mã i tsouï ǃna gye ǀnami-ǁna bi.

(’På så vis blev herden häftigt väckt ur sin sömn. Han reste sig ilsket, tog tag i baggen och kastade honom i en närbelägen brunn.’)

En del bantuspråk har i flera hundra år – som följd av bantufolkens utbredning över Afrika – talats parallellt med de traditionella klickspråken i södra Afrika. De har under tiden påverkats av de traditionella klickspråken, bland annat genom att de har tagit in klickar i sitt ljudförråd. Bland de större av dessa språk kan vi märka xhosa, Nelson Mandelas modersmål (med omkring nio miljoner talare i Sydafrika och Zimbabwe). En beräkning har gett vid handen att uppemot 10 procent av alla de vanliga orden på xhosa innehåller ett klickljud. Den väsentliga skillnaden mellan stora och små fonemsystem ligger som sagt i konsonantförråden. Små system har få konsonanter, stora system har många.

Olle Engstrand är professor emeritus i fonetik vid Stockholms universitet.

Artikeln är ett bearbetat utdrag ur boken Skriften – vår bästa uppfinning (Morfem 2023).