Tre lag samlar all världens skrift

I världen finns flera hundra sätt att skriva – och de blandas gärna. I Japan kan till exempel upp till fyra skriftsystem samsas i samma text. Men vid en närmare granskning ser man att alla system bygger på några få enkla principer.

Text: Lars Melin

Numera upplever vi ofta världen som en elektronisk by, där internet knyter samman allt skrivande – och där engelska är allas gemensamma språk. Men det finns en miljard indier med åtminstone ett tjog alfabet, nästan en och en halv miljard kineser med tusentals tecken och nästan en miljard som skriver med arabiska alfabet. Därutöver finns skriftsystem med ”färre” användare, som japanska, grekiska, kyrilliska, koreanska, tibetanska, thai och så vidare.

Skriften uppvisar alltså en fortfarande fascinerande mångfald av tecken, bruk och till och med skrivdon.

Men allt är inte mångfald. Våra arabiska siffror finns till exempel överallt – utom just i arabiska länder. Och framför allt skulle globaliseringen inte vara möjlig om vi inte kunde kommunicera med varandra över hela globen.

Gemensamt för all kommunikation via internet och mobilnät är ett system som kallas Unicode. Det håller ordning på skrivtecken från världens alla hörn.

Unicode erbjuder verkligen mångfald när det administrerar mer än 100 000 olika tecken från världens skriftsystem. Vid en närmare titt ser man ändå att allt detta faktiskt bygger på tre enkla principer – som dock kan blandas ganska friskt. Vi tar ett exempel från Stockholms fotbollsklubbar:

  1. AIK, uttalas ”a i kå”, alltså varje tecken uttalas för sig, som tre stavelser
  2. DIF, uttalas ”dif”, alltså tecknen står vart och ett för ljud som kan läsas ihop till ett ord
  3. uttalas ”Bajen” eller ”Hammarby”, alltså en logga som kan utläsas som ett ord.

Sämjan mellan lagen och deras supportrar är inte den bästa, och det beror kanske på att de har valt olika skrivprinciper. AIK föredrar stavelseskrift, alltså ett system där varje tecken motsvarar en stavelse. DIF låter varje tecken svara mot ett fonem – ett språkljud – och dessa kan läsas samman till ett ord. Hammarby använder en bild, här en logga, som står för en betydelse, och det är inte så kinkigt om loggan uttalas ”Bajen” eller ”Hammarby”.

Varje skriftsystem i världen har valt en av dessa överordnade principer: stavelse, fonem eller betydelse – men alltid med inslag av de andra. I väst har vi satsat på fonem, kineserna till stor del på betydelser. I Indien lutar man åt stavelser.

Den som blickar ner på sitt tangentbord ser ett myller av tecken: bokstäver som A, B, C, siffror som 1, 2, 3 och symboler som %, &, =. Men vi kan också slå ackord. Om jag på min dator slår Alt+E får jag fram € och slår jag Alt+Gr+2 får jag fram @. Vi drunknar i tecken!

Titta nu tillbaka på den sista meningen: ”Vi drunknar i tecken!” Bara i den finns exempel på vad våra skrivtecken används till – våra tre principer för skrift kan brukas för tre funktioner:

  1. Symboler, framför allt kombinationer av symboler, skapar betydelse: vi betyder något, liksom drunknar, i och tecken.
  2. Avgränsare skapar struktur i texten. Versalen i Vi talar om att en mening börjar, mellanslagen skiljer orden åt och utropstecknet signalerar meningsslut. Allt sådant som punkt, komma, radbrytning, parenteser och liknande är avgränsare.
  3. Emoglyfer signalerar författarhumör. Utropstecknet står inte bara för meningsslut, utan framför allt för författarens attityd (i det här fallet min uppsluppna glädje). Frågetecken kan användas på samma sätt, liksom VERSALER och framför allt smileys och emojier.

Det kunde vara enkelt, men det blir bara mer och mer komplicerat.

Den minsta enheten i språket som betyder något kallas morfem. Exempel på morfem är skrift och språk (se även Språktidningen 8/2016). Ord består i regel av flera morfem, antingen därför att de är sammansatta: skriftspråk (bildat av morfemen skrift och språk), böjda: skriften (bildat av morfemen skrift och -en) eller avledda till annan ordklass: skriftlig (bildat av morfemen skrift och -lig). Att skriva med morfem som grund låter kanske opraktiskt, men vartenda svenskt tangentbord har morfemtecken: %, &, $, siffror och matematiska tecken. Vi kan till och med bilda sammansatta ord med dem: 5-%-ig och $-kurs.

Den närmast uråldriga kinesiska skriften har hur många tecken, hanzi, som helst, men för all normal verksamhet räcker ett par tusen. Det låter kanske litet, men med tanke på att tecknen står för morfem, inte för ord, är det väl tilltaget. Observera att kineserna inte har bildskrift; deras tecken är konventionaliserade symboler, precis som våra morfemtecken & och =.

Ett dominerande land som Kina har förstås påverkat många andra nationer och språk i närheten, bland andra Vietnam, Korea och Japan. Men den morfematiska principen blir faktiskt allt vanligare också väster om Kina. Vi har morfemtecken som trafikskyltar, ikoner på reglagen till våra hushållsmaskiner och inte minst på våra telefoner och datorer. En normalsvensk kan automatiskt avkoda flera hundra morfematiska tecken – en datanörd kanske mellan tusen och tvåtusen.

Mest grundläggande för vår språkuppfattning är stavelsen. Nästan alla som kan tala ett språk kan dela in det i stavelser, och gör det också vid till exempel sång, ramsor, dikter och rappande. Däremot är det bara läs- och skrivkunniga som kan dela in ord i enskilda språkljud. Stavelsen är viktig för det är den som är kort, lång, betonad eller har en viss accent. Eftersom stavelsen är mer lättåtkomlig för analys än både ord och språkljud har alla skriftsystem som baseras på språkljud en gång utvecklats ur stavelseskrift, alltså en skrift där varje tecken motsvarar en stavelse. Kinesiskan är en stavelseskrift på det sättet att varje tecken motsvarar en stavelse – och varje stavelse motsvarar i sin tur ett morfem.

Men utvecklingen kan gå åt andra hållet också. I vår tid börjar vi få nya inslag av stavelseskrift. Förkortningar som tv, pc och usb är stavelseskrift. Man säger ”u ess be” – inte universal serial bus. De flesta vet ju inte, eller ägnar åtminstone sällan en tanke åt, vad förkortningarna står för. Alltså stavar vi med ett tecken per stavelse. Men det gäller inte generellt. SJ är, liksom AIK, stavelseskrift eftersom det uttalas ”essji”, men SAS är fonematisk skrift eftersom det oftast uttalas ”sass”.

Stavelseskrift passar bäst för språk med ett litet antal stavelsetyper, som i nämnda kinesiska. Det gäller även japanska, som har lite drygt hundra olika stavelser. Men stavelseskrift passar utomordentligt illa för ett språk som svenskan, som har fler stavelser än någon orkat räkna.

De flesta indiska språk ligger nära stavelseprincipen. Normalt växer ett tecken fram med ett konsonanttecken som grund. Det tecknet kan byggas ut med tillägg för andra konsonanter och en vokal. Det finns inte mindre än 160 tecken för konsonantkombinationer – och därtill kombinationer med vokaltecken.

Den indiska skriften devanagari har efterliknats av flera asiatiska språk, bland annat thai och khmer.

Den för svenskar mest välbekanta principen för att överföra det talade språket till skrivet är den fonematiska. Fonem definieras som de språkljud som gör att ett ord skiljer sig från ett annat i betydelse. Ljuden för b och p är olika fonem, eftersom de skiljer bil från pil. I idealfallet innebär den fonematiska skrivprincipen att varje fonem motsvaras av ett skrivtecken. Finska och italienska ligger nära idealet, medan engelska är exempel på motsatsen. I engelska kan till exempel bokstavskombinationen ough uttalas på fyra olika sätt: i ordet though uttalas den ungefär ”ou”, i ordet tough uttalas den som ”af”, i ordet through uttalas den som ”uw” och i cough uttalas den som ”åf”.

De flesta språk har mellan två och fyra dussin fonem, men de är inte alltid samma. På svenska uppfattas alla r-ljud som samma fonem oavsett hur de uttalas, skorrande eller rullande, och alla l-ljud uppfattas som samma fonem, tjocka eller ej. Men i stora delar av Asien uppfattas r- och l-ljud som samma fonem.

I princip håller fonematisk skrift nere antalet tecken, men bara i princip. För att många språk ska kunna samsas om samma teckenuppsättning får tecknen lite olika uttal i olika språk. Och de får också lite olika ”utsmyckning”, så kallade diakritiska tecken. Vi nordbor sätter ut prickar och ringar över o och a, fransmän firar orgier i accenttecken och österut använder man bland annat snedstreck över staplar. Så det är lite si och så med den inbördes läsbarheten för alla de språk som använder latinska bokstäver. Men Unicode håller koll.

En del västerlänningar tror att alla som skriver fonematiskt har nått utvecklingskulmen. Men man kan gå ett steg längre, och låta tecknens utseende spegla hur fonemen bildas när man talar. Det betyder att vokaler ser ut på ett sätt och konsonanter på ett annat. Och konsonanter som bildas med läpparna får se annorlunda ut jämfört med dem som bildas mot gommen. Väsljud, som s, skiljs från stoppljud, som k, p och t. Det finns ett enda språk som odlar denna sofistikerade princip för konsonantavbildning: den koreanska skriften hangul.

Varje tecken i hangul betecknar en stavelse som byggs upp av små fonemtecken, som i sin tur är byggda på hur ljuden bildas i munnen (läpprundning, uttal mot tandraden och så vidare). Men detta gäller alltså konsonanterna. Vokalerna, å sin sida, representerar österländsk yin- och yang-filosofi. Tre grundvokaler – symboler för himmel, jord och människa – sätts samman till ytterligare åtta vokaler.

Det låter invecklat, men koreanerna själva säger att en begåvad person lär sig hangul på en förmiddag, medan en dumskalle behöver en hel vecka. Språkforskare brukar stå stumma av beundran. Koreanerna vet också att värdesätta sitt skriftsystem, så i både Syd- och Nordkorea firar man varje år hanguldagen, den 9 oktober.

Skriftspråkens sextusenåriga utveckling startar med bildskrift, går över stavelseskrift (viss kilskrift) till fonematisk skrift (fenicierna var först för drygt 3 000 år sedan). Men skrift handlar bara om att återge tal, eller – annorlunda uttryckt – att på en yta återge de ord som sedan tidernas begynnelse bara var vibrerande luftmolekyler.

Det dröjde ända fram till 800-talet innan Karl den stores hovgrammatiker Alkuin av York grep sig an strukturen och gjorde avgränsare till standard. Det blev en sådan framgång att skiljetecken, mellanslag, citattecken med mera spreds till flertalet skriftsystem i världen.

I och för sig har skribenter alltid kunnat hitta medel att uttrycka sina känslor med tecken, till exempel understrykningar, STORA TECKEN och figurer som ♥, men man brukar mena att 1980-talets chattkultur blev startskottet för en ny standard: så kallade smileys. I det snabba replikutbytet på nätet försökte man undvika missförstånd. Ett bistert meddelande kunde mildras med en leende gubbe, och en neutral mening kunde skärpas till med en missnöjd gubbe. Dessa två tecken spreds till så gott som alla texter:

:-)

:-(

Det fanns väsentligt fler, men just dessa två blev så vanliga att Word lade in teckenkombinationer för autokorrigering – det blev runda ansikten med miner och allt:

Det fanns alltså ett behov av att uttrycka känslor, och behovet kommersialiserades av japanska mobiltelefonoperatören NTT Docomo. Under 1990-talet lade företaget in nya, färggladare, mer detaljerade och framför allt mer nyanserade figurer: emojier, i sina smartphones.

Att japanerna införde de många emoji-tecknen är kanske inte så konstigt. De handskades redan med fyra skriftsystem, så ett till skulle inte göra så stor skillnad.

Traditionellt skrev japanerna med skrivtecken som de lånat från den stora grannen i väst. Och fortfarande använder de kinesiska tecken, som de kallar för kanji, för ett par tusen innehållsord – alltså ord som är betydelsetunga. Men parallellt finns två stavelseskrifter – hiragana och katakana – om vardera 46 tecken plus två diakritiska tecken. De två stavelseskrifterna kallas med en gemensam term för kana. De flesta japanska ord kan alltså skrivas på tre sätt, men i praktiken skrivs innehållsord med kanji medan kana används för ändelser respektive icke-kinesiska lånord. Dessutom används inte så få latinska bokstäver – eller rōmaji på japanska. Företaget Canon kan till exempel bara stavas just Canon.

Japansk skrift är med råge världens krångligaste, men kanske är andra skriftsystem ändå på väg åt det hållet. I den skriftsmältdegel som skapas i vår globala by måste det komma fler och fler lån, fler och fler hybrider och mer och mer blandning. Japan har visat mer kulturell öppenhet än de flesta andra länder – åtminstone när det gäller skriftsystemet.

I en vanlig japansk tidningsartikel kan vi se en dominans av kinesiska tecken, rikligt med kana, många arabiska siffror och vissa inslag av latinska bokstäver för västerländska företags- och personnamn. Allt detta har elegant hamrats fram på en persondator som ser ut som min egen, men som dels kan omtolka fonetisk skrift till tecken, dels har ett virtuellt tangentbord för kanatecken. Och det var alltså japanerna som uppfann emojier.

Japansk skrift är onekligen besvärlig – men sant multikulturell. Är det dags att göra sig beredd på att detta kan bli en av globaliseringens följder? Alla vet vi ju att världens centrum förskjuts mot Stillahavsregionen – och med det kommer kanske också skriften.

Lars Melin är docent i svenska vid Stockholms universitet och populärvetenskaplig författare, till exempel med boken Människan och skriften, Norstedts (2000).

Fakta

Unicode
När datorerna var unga fanns den så kallade ASCII-koden, som kunde hantera max 128 tecken (bokstäver, siffror, symboler; det vill säga i princip det som fanns på ett engelskt tangentbord). När man ville att datorerna skulle kunna hantera fler tecken, till exempel å, ä och ö, växte alternativen ut, och det fanns hundratals utbyggda ASCII-varianter. På 1980-talet började Apple och Xerox samarbeta om en kod för alla tecken, med varianter som gemener och versaler. Det blev Unicode, som var färdigutvecklat i slutet av 1990-talet, och som numera är ISO-standard. Unicode administrerar för närvarande över 100 000 tecken, inklusive emojier.

篱 kinesiskt skriftspråk  
Detta tecken ser ut som en gärdesgård, och det är precis vad det betyder. Tittar man noga ser man två tecken i tecknet. Det första, som ligger ovanför det vågräta strecket, är 竹, som betyder ’bambu’. Det ger en vink om betydelsen, för i Kina är vissa staket gjorda av bambu.

Bambutecknet är en så kallad radikal, som ingår i det mesta som har med trä och träd att göra. Det finns 214 sådana radikaler.

Den nedre delen, 离, uttalas och används i betydelsen ’skiljas åt’. Det tecknet står där för att markera uttalet av hela tecknet – ett så kallat fonetikum. Och hela tecknet uttalas alltså .

Men i det här fallet kan den ljudangivande delen också associeras med betydelsen, eftersom ett staket just ”skiljer åt”.

Att bygga en indisk stavelse
Så här skulle det svenska ordet ’bra’ skrivas med den indiska skriften devanagari. Vi ser ett b-tecken (vinkeln med den lilla cirkeln), men det pyttelilla strecket som sticker av snett ner åt vänster är ett r. Men var är a:et? Det behövs inte. Skriver man inte ut någon annan vokal läser vi a. I Indien snickrar man alltså stavelser. Andra vokaler än a skrivs som små tilläggstecken – såvida de inte är egen stavelse, för då finns det ”fulltecken”.

한글 världens smartaste skrift?
Så här skriver koreanerna ordet hangul, namnet på den koreanska skriften, världens kanske smartaste. De två tecknen representerar två stavelser. En stavelse byggs delvis upp av avbildningar för hur ett språkljud skapas fysiskt. I det första tecknet ser vi en ring som symboliserar struphuvudet – där ju språkljudet h blir till. Den lilla haken underst visar tungans ställning mot tandkanten vid uttalet av n. Det lodräta tecknet till höger representerar vokalen a. Vokaler skrivs alltid med raka streck med diverse tillägg.

العربية Varför vokaler?
Här står det ’arabiska’ på arabiska. Eller snarare ’rabsk’, för i rabsk skrivr mn nte ut krt vkalr. D går fktskt lik bra utn krta vkalr. Vokaler har helt enkelt lägre informationsvärde än konsonanter eftersom de är färre till antalet, och korta vokaler i ändelser är mycket förutsägbara.

Ett urval emoglyfer
Detta är kul. Hahaha!
Detta är kul. LOL
Detta är kul. :-)
Detta är kul.

Världens skriftspråk

Det finns flera hundra skriftsystem – om man tar med allt från lönnrunor till streckkoder – och ännu fler om man räknar med alla varianter. Vill man räkna mycket snålt blir det däremot bara fyra: grekiska, kinesiska, semitiska och indiska. Alla hanterar tre grundprinciper för tre funktioner, men de blandar principerna olika. 

Grekiska

Latin: Lars
Grekiska: Ʌαρς
Kyrilliska: Ларс
Runor:

Kommentar: Tecken kan förvrängas rejält med tid och avstånd. Det enda gemensamma för L:en till exempel är att det är en vinkel (som slarvats bort i kyrilliskan).

Utbredning: Europa med flertalet gamla kolonier.

Kännetecken: från vänster till höger, fonematiskt, stora och små bokstäver, ej sammanskrivna tecken.

Ålder: Först på plan var feniciskan, och äldst av nu levande skriftsystem är grekiskan med drygt tre millennier på nacken.

Kinesiska

Hanzi: ’Beijing’ 北京
Kanji: ’Tokyo’     東京

Kommentar: Två huvudstäder i öster med olika uttal och språk. Men tecknen är märkligt lika, för Beijing betyder ’den norra huvudstaden’, och Tokyo ’den östra huvudstaden’. I båda fallen står det första tecknet (hanzi på kinesiska och kanji på japanska) för väderstreck, och det andra för huvudstad. Detta är ett av tusentals teckenlån i japanskan.

Utbredning: Fastlandskina, Taiwan, Japan och – tidigare – Vietnam och Korea.

Ålder: De äldsta kinesiska tecknen har en historia som går mer än 3 000 år tillbaka i tiden.

Kännetecken: Huvudsakligen kvadratiska ytor med många detaljer som bildar morfem.

Semitiska

Hebreiska Tel Aviv-Jaffa (uttalas Tal Aviv-Yafo) תֵּל־אָבִי
Arabiska Tel Aviv-Jaffa (uttalas Tal Abīb-Yāfā) تَلْ أَبِيبْ-يَافَا

Kommentar: Det finns ingenting annat än den underliggande strukturen som förenar hebreiska och arabiska.

Utbredning: Hebreiska är officiellt språk i Israel. Arabisk skrift finns, förutom i arabiska länder, över stora delar av den muslimska världen, till exempel i Iran, för persiska, och i Pakistan, för urdu.

Kännetecken: fonematiskt, från höger till vänster, ingen skillnad mellan stora och små bokstäver, ofta olika tecken för placering i början, mitten och slutet av ord. Hebreiska är i princip kvadratiskt med separata tecken medan arabiskan är kursiv. Korta vokaler skrivs normalt inte ut.

Ålder: Hebreisk skrift går minst 2 500 år tillbaka i tiden, och arabisk skrift är cirka 1 500 år gammal.

Indiska

Hindi: ’Buddha’  बुद्धा

Kommentar: Tecknen hängs på en linje. Från vänster till höger ett d-tecken med en släng som markerar vokalen, därefter ett dh-tecken och så tecken för ordslut.

Utbredning: Indien och österut: tibetanska, khmer i Kambodja, thai, javanesiska och burmesiska.

Kännetecken: Centrum är konsonanter som kan byggas ut till grupper av konsonanter.

Ålder: Skriften utvecklades av paninigrammatikerna på 300-talet f.Kr.