Så föddes vårt vassaste verktyg

Språket är människans bästa uppfinning. Trots att det har gått flera tusen år finns det ännu inget som är lika användbart. 

Text: Lars Melin

Vad är det smartaste som vi människor gjort? Google? Ångmaskinen? Hjulet? Nej, knappast. Det är språket, och utan språket hade vi nog inte haft vare sig hjul eller Google. Språket uppstod för minst 50 000 år sedan, kanske dubbelt upp eller ännu mer. Så smarta är vi inte i dag. Det var alltså bättre förr, så låt oss se hur det gick till.

Homo sapiens hade graderat upp hjärnvolymen och fått en hjärnbark med imponerande prestanda. Detta betydde nya utmaningar, men något måste ordnas först. Civilisationen utvecklades i myrsteg, så länge det inte fanns möjligheter att prata om saker och ting. Man saknade helt enkelt ett språk.

Det var en stor uppgift som krävde snabba och omfattande åtgärder. I efterskott skulle man tala om detta som en disruptive innovation, en uppfinning som ändrade på allt, och gjorde att ingenting blev sig riktigt likt längre. De flesta menar att det var språket som förvandlade en flock till ett samhälle. Men ett så stort steg kunde inte forceras fram. Nej, på savannen gjorde man saker metodiskt, så man började med en kravspecifikation. Den här:

 1. Man eftersträvade ett multi-purpose-språk, det vill säga språket skulle kunna användas till allt. Viktigast var kallprat och skvaller, men roliga historier och skryt var också viktigt. Man höll också öppet för att kunna berätta stammens ärorika historia och meddela viktiga sakupplysningar. Jo visst, planering också.
 2. Språket skulle vara ett öppet system. Allt skulle kunna sägas, även det som inte fanns då och där, och kanske över huvud taget inte kan finnas alls. Ljuga ingick ju i multi-purpose och för detta måste man kunna frigöra en hel del skapande fantasikraft.
 3. Man skulle ha maximal flexibilitet för parallellprocessande, till exempel måste man kunna slipa stenyxor och prata samtidigt. Och man ville ha en 7/24-lösning så man kunde prata även i den mörka afrikanska natten.
 4. Språket skulle vara robust mot störningar och fungera även när det var mycket trummor och skrål vid minglandet kring lägerelden.
 5. Antal användare skulle maximeras. Även dårar och barn skulle kunna prata.

Uppgiften var så gigantisk att utvecklingsarbetet lades ut på flera grupper. En grupp fysiologer fick jobba med rena hårdvarufrågor, en grupp systemerare fick jobba med strukturfrågor och en grupp informatiker fick hålla koll på systemekonomi och användargränssnitt. Dessutom fanns en hemlig grupp. Mer om den senare (men den var hemlig, så tro inte att du får veta något).

Fysiologerna hade en tung start. Kravet på användarflexibilitet gjorde att allt vinkande, blinkande och dansande var uteslutet. De började i stället med en användarundersökning. Det visade sig att alla, utan undantag, andades ut flera gånger per minut. Att det handlade om klimatfarlig koldioxid kunde man inte göra mycket åt, men man kunde kanske dra nytta av själva utandningen.

Experiment visade att utandningsluften kunde få stämbanden att vibrera och alstra en grundton. Munhålan kunde användas som resonanslåda och variera tonen inom ett spann på några tusen svängningar i sekunden (kHz). Det räckte för en handfull läten, max ett dussin. Ville man ha ännu fler fick man stänga för det fria koldioxidflödet, och det kunde man göra med läppar, tänder och tunga på olika ställen och få fram väsningar, dallringar, puffar och liknande.

Det här var rena straffsparksläget. Man kunde växla mellan fritt utblås och förträngningar, precis som morsekodens kort/lång eller datorernas etta/nolla. Men bonusen var att man hade fem eller tio olika tonhöjder på fritt utblås – det som vi sentida ättlingar kallar vokaler – och minst dubbelt så många sätt att begränsa utblåset – konsonanterna.

High five – fysiologerna hade fixat fonemen, de betydelseskiljande språkljuden. De jämförde sig stolt med andra arter som levde ett torftigare kommunikativt liv. I djurens värld var systemet enkelt: katten sa väs om den ville signalera dåligt humör och den spann när den var på gott humör. Fysiologerna hade kommit längre och serverade allt på silverbricka till de andra grupperna som skulle jobba vidare med språkprojektet.

Systemfolket som tog över var dock måttligt imponerade. Hur skulle man kunna göra ett öppet system, det vill säga ett system som kunde säga allt, och ett multi-purpose-system, det vill säga ett system som skulle kunna användas till det mesta, om man bara hade några dussin läten? Man kunde inte ens prata om vädret med så få läten. Försökte man göra fler blev ljuden för lika varandra och det öppnade för förväxlingar och missförstånd.

Systemerarna fick inte en, utan två snilleblixtar:

Kodning var det ena nyckelordet. Ett fonem betyder ingenting i sig; det får sin betydelse i kombination med andra fonem. Men kombinationerna kunde bli rejält många. Ett ensamt j betyder ingenting, men ja betyder ’tummen upp’, jak är ett djur, jakt är det som bryter ut om man får syn på en jak och så vidare. Moderna grammatiker kallar detta snilledrag för den dubbla artikulationen. Det bara heter så, fastän vi inte förstår vad som är dubbelt och inte heller vad det hela har med artikulation att göra. En av få nackdelar med språket är att termer sällan blir helt rätt.

Men det riktigt smarta var att ordna fonemen i en naturlig växling mellan öppet utblås och förträngningar eller stängd luftpassage: stängt–öppet–stängt (eller konsonant–vokal–konsonant). Och inte nog med det. Man kunde hänga flera konsonanter på samma vokal, bara man ordnade dem så att konsonanterna blev mer och mer öppna ju närmare vokalen de kommer. Konsonanterna får alltså spegelvänd ordning till vänster och till höger om vokalen:

BRöd – böRD

KRäm – baRK

KLämma – vaLK

Den spegelvända ordningen kändes bra, så den användes också för andra konsonanter än de klangfulla, främst s och t:

STen – speTS

SPela – viPS

Med dessa regler kunde man ordna precis hur många kombinationer, det vill säga ord, som helst. Bara de få stavelsetyper som anges här ovan ger över en miljon kombinationsmöjligheter. Systemfolket kände att de hade flyt.

Men eftersom man höll på och kombinerade kunde man lika gärna få till en bonus: kategorinamn. Om man hade fyra konkreta ord som mamma, pappa, bror och syster kunde man få till fyra nya ord. Pappa och bror bildade kategorin farbröder, och mamma och syster kategorin tanter, bror och syster bildade kategorin barn, och mamma och pappa bildade kategorin föräldrar. Okej, man kunde se skillnad på tanter och farbröder tidigare också (annars hade det knappast blivit någon Homo sapiens), men nu kunde man släppa loss och använda själva orden till att sortera upp tillvaron på alla upptänkliga sätt. Och ljudkombinationerna räckte garanterat till.

Funktioner var det andra snilledraget. Orden skulle inte bara betyda något, de skulle också fungera tillsammans med andra ord. Alltså började man kombinera ord på samma sätt som man hade kombinerat ljud. Och kombinationer kan kombineras till kombinationskombinationer och dessa till kombinationskombinationskombinationer. Nej, nu började det snurra – till och med i systemerarnas huvuden. Man behövde en manual, en grammatik helt enkelt. Så från och med då fick man jobba med två projekt: orden och reglerna. Och fortfarande har vi två böcker på hyllan – och två system i hjärnan: lexikon och grammatik.

De som jobbade med lexikon svor en högtidlig ed om Det Arbiträra Tecknet. Detta betydde att ett ords uttal inte hade ett skvatt med betydelsen att göra. Ett exempel är att den ljudföljd som för en folkgrupp betydde till exempel djuret lo, kunde betyda toalett för en annan (fastän den gruppen senare kom att stava det loo). För en tredje grupp betydde ljudföljden i stället hyr ut (senare stavat loue).

Vissa, framför allt serietecknare, har brutit mot regeln om Det Arbiträra Tecknet, med ord som bang, slasch och boom, vars uttal påminner om det orden betecknar. Men regeln om Det Arbiträra Tecknet hålls fortfarande helig i Lingvisttemplet.

I grammatiken kan man läsa om hur orden fungerar tillsammans. Till en början räckte det med tre funktioner:

 1. samordning: hövding och medicinman betyder detsamma som medicinman och hövding. Båda orden är lika viktiga och vi talar om två samordnade led.
 2. underordning: hövdingens hydda betyder något annat än hyddans hövding. Det ena ordet är underordnat det andra och ger lite bonusinformation. Med underordning kan man sedan göra nästan allt viktigt i språket, lägga till attribut, sätta in objekt, rada upp adverb skapa bisatsflätor. Ja, nästan allt.
 3. satskärna (som i vår moderna tid heter nexus) är sambandet mellan subjekt och predikat: hövdingen bestämmer. Och detta samband är navet i nästan alla meningar i alla kända språk.
  Men systemerarna hade inte varit systemerare om de inte kommit på en fjärde funktion:
 4. rekursivitetsregeln: alla regler kan upprepas: hövdingens hyddas ingångs vaktposter; gnu med sås med vitlök från grannbyn på savannen; hövdingen och medicinmannen och jägaren och lägereldsvakten och språksystemeraren

Funktionerna signalerar man med småord, ändelser och – inte minst – ordning mellan olika slags led. Och ordningen kan gälla på olika nivåer:

våning 1, grundplanet: ko betyder något annat än ok

våning 2, ordledsnivån: huvudjägare betyder något annat än jägarhuvud

våning 3 satsnivån: vi jagar betyder något annat än jagar vi

Det går att få fler våningar om man vill. Systemerare fixar allt.

Som alltid skapade systemerarna fler möjligheter än någon kan greppa, speciellt när de lade in en randomizer, en slumpgenerator, som öppnade för språkliga varianter: språkgrupper, dialekter, sociolekter, gruppjargong och så vidare.

Nu gällde det att låta informatikerna gå andra vägen: vägen mot ekonomi och standard.

Informatikerna hade två krav som gick på kollisionskurs. Å ena sidan ville man ha ett så enkelt och bekvämt system som möjligt. Enkelt för talaren. Å andra sidan ville man ha ett så robust system som möjligt. Robust för lyssnaren. Gick man för långt åt ena hållet och gjorde systemet för bekvämt, förstod lyssnarna ingenting. Och gick man för långt åt andra hållet fick talarna det för jobbigt.

En ganska självklar utgångspunkt var att låta Zipfs lag styra: de vanligaste orden skulle vara kortast. Och praktiskt taget alla språk håller fortfarande stenhårt på principen, även om det är tveksamt om George Kingsley Zipf (1902–50) någonsin bodde på savannen. I en text eller ett yttrande ska 50 procent av orden bara ha en stavelse, 25 procent ska ha två stavelser, 12 procent ska vara på tre stavelser och så vidare.

Zipf skrev också en andra lag som påbjöd starkt sjunkande ordfrekvenser. Det vanligaste ordet är alltså rejält mycket vanligare än de näst vanligaste (ofta dubbelt upp) och det ordet är rejält mycket vanligare än trean på topplistan och så vidare. ”Aha, en logaritmisk fördelning!” utropade man på savannen. Ja, det kunde man faktiskt utropa, för den betaversion av språket man utropade med hade en sådan multi-purpose-kapacitet att den tillät glädjeyttringar. Och det öppna systemet inte bara tillät, utan uppmuntrade nya tankar på matematiska modeller som ingen dittills hört talas om på savannen.

Jättesmart! Och efter minst 50 000 år är det fortfarande ingen som har kommit på något bättre.

Men så har vi det lilla problemet att språket ska vara robust mot störningar. Det behövdes massor med överflödsinformation, så att man inte behöver höra vartenda ord för att förstå vad det handlar om. I vår sentida kultur är överflödsinformation en självklarhet. Tänk på trafiksignaler: Rött betyder ’stopp!’, gult betyder ’accelerera!’, grönt betyder ’kör på!’. Men det skulle egentligen inte behövas några färger. Lampan högst upp betyder ju alltid ’stopp!’, mellanlampan ’accelerera!’ och nedersta lampan ’kör på!’. Röd lampa överst betyder att vi säger stopp! på två sätt samtidigt, både med färg och placering. Egentligen, menade informatikerna på savannen, skulle trafiksignalen kunna skicka nio olika meddelande genom att kombinera tre färger med tre positioner, men så utnyttjar den bara tre. Tvåhundra procents överflödsinformation låter slösaktigt, men det är ungefär detsamma som språket kring lägerelden ligger på. Man behöver bara uppfatta ett av tre språkljud, eller en av tre stavelser för att förstå ganska bra. Redundansen, ett finare ord för ’överflödsinformation’, är inte fullt så hög för skriftspråk, men visst klarar du det här:

Man behöver inte se hela raden.

Inte överdelen heller.

Redundansen gör att vi förstår tal även i stökiga miljöer och kan läsa de knepigaste handstilar.

Så en sund kombination av Zipfs språkekonomi och den överflödande redundansen gör att språk faktiskt fungerar. Men tacka för det, med tanke på allt jobb de tre arbetsgrupperna har lagt ner på projektet.

Men den hemliga gruppen då? Vi vet inte hur de gjorde, bara att de lyckades få små barn att tala långt innan de hade något vettigt att säga. Några tror att den här gruppen genmanipulerade de små raringarna, alltså satte in genen FOXP2 i kromosom nummer 7. Andra tror att det handlade om hjärnkirurgi, det vill säga att man opererade in en LAD, language acquisition device, ’språkutvecklingsenhet’, någonstans i hjärnan. En tredje grupp tror att det handlade om social ingenjörskonst i bushen. Vi vet faktiskt inte, men efter hiskligt många generationer fungerar det fortfarande. Det enda vi vet är att barnspråkskonferenser skulle bli bra mycket tråkigare om vi en dag får öppna savanngängets X-files och se vad den hemliga gruppen faktiskt gjorde med barnen.

Vi vet inte när språket uppfanns, inte heller om det hände en gång eller om det fanns flera urspråk. Vi vet inte ens i vilket av savannens många hörn det ägde rum eller hur lång tid det tog. Men vi vet två saker. Det gick till precis exakt så som jag beskrivit det, för så här fungerar alla språk i hela världen. Och det är det smartaste vi gjort hittills. Vad vore Språktidningen utan en disruptive innovation på savannen?

Lars Melin är docent i svenska vid Stockholms universitet och populärvetenskaplig författare, senast med Money talks (Morfem 2013).

Några alternativa teorier om språkets födelse

1. Den götiska skolan: Språket var helt klart för användning när gubben Noaks sonson Magog fick landkänning med arken, gick i land på Kinekulle och började tala västgötska, som är världens urspråk.

2. Akut behov-teorierna: Språket växte fram ur ett visst behov – alltså raka motsatsen mot multi- purpose-teorin. Men man har svårt att bestämma sig för vilket av följande som satte i gång det hela:

a) Tra-la-la-teorin menar att språket uppstod ur vårt estetiska uttrycksbehov och vårt behov av rytm och klang.

b) Hej-å-hå-teorin menar att språket uppstod vid gemensamt arbete, antingen för att samordna krafterna eller fördela insatserna.

c) Wroom-swisch-bang-teorin menar att våra förfäder med rösten försökt härma olika skeenden och kanske även föremål.

d) Wow!-teorin menar att vårt behov att uttrycka starka känslor gav upphov till de första orden.

e) Bla-bla-bla-teorin menar att våra sociala behov var så starka att de till slut också tog sig verbala uttryck.