Tyskan innehåller minst 5,3 miljoner ord

Text:

Minst 5,3 miljoner ord finns i det tyska språket. Antalet har ökat med en tredjedel under det senaste århundradet. Och det är framför allt i tidningarna som de nya orden dyker upp, rapporterar Die Welt.

Hur många ord som finns i ett språk har länge setts som en hopplös uppgift att försöka räkna ut. Det är inte bara knepigt att faktiskt definiera vad som är ett ord (läs till exempel Mikael Parkvalls och Päivi Juvonens artikel i Språktidningen 1/2010). Frågan är också hur det skulle gå till att sammanställa en ordbok som täcker varenda dialekt, allt talat språk, allt fackspråk och så vidare. Dessutom går det utmärkt att skapa nya ord på stående fot – vad sägs till exempel om plånbokskrokodil (’krokodil vars skinn används till plånböcker’)? Ska det räknas eller inte? Och vem ska bestämma?

Tyska forskare har gjort ett försök att räkna ut hur många ord som finns i det tyska språket. Svaret är enligt Die Welt drygt 5,3 miljoner ord. Men det rör sig sannolikt om betydligt fler.

Forskarna har sammanställt en enorm korpus, en databas innehållande flera miljarder ord hämtade från skönlitteratur, tidningsartiklar, vetenskapliga texter och brukstexter som bruksanvisningar, kokböcker, juridiska texter med mera. Texterna har samlats in från tre perioder: 1905 till 1914, 1948 till 1957 och 1994 till 2004.

På en miljard ord hittades under den senast undersökta tioårsperioden 5 328 000 olika ord. Mellan 1948 och 1957 hittades 5 045 000 ord i en lika stor textmassa, och mellan 1905 till 1914 var antalet 3 715 000.

Inom skönlitteraturen har utvecklingen närmast stått still – antalet använda ord har bara ökat marginellt. Det största uppsvinget har skett i tidningarna, men även i brukstexter och vetenskapliga texter har antalet ord ökat kraftigt. Att det är i tidningarna som flest nya ord dyker upp är enligt forskarna naturligt. Medierna behöver ständigt nya ord för att kunna rapportera om nya fenomen.

Undersökningen visar också hur det tyska samhället har förändrats. De mest använda orden är oavsett årtionde med några få undantag desamma. Mellan 1905 och 1914 var Gott (’gud’) det elfte vanligaste substantivet, men århundradet senare finns det inte ens bland de 100 främsta. Nummer 57, Kaiser (’kejsare’), har också minskat i användning. Bland klättrarna återfinns substantiv som Prozent (’procent’) och Million (’miljon’)

Antalet ord har alltså ökat med ungefär en tredjedel inom loppet av 100 år. De flesta nya orden är sammansättningar och avledningar.

Även om den tyska undersökningen är långt ifrån heltäckande – den tar bara hänsyn till skrivet språk avsett för en bred läsekrets – ger den ändå en fingervisning om hur många ord som kan tänkas finnas i språket. Drygt 5,3 miljoner ord är förmodligen lågt räknat, men det kan sättas i relation till standardordförrådet som beräknas uppgå till omkring 70 000 ord. Som jämförelse innehåller exempelvis Svenska Akademiens ordlista ungefär 125 000 ord och Große Wörterbuch der deutschen Sprache, som ges ut i tio band, runt 200 000 ord, skriver Die Welt.

Anders

Foto: Istockphoto