Vad är ett ord? Egentligen!?
Om du frågar någon vad språk består av, är det troligt att svaret blir "ord". Ordet är en av de mest självklara enheterna i språket. Vi slår upp obekanta ord i ordböcker och ordlistor, vi pluggar glosor och tar kanske våra lärare "på orden". Och när vi låter bli att använda vårt språk så säger vi "inte ett ord".
Vi tycks också intuitivt veta vad ett ord är. Ordinlärning är också det man lättast lägger märke till hos barn som håller på att utveckla sitt språk: efter de första orden, någon gång i ettårsåldern, formligen exploderar barns ordförråd - från noll till flera hundra redan efter ett år. Och typiskt består de första yttrandena av det som vi vuxna kallar ord - gärna oböjda - snarare än av större enheter, som fraser och meningar. (Låt vara att barn kan förknippa orden med delvis andra betydelser än de vuxna; det vet alla som har hört ett barn kalla en vilt främmande karl för pappa.) Redan som riktigt små utvecklar vi alltså en känsla för vad ett ord är och hur orden låter på modersmålet.
En mängd olika kriterier kan sättas upp för att avgöra vad som är ett ord. Ett enkelt sådant kriterium är att allt som i skrift står mellan två mellanslag, eller mellan ett mellanslag och ett skiljetecken, är ett ord. Det är visserligen bara användbart för språk som har ett skriftsystem där mellanslag används för att markera ordgränser, men fungerar bra hittills i den här texten, till exempel.
Men även detta enkla kriterium stöter snabbt på patrull. Hur ska vi till exempel göra med olika förkortningar? Är etc (etcetera) eller istf (i stället för) ord? Hur är det med akronymer som SAS och FN? Och om vi inte tycker att just de är ord, hur är det då med stins och moped? De är ju också bildade genom förkortning av ursprungligen längre uttryck (stationsinspektör respektive motor+pedal). Omvänt, om nu SAS och FN är ord, är då kg och dr också det? De går ju inte ens att uttala som ord. Det går heller inget vidare att böja dem - FN:s säkerhetsråd går visserligen bra, men dr:s läkarutbildning tar emot. Och hur ska vi behandla i morgon gentemot imorgon? Eller i går gentemot igår? Det finns många fall där språkbruket vacklar.
Den som av någon anledning vill räkna ord i en text - eller kanske i ett helt språk - måste själv ta ställning vad som är ett ord, och vad som inte är det. Kanske bör man, som följande exempel illustrerar, först testa några vanliga ords stavning i den text man vill uttala sig om. Då får man en uppfattning om hur ens val kan påverka resultatet.
olika stavningar på Google
stavning förekomster
Överhuvudtaget 22%
över huvud taget 74%
över huvudtaget 2%
överhuvud taget 1%
Att använda mellanslag och skiljetecken för att plocka ut ord fungerar förstås bara i skrivet språk. Som synes är det också svårt att vara konsekvent i sin ordbedömning. Det blir snabbt godtyckligt.
Att ha skriftbilden som rättesnöre fungerar dessutom milt sagt dåligt för de flesta av världens cirka 6 000 språk, och anledningen är nog så enkel: majoriteten av världens språk har inget skriftspråk. Likväl måste också de rimligen ha ord - svenskan kan ju knappast ha fått sina ord i samma ögonblick som någon började skriva ner språket (med mellanslag).
Om man ändå har gett sig den på att bestämma vad som är ett ord, generellt sett, får man alltså använda sig av andra kriterier, som inte är beroende av skrift.
Kan kanske ordens betydelse ge oss några ledtrådar? Ett ord sägs ibland utgöra en "sammanhållen betydelseenhet". Kriteriet fungerar ganska bra för många ord, som bil. Det står ju för en viss typ av motorfordon, ett avgränsat objekt - en ganska väl sammanhållen betydelseenhet.
Även en böjd form av ordet, som bilar, kan man hävda utgör en betydelsemässigt sammanhållen enhet. Böjningen ändrar bara innebörden av begreppet bil genom att ange att det är fråga om fler än en bil, och det är fortfarande bilar vi talar om, inte till exempel fåglar.
Men hur är det med ord som återvända - är det ett ord eller två enligt detta kriterium? Vi har ju även formen vända åter.
Och hur är det med uttrycken vanligare och mer vanligt? Tyr man sig till det betydelsemässiga kriteriet borde mer vanligt vara ett enda ord. Det betyder trots allt samma sak som det enkla ordet vanligare.
Men i svenska är det brukligt att betrakta återvända som ett sammansatt ord, medan vända åter ses som två ord. Vanligare betraktas som ett ord, medan mer vanligt ses som två. Detta mest på grund av hur orden böjs och uttalas.
Följaktligen kan uttal, och regler för hur språkljuden kan kombineras, också ge viktiga ledtrådar till var ordgränserna går.
Man skulle kunna tro att orden skiljs åt av små, korta pauser i talflödet, ungefär på samma sätt som mellanslag i skrift. Dessvärre är det i allmänhet inte så. I normalt taltempo finns sällan några pauser mellan enskilda ord (men se faktaruta om junktur på nästa sida).
Vi kan visserligen be någon att tala långsamt och tydligt. Då kan pauser, rätt mödosamt, petas in mellan orden. Men pausering handlar i naturliga fall mer om hur vi strukturerar vårt tal - och vad vi talar om - än om att skilja de enskilda orden åt.
I många språk kan dock betoning användas som ett kriterium på vad som är ett ord. Ett ord har oftast bara en huvudbetoning. Detta kan användas som argument för att återvända ska betraktas som ett enda ord, eftersom sammansättningar har ett eget betoningsmönster i svenskan.
Sammansättningarna, som består av två eller flera led (i detta fall åter och vända), har sin huvudbetoning på första stavelsen i första ledet, och en bibetoning på första stavelsen i andra ledet. Återvända har alltså sin huvudbetoning på å i åter, och sin bibetoning på ä i vända.
Det är också betoningen som gör att vi kan höra skillnad mellan brunhårig sjuksköterska och brun hårig sjuk sköterska.
Förutom huvudbetoning har många språk ett fast betoningsmönster, som också hjälper oss att höra var gränserna går mellan orden. I polska ligger huvudbetoningen alltid på näst sista stavelsen, i franska alltid på sista och i finska på första stavelsen. I språk med en sådan fast ordbetoning går det alltså lättare att känna igen gränser mellan ord. På samma sätt kan man i tonspråk, som kinesiska, använda olika tonmönster som kriterium på vad som är ett ord.
Svenskan är inget tonspråk, men den har (med undantag av några dialekter) ett accentsystem, som låter oss skilja mellan exempelvis ljusen och gjusen, Polen och pålen. Det viktiga i det här sammanhanget är att accenten inte kan pytsas ut på vilka stavelser som helst, utan bara just på dem som utgör ett ord.
Olika språk har också olika regler för hur enskilda språkljud får kombineras till stavelser och ord. De svenska reglerna tillåter osedvanligt många olika ljudkombinationer, och därför är det inte så lätt att höra på ljuden vad som är ett enskilt ord i svenskan.
Men i ljudföljden "varningförhaltväglag", 'varning för halt väglag', kan det omöjligen gå någon ordgräns före "rn", "ngf" eller "ltv", helt enkelt för att inga svenska ord kan börja med dessa ljud eller ljudkombinationer.
Däremot säger det inget om den felaktiga uppdelningen hal tvä glag. Dessa tre ljudkombinationer skulle mycket väl kunna vara tre olika ord på svenska. Hal är ju det också - men tvä och glag står i alla fall inte med i Svenska Akademiens ordlista.
I språk med mindre liberala regler för ljudkombination kan det vara enklare att höra vad som är ett ord.
Även andra ljudmässiga ledtrådar kan användas för att känna igen ordgränser. Tyska är till exempel ett språk där det inte hörs någon skillnad mellan ljudparen b-p, d-t och g-k när de förekommer sist i ett ord. B, d och g låter då likadant som p, t respektive k. Man säger att de blir tonlösa. När de förekommer på andra ställen i orden hör man däremot skillnad mellan ljuden, ungefär som på svenska. På så sätt kan dessa konsonanter ge en fingervisning om var ett ord börjar och slutar.
Medan pluralformen av det tyska ordet för 'barn' uttalas med d i mitten, /kinder/, så uttalas singularformen med ett t, /kint/, trots att det stavas kind. Det kan alltså aldrig finnas en ordgräns efter ett b, d eller g-ljud i tyska.
Åter andra språk har en regel som säger att bara vissa vokaler får förekomma tillsammans i ord. Det kallas för vokalharmoni, och finns till exempel i finska. I finska, icke-sammansatta, ord har man i princip antingen bara vokaler som uttalas långt fram i munnen (främre vokaler): ä, y, ö, eller bara vokaler som uttalas långt bak (bakre vokaler): o, å, a. Vokalerna i och e kan dock kombineras fritt med både främre och bakre vokaler och är i detta avseende neutrala. Så finska ord ser ut som pöytä, 'bord', och paita, 'skjorta'. Ord som poutä och pääta saknas alltså i ordförrådet, och kan glömma att ens kvala in som finska ord.
Vokalharmonin i finskan omfattar även böjningsändelser, så alla ändelser som innehåller andra vokaler än de neutrala i och e har två olika former - en med främre och en med bakre vokaler. 'På bordet' blir sålunda pöydällä, medan 'på skjortan' heter paidalla.
Ibland visar sig dock vokalharmonin vara av ringa värde som kriterium för ordigenkänning i finskan. I en mening som Eilen illalla katsoin televisiosta luontoelokuvaa ja keskustelin kaverini kanssa elefanttien ruokailutottumuksista ('I går kväll såg jag på ett naturprogram på tv och pratade om elefanternas matvanor med min kompis') är ju alla vokaler antingen bakre eller neutrala!
Även grammatiken kan hjälpa oss att se vad som är ett ord. I många språk, bland annat svenska, är orden rätt lätt igenkännbara och oföränderliga element. Om man ska böja ett svenskt ord lägger man i de flesta fall till en ändelse, man förändrar inte själva ordstammen: bil-bilar, hoppa-hoppade, fin-fina (även om det självklart finns en hel del undantag).
I andra språk, till exempel det filippinska språket tagalog, fungerar det ordkriteriet inte alls, eftersom man systematiskt böjer orden just genom att förändra ordstammen. Till exempel kan man lägga böjningar inuti ett ord efter den första konsonanten. Av verbet sulat, 'skriva', kan man bilda sinulat, 'skriven', och sumulat, 'skrev'.
Ett annat grammatiskt kriterium handlar också om orden som sammanhållna enheter. Om man till exempel vill framhäva ett ord så kan man i många språk flytta det så att det hamnar först i en sats. Men man kan inte flytta bara en del av ordet. Vill man flytta ett ord, så måste hela paketet hänga med. Flyttfåglarna återvänder snart går bra, medan Flyttfåglarna åter snart vänder inte är något som en infödd talare skulle säga.
Man skulle kunna tro att ord är lika lätta att känna igen som de är att använda. Dagligdags behöver man kanske inte heller reflektera så mycket över hur ett ord egentligen ser ut. De problematiska fallen är trots allt i minoritet, och i de allra flesta fall kan vi säkert avgöra vad som är ett ord. Men sista ordet om ord är kanske ändå inte sagt.