Snart kan datorn upptäcka demens utifrån språket

Många upprepningar, hummanden och enkla verb.

Text: Eva Barkeman

Även erfarna författare tappar ord när de blir dementa. Deckarförfattaren Agatha Christie hade ingen officiell diagnos, men det fanns misstankar om att hon hade Alzheimers sjukdom.

År 2011 visade kanadensiska språkforskare att Agatha Christies två sista böcker skilde sig språkligt från hennes tidigare. I Elephants can remember, ’Långa skuggor’ (1972), och Postern of fate, ’Ödets port’ (1973), var ordförrådet mindre, verben enklare och upprepningarna fler än i exempelvis Destination unknown, ’Destination okänd’ (1954).

– Forskarna hade starka bevis för att Agatha Christie drabbades av demens, säger språkvetaren och språkteknologen Dimitrios Kokkinakis.

Han hörde om kanadensarnas forskning på en konferens och blev intresserad av att själv skapa en modell för att identifiera tidiga språkliga tecken på demens.

Under 2016 samlade han in data tillsammans med kollegerna vid Språkbanken på Göteborgs universitet. Det insamlade materialet bestod av språkprover, dels från friska personer, dels från patienter med lindriga ”kognitiva störningar”, det vill säga störningar i de tankefunktioner som hanterar information och kunskap.

Ett av projektets syften är att utveckla språkteknologiska metoder för att bearbeta och tolka olika former av skrift- och talspråk. Men visionen är att framställa tids- och kostnadseffektiva diagnostiska tester för demens.

I dag krävs långa och kostsamma utredningar inom specialistsjukvården för att ställa diagnos: magnetkameraundersökningar, ryggmärgsvätskeprov och neuropsykologiska undersökningar – bland annat språkliga tester. Många har haft symtom på demens i upp till femton år innan de till slut får en diagnos.

– Ofta är det de anhöriga som först märker att något är fel, till exempel att den närstående glömmer vardagshändelser. Men det finns språkliga tecken som med stor sannolikhet kan avslöja demens, som att personen har svårt att finna rätt ord, säger Dimitrios Kokkinakis.

Tanken är att först analysera stora mängder tal, och utifrån detta bygga en datormodell som automatiskt kan identifiera typiska tecken på begynnande demens.

Det handlar om maskininlärning, eller artificiell intelligens, AI, där datorn ”tränas” i att känna igen språkliga mönster. För att datorerna ska kunna urskilja de små subtila tecknen på demens, måste språkvetarna först själva analysera det insamlade talet. De måste göra en noggrann utredning av språkljuden, orden, satserna och deras innebörd, och märka upp detta i materialet.

Sedan matar de in sina tolkningar i datorn, som gör matematiska beräkningar – algoritmer. Datorn lär sig mer och mer, ju mer ”erfarenhet” den får, och kan efter hand känna igen mönstren även när den konfronteras med nya, okända datamängder.

I projektet samarbetar forskarna med neurologer på Sahlgrenska sjukhuset i Göteborg, både för att få kontakt med lämpliga testpersoner och för att studera de diagnostiska språktester som läkarna använder i dag.

Oftast handlar det om ordflödestester. Dessa kan mäta en persons förmåga att på begränsad tid komma på ord som börjar på en särskild bokstav – till exempel f, a eller s – eller ord som tillhör en särskild betydelsekategori, till exempel djur. Det finns även mer komplexa ordflödestest, som kan mäta hur många djurord på a i grundform som personen kommer på under en minut.

Varje rätt svar ger 1 poäng.

– Det är stor skillnad mellan friska personer och personer med kognitiv störning. Ofta blir det inte mer än fem eller sex ord för de sistnämnda. För en frisk person kan det bli närmare det dubbla. Språkforskare har andra verktyg än neurologerna, och jag tror det går att göra ännu bättre språkanalyser med dem, säger Dimitrios Kokkinakis.

Han vill bland annat gärna se en mer differentierad skala i testerna, där avancerade ord ger högre poäng än enkla. Antilop är ju svårare att komma på än apa.

Bland de testresultat som forskarna digitaliserat och analyserat, hittar de sådant som att man sagt långhals när man troligen har menat giraff och Kalle Anka i stället för bara anka.

Kalle Anka ger 0 poäng i neurologernas test för ord på a, men borde kanske till exempel ge 0,3 poäng. Babian, som i alla fall är en apa, ger också 0 poäng, men borde kanske också värderas högre, även om det börjar på b, säger Dimitrios Kokkinakis.

Förutom att analysera läkarnas språktester har Dimitrios Kokkinakis och hans kolleger under det senaste året gjort egna inspelningar för att undersöka skillnader i språkbruket hos 50 friska personer och 50 patienter med milda kognitiva störningar.

Försökspersonerna, som är i 60–70-årsåldern, får göra två slags tester. I det första får de titta på en ganska komplex bild som föreställer ett kök med en mamma och två barn, där det ena barnet hämtar kakor ur en burk och samtidigt faller från pallen det står på.

– Personerna får beskriva allt som händer i bilden, så konkret som möjligt. De får ta den tid de behöver, oftast en till sju minuter. Hur mycket noterar de? Använder de enkla ord eller svåra? Behöver de leta efter ord? Ovanligt många pronomen kan vara ett tecken på att de inte kommer på rätt substantiv, utan det blir den och det där.

I det andra testet ska personerna läsa korta texter på cirka 600 ord och sedan svara på fem enkla flervalsfrågor. Först får de en text som de ska läsa tyst och sedan en annan text som de ska läsa högt. I båda fallen mäts samtidigt ögonrörelserna med en eye tracker, som registrerar hur blicken rör sig över texten, både framåt och bakåt eller när ögat är stilla.

– Det ger ytterligare information: hur snabbt man läser, hur ögat fixerar texten och hur ofta man behöver gå tillbaka i texten och läsa om.

Forskarna överför sedan inspelningarna till skrift. Detta för att de ska kunna göra en ordentlig analys av hur testpersonerna sätter samman mindre enheter, som ord, till mer komplexa strukturer, som fraser och meningar. Förutom själva orden skriver de ner allt annat som yttras så som det faktiskt låter, med pauser, stakningar, upprepningar, felsägningar och hostningar. Väldigt detaljerat.

Man räknar med att samla in hundratals variabler för varje testperson. Det kan handla om sådant som verbtäthet, antal begrepp, fördelning av ordklasser, pauslängder, diverse frekvens- och amplitudparametrar.

Datormodellen letar sedan efter strukturer i de olika variablerna för att hitta mönster som är typiska för en person med ”normalt åldrande”, jämfört med personer som befinner sig i början av att utveckla hjärnsjukdomar som Alzheimers sjukdom.

Ungefär 80–90 procent av det inspelade materialet kommer att användas till analyser för att bygga, eller ”träna”, datormodellen. Resterande material kommer sedan att användas för att utvärdera modellen: Kan den verkligen avgöra om det inspelade talet kom från en frisk person eller en med kognitiva störningar?

– Efter många träningsomgångar får man till slut ganska pålitliga siffror. I dag är tekniken för talanalys väldigt avancerad och kan ofta göra rätt i 80-85 procent av fallen. Visst, man missar en del, men det är ändå mycket bra.

Några få minuters inspelat tal kan räcka för att uppfatta vissa språkliga tecken på begynnande demens. AI-modellen blir då ett bra komplement till dagens tester och utredningar. I första hand ska man kunna avgöra om någon har demens, men på sikt även hur långt gången den är.

– Det flera olika typer av demens, som drabbar olika delar av hjärnan, så det vore roligt om vi lyckades avgöra vilken typ av demens det rör sig om.

Det finns i dag inga botemedel mot demens, men med en tidig diagnos kan man dels förbereda anhöriga på vad som händer, dels sätta in åtgärder som bromsmediciner eller övningar som sudoku eller socialisering.

Eva Barkeman är vetenskapsjournalist.

15 000 insjuknar varje år

Alzheimers sjukdom är den vanligaste demenssjukdomen. Symptomen kommer oftast smygande, och sjukdomsförloppet är långsamt. Det kan ta flera år innan man får så påtagliga symtom att man söker hjälp.

Det finns i dag cirka 100 000 alzheimersjuka i Sverige, och cirka 15 000 insjuknar årligen. Oftast drabbas människor som är äldre än 65 år.

De första symtomen är glömska och svårigheter att planera enklare saker i vardagen. Efter hand försämras kognitiva förmågor, som tal och tidsuppfattning. Även ångest och oro är vanliga symtom.

Alzheimers sjukdom orsakas av att hjärnans nervceller sakta förtvinar i hjäss- och tinningloben, vilket leder till att minnet gradvis försämras. Man vet inte säkert vad som vållar förloppet, men en förändrad omsättning av ett äggviteämne som kallas beta-amyloid anses vara en viktig komponent vid sjukdomsutvecklingen.

Källa: Demensförbundet

Så avslöjades Christie

Man misstänkte att Agatha Christie led av alzheimer. Fyra kanadensiska forskare analyserade totalt 16 verk av deckarförfattaren. De jämförde hennes deckare med verk av två andra brittiska författare: Iris Murdoch, som dog av diagnosticerad alzheimer, och P.D. James, som åldrades utan kognitiva störningar.

Totalt gick forskarna igenom 51 verk för att få en gedigen bild av språkbruket hos samma författare över flera decennier. De studerade ordförråd, upprepningar, ordklassvariation, passivformer med mera, eftersom alzheimerpatienter tenderar att använda enklare grammatik. Och mycket riktigt. Studien visade en tydlig nedgång i ordförrådet hos både Agatha Christie och Iris Murdoch i deras sena verk. Färre olika ord per teckenmängd och fler repetitioner av fasta fraser. Någon liknande förändring syntes inte hos P.D. James, som var hälsan själv och publicerade sin sista roman, The private patient, vid 88 års ålder.

4 frågor till Eva Barkeman

Hur kom du in på ämnet?

Jag läste om en stor databas, Swe-clarin, som digitalt tillgängliggör text och tal för forskning. Ett användningsområde är att låta datorer analysera stora mängder språkmaterial, på jakt efter olika samband.

Hur lär man en dator att detektera demens?

Det handlar om en datormodell som lär sig känna igen språkliga avvikelser – efter att språkvetare matat in uppgifter om tolkningar.

Har du blivit mer uppmärksam på ditt eget språk sedan du skrev artikeln?

Jo, kanske. Jag märker hur lätt det är att säga den här och det där, i stället för det specifika ordet.

Forskare menar att Agatha Christie drabbades av demens. Har du läst hennes böcker och dragit några egna slutsatser?

Vem har inte läst om miss Marple och Hercule Poirot? Men att göra en ”demensanalys” kräver nog specialmetoder. Sedan påverkar ju översättaren språket på sitt sätt. Tänk om hen är dement?