Vänlig läshjälp sammanfattar och förklarar

Text:

Att sammanfatta och förklara långa texter är syftet med Friendly Reader. Genom att korta texter men behålla nyckelord ska den öka läsbarheten. Nättjänsten har utvecklats vid Linköpings universitet.

Tanken med Friendly Reader är att programmet ska kunna användas av alla som har behov av förenklade texter. Sammanfattningen sker genom samma teknik som Google använder för att ranka webbplatser. Nyckelord och nyckelmeningar identifieras och tar plats i sammanfattningen, medan sådant som bedöms som mindre viktigt läggs åt sidan. Friendly Reader erbjuder även synonymer, olika stilar och en extra markering som kan läggas över ett visst stycke för att ge ökad läsbarhet.

För att testa programmet matade vi in Mats Dahllöfs artikel om politikerspråk från Språktidningen 7/12. Den klockar in på drygt 8 000 tecken och behandlar ett ganska komplicerat ämne. Användare kan i procent själv välja hur mycket av den ursprungliga texten som ska finnas med i en sammanfattning. Med bara 1 procent kvar säger inte sammanfattningen särskilt mycket om innehållet i artikeln:

Med hjälp av denna typ av analys, där målet är att finna språkliga drag som kan knytas till olika egenskaper hos avsändaren, kan man bygga datormodeller som säger vilken typ av text eller för­fattare vi har att göra med.

Lite mer kött på benen blir det genom att ställa in 10 procent, men resultatet är fortfarande en bit ifrån en användbar sammanfattning av innehållet:

Vi kan därmed rangordna orden efter hur tydligt de skiljer ut en grupp av politiker från en annan. Det är sådana ord som man brukar kalla för nyckelord. Skillnaden ser dock ut att minska en del, från att han var ungefär dubbelt så vanligt förekommande som hon för tio år sedan. Aven en hel del av de gramma­tiska småorden är snedfördelade över könen. Detta syns tydligt när det kommer till ord som förskolan, skolan, elever och lärare. Med hjälp av denna typ av analys, där målet är att finna språkliga drag som kan knytas till olika egenskaper hos avsändaren, kan man bygga datormodeller som säger vilken typ av text eller för­fattare vi har att göra med. Dessa metoder ger inte någon perfekt träffsäkerhet, men de fungerar ändå så pass bra att de bekräftar att ordens frekvenser avslöjar en hel del om ledamöternas kön, ålder och politiska inriktning.

Här ges en god bild av Mats Dahllöfs metoder, men vilket ämne han faktiskt behandlar är alltjämt osäkert. Men genom att höja ett snäpp ytterligare, till 20 procent, får läsaren en hyfsad bild av hela artikeln:

Även andra kommunikativa strategier kan påverka ordens frekvenser. Vi kan därmed rangordna orden efter hur tydligt de skiljer ut en grupp av politiker från en annan. Det är sådana ord som man brukar kalla för nyckelord. Vi hittar intressant nog inte några ord som lika starkt pekar ut några motsvarande ”mans­frågor”. Det närmaste vi kommer är euro­peiska och unionen, men det kan vara uttryck för de manliga ledamöternas större benägenhet att använda namn. Man kan nämligen se att männen använder egennamn i högre grad än vad kvinnorna gör för attt ala om och till andra politiker. Borgerliga ledamöter talar mer om Socialdemokraterna, bestämdform plural, medan det för partiets egna ledamöter blir (vi) socialdemokrater, alltså obestämd form. En del av förklaringen till detta skulle kunna vara att kvinnliga ledamöter talar om och tillvarandra i debatter om ”kvinno­frågor” över blockgränserna, och att även männen tar ansvar förfrågor  liknande sätt. Skillnaden ser dock ut att minska en del, från att han var ungefär dubbelt så vanligt förekommande som hon för tio år sedan. Ett mer vardagligt tilltal med du till den verkliga adressaten, som också ofta förekommer, får därmed en mer informell karaktär. Mönstret är omvänt vad gäller pronomenet vi, som är vanligare bland yngre ledamöter, särskilt bland män och bland företrädare för regeringspartier. Aven en hel del av de gramma­tiska småorden är snedfördelade över könen. Detta syns tydligt när det kommer till ord som förskolan, skolan, elever och lärare. Med hjälp av denna typ av analys, där målet är att finna språkliga drag som kan knytas till olikaegenskaper hos avsändaren, kan man bygga datormodeller som säger vilken typ av text eller för­fattare vi har att göra med. Dessa metoder ger inte någon perfekt träffsäkerhet, men de fungerar ändå så pass bra att de bekräftar att ordens frekvenser avslöjar en hel del om ledamöternas kön, ålder och politiska inriktning.

Friendly Reader finns både för nedladdning och för användning på nätet.

Anders