Modersmålet skiner igenom i uppsatser på engelska

Text:

Inte bara modersmålets grammatik skiner igenom när studenter skriver uppsatser på engelska. Skribenternas sätt att formulera sig på engelska visar också vilken språkfamilj modersmålet tillhör. Det visar en studie vid Massachusetts Institute of Technology, MIT.

Forskare vid MIT har med hjälp av ett datorprogram analyserat uppsatser skrivna på engelska av personer med fjorton olika modersmål. Programmet sökte först efter mönster i de engelska texterna. Därefter jämfördes dessa mönster med skribenternas modersmål.

På det sättet kunde forskarna ta fram en algoritm som kunde förutsäga skribentens modersmål genom att ta del av en uppsats på engelska. Algoritmen visade sig pricka rätt i 72 procent av fallen. Om algoritmen hade fel brukade det korrekta modersmålet återfinnas bland de mest sannolika övriga kandidaterna.

Algoritmen kan till exempel förutsäga att sannolikheten är 51 procent för att en uppsats är skriven av en person som har ryska som modersmål, 33 procent för polska och 16 procent för japanska. Skillnaderna i sannolikhet visade sig återspegla avståndet mellan språkens släktskap. Både ryska och polska är slaviska språk. Att de tillhör samma språkfamilj visade sig även i modersmålstalares texter på engelska, då polskans och ryskans grammatik gjorde liknande avtryck i det främmande språket.

Forskarna ser flera användningsområden med den nya tekniken. Algoritmen kan bidra till förståelsen av språkens typologi, som ordföljd, konstruktionen av negationer och användningen av artiklar. Den kan också nyttjas i datorprogram skräddarsydda för att hjälpa en person att lära sig ett främmande språks grammatik.

Anders