Nu ska datorn skilja på rock och rock

Text:

Vill du lyssna på rock i din nya rock? Vi människor har nästan aldrig problem med att avgöra vad ett ord betyder i ett visst sammanhang, även om det kan ha mer än en innebörd. Datorerna har däremot haft mycket svårt med detta, till exempel när de ska översätta en text automatiskt eller ta emot ett röstkommando.

Språkvetaren Luis Nieto Piña har skrivit en avhandling där han presenterar förbättrade semantiska modeller, som gör det möjligt för digitala verktyg att förstå flera innebörder av samma ord. Detta genom att förse datorsystemen med lexikon och andra språkliga resurser.

Flertydiga – eller ambiguösa – ord har vållat mycket huvudbry för dem som har velat få datorer att greppa mänskligt språk. Många som har använt Google translate har fått sig ett gott skratt, och trovärdigheten kan sänkas rejält för annonsörer och andra som urskillningslöst förlitar sig på automatiska översättningstjänster. En ”tillfällig blus” annonseras till exempel ut på nätet – men det handlar inte om ett plagg som finns under en begränsad tid; en casual blouse är i stället en som är ledig i passformen och lämpar sig för informella sammanhang. 

Maskinerna har länge rätt väl kunnat sortera in ord i ordklasser – det vill säga avgöra om ett ord är ett substantiv, som rock, eller ett verb, som spela. I viss mån har datorerna också kunnat lära sig vilken grammatisk roll ett ord har i en sats, till exempel om det är subjekt eller objekt. De har kunnat tränas i att se sådant som att jag i jag spelar rock är subjekt och att rock är objekt – och inte vice versa. Men att begripa vad orden egentligen betyder är en annan femma: är rock en musikstil eller ett ytterplagg?

I de flesta datorsystem som hanterar språk är det avgörande med modeller som kan informera datorn om vad orden betyder, menar Luis Nieto Piña. På så vis kan användarupplevelsen bli bättre och vardagen enklare.

Läs avhandlingen här!  Och här kan du läsa mer om hur datorer lär sig förstå mänskligt tal.

Maria

Foto: Istockphoto