Språket avslöjar hur vi röstar
Den som följde valvakan efter EU-valet i våras vet att även de mest välgjorda undersökningar kan missa opinionsläget med flera procentenheter. Vallokalsundersökningen visade då att Feministiskt initiativ och Sverigedemokraterna skulle få sju procent vardera. Men när rösterna väl var räknade blev det tio respektive fem procent.
Ett skäl till att det kan bli så snett är att folk faktiskt inte svarar som de röstar. Medvetet eller omedvetet väljer de att inte säga sanningen. Det gör att man kan börja tvivla på det vanligaste sättet att få svar på hur folk tänker rösta: genom att fråga dem. Detta och andra metodfel har givetvis opinionsinstituten full koll på. De korrigerar sina siffror för de felaktigheter som de kan förutsäga, efter stickprovets beskaffenhet, efter tidigare erfarenheter och justeringar. Det är en grannlaga och arbetskrävande uppgift, som trots allt inte alltid träffar rätt och som inte kan göras kontinuerligt.
Ett alternativ till enkätundersökningar kan därför vara att läsa vad folk själva skriver om sina politiska sympatier. Fördelen med ett sådant – indirekt – sätt att få reda på sanningen, är att den som undersöks har svårare att manipulera eller dölja sina verkliga åsikter. Och vill man snoka reda på opinionen läsvägen, råder heller ingen brist på politisk debatt och politiska åsikter i publicerade texter. De finns bland annat tillgängliga på nätet – i tidningarnas nyheter, i bloggar, mikrobloggar och diskussionsforum. Men för att få en bra bild av vad folk i allmänhet tycker, måste man å andra sidan läsa väldigt stora mängder text. Då är det bra att ha ett datorprogram som hjälper till att tröska igenom materialet. Vill man dessutom att undersökningarna ska vara färska, krävs ett program som klarar av att ögna igenom stora mängder text i realtid. Det måste också vara ett program som inte hostar och storknar om texten inte följer högspråkliga normer, som förmår att associera ord med varandra och som förstår hur de hänger ihop. Idén om ett sådant verktyg bildade grunden till språkanalysföretaget Gavagai.
Nu har jag och mina kolleger – forskare i språkteknologi – skapat just ett sådant lärt och läskunnigt system, Sensefish. Vi låter det läsa i stort sett all text som publiceras digitalt på svenska, det vill säga några hundra tusen dokument per dag. Systemet läser in texterna så snart de publicerats och relaterar orden i dem till varandra. Detta ställer stora krav på både den språkliga analysen och på effektiviteten: vi kan inte lägga lång tid på varje yttrande om vi ska hinna med allt material, och det är för mycket text för att vi ska kunna lagra den. Vi har en minnesmodell – ett ”ordrum” – som håller reda på termerna och i vilka mönster de förekommer. Om vi tittar på vad systemet känner till en vecka i juni, när denna artikel skrivs, ser vi att Feministiskt initiativ för tillfället associeras starkare med socialdemokrater än tidigare. Partiet har just tillkännagivit att de har för avsikt att sitta i den socialdemokratiska partigruppen i Europaparlamentet.
Några hundra tusen dokument per månad handlar om partipolitik – de nämner partier eller deras främsta representanter. Vårt system har läst dem, och vi kan fortlöpande läsa av den skrivande allmänhetens intresse för och attityder till partiernas politik. Vi kan till exempel se om någon av de viktigare politiska frågorna också omnämns i texten – och i så fall relatera dem till partierna. På detta sätt får vi fram ett helt annat slags stickprov än vad enkäter ger. Det kan inte tolkas som en opinionsundersökning, utan mer som en barometer över det politiska läget i landet. Det är givetvis inte alla svenskar som skriver text på internet, men antalet skribenter ökar stadigt. Samtidigt blir de som känner sig delaktiga i den digitala världen fler, och detta gör att man kan få ett redigt grepp om allmänhetens attityd till politiska frågor genom att läsa vad som skrivs på internet.
Att principen fungerar har vi tidigare visat genom att förutsäga ”folkets röst” i schlagerfestivalen flera år i rad. Vi har mätt hur många uppskattande yttranden om de olika artisterna som har skrivits veckorna och dagarna före finalen. Och under själva framträdandena har vi i realtid mätt hur många som har gillat vad de hört och sett. Det som folk har skrivit på nätet har också visat sig stämma väl överens med telefonrösterna. Politiska åsiktsyttringar på nätet kan vid en första anblick te sig lika enkla som åsikterna om schlagerartister: hejarklackar där skribenterna hyllar de sina och dissar motparterna. Men så enkelt är det inte. Folk jämför partier och deras representanter, diskuterar olika partiers möjligheter att vinna framgångar eller göra bort sig, och spekulerar om hur det ska bli i framtiden. Vissa partier får avsevärt mer uppmärksamhet än deras röstetal skulle få en att tro, andra mycket mindre. Och folk tar – betryggande nog – politiska frågor mer allvarligt än schlagersångare.
Därför räcker det inte med att räkna ord för att få ett mått på allmänhetens och väljarnas intresse för ett politiskt parti. Man måste också ta reda på vilka och vilken sorts ord som används tillsammans med partierna – det vill säga i vilket sammanhang ett parti förekommer. Då får man fram vilka ämnen som partiet förknippas med och i vilket tonläge det omnämns. Vi följde till exempel valet till grekiska parlamentet i juni 2012. Där rönte det nya oppositionspartiet Syriza – med sin karismatiske ledare Alexis Tsipras och sina kontroversiella politiska utspel – stor uppmärksamhet i medier över hela Europa. I grekiska sociala medier förekom Syriza mer än något annat grekiskt parti. Samtidigt omnämndes partiet i bekymrade, skeptiska och oroliga ordalag, mycket mer än de andra partierna. Det gav oss fog för att förutsäga en valvinst för ett av de mer etablerade partierna, vilket visade sig vara korrekt. Vi vet alltså att uppmärksamhet inte räcker för framgång på valdagen!
Men attitydmätningar räcker inte heller för att förutsäga hur folk röstar. Att uttrycka gillande för ett parti eller dess representanter kan förstås vara ett tecken på intresse för politiken, men också indikera en mobilisering bland väljarna. Däremot är stigande skepsis eller ilska gentemot ett parti inte nödvändigtvis ett tecken på att det kommer att sjunka i opinionsmätningarna eller få färre mandat i det kommande valet. Det skulle i stället kunna betyda att väljare som ändå inte tänkt rösta på partiet är oroade eller upprörda över något som partiet har gjort.
Det parti som kan kopplas samman med en viss politisk fråga får en skjuts i opinionen – om frågan visar sig viktig för många väljare och om partiet kan svara väl på den. Att följa hur ett parti nämns i samband med olika politiska frågor kan alltså också visa hur partiet positionerar sig.
På Gavagai följer vi vissa politiska frågor på samma sätt som vi följer partier. Frågorna kopplas ihop med partier och med den attityd som uttrycks gentemot dem på internet. Men de frågor som politiken behandlar förknippas ändå inte alltid med politik av väljarna. Många, eller till och med de flesta, diskuterar skolfrågor som en vardagspraktikalitet, inte som en politisk fråga. Många diskuterar hälso- och pensionsfrågor utan att uttalat relatera dem till politiska åtgärder eller politiska lösningar. Miljöfrågor får mycket stort utrymme bland politiska frågor i det som folk i allmänhet skriver, men är inte den fråga som partierna betonar i sin opinionsbildning.
Här finns mycket information att hämta. Vi bör till exempel kunna förutsäga valutgången genom att hålla koll på vilka politiska frågor som är på tapeten, om någon viss fråga är på väg in eller ut, hur flertalet ställer sig till frågan och hur människor upplever att partierna förhåller sig till den eller förflyttar sig i förhållande till den. När jag skriver detta, veckan före midsommar, ser vi att Socialdemokraterna har en mycket större proportion positiva yttranden än Moderaterna. Det är enigt med den stämning som medierna beskriver och som opinionsundersökningarna rapporterar. Vi ser dock också att det skrivs mer om Moderaterna och deras representanter än det skrivs om Socialdemokraterna och deras; Moderaterna är sedan flera år det parti som får mest uppmärksamhet i redaktionella och sociala medier, enligt våra mätningar. Samtidigt ser vi att de samhällsfrågor som diskuteras mest handlar om miljön – natur, friluftsliv, djurhållning och klimat. Sådana frågor diskuteras dock inte i samband med politiska partier. Och vi ser inte att något parti hanterar frågan aktivt trots, eller kanske på grund av, att ett parti starkt förknippas med den. Om något annat parti lyckas ta tag i miljöfrågan på ett övertygande och handlingskraftigt sätt har det sannolikt stora möjligheter att vinna allmänhetens intresse.
I väntan på valet kan vi använda opinionsmätningarna som en sorts facit. Vi jämför våra siffror med deras för att justera det vi håller på med. När folk till exempel diskuterar vårdpolitiken, i synnerhet om den diskuteras i bekymrade ordalag, tenderar opinionsmätningarna att ge bättre siffror för Vänsterpartiet och sämre för Moderaterna.
Men – väl att märka – inget är rätlinjigt när det gäller åsikter. Till exempel är skolan som politisk fråga dyster och problematisk: skolans resultat faller enligt internationella mätningar, lärarna är obehöriga och eleverna griniga. Inga politiker hyllar skolan, och frågar man allmänheten om viktiga politiska frågor kommer skolan högt eller högst. Däremot verkar de flesta gilla sin skola: när folk i allmänhet skriver om skolan på nätet handlar det om vardagliga erfarenheter, sociala förhållanden och själva skolarbetet. Och det är inte alls något som präglas av missmod!
Val är inte skönhetstävlingar: vi väljer vilken röstsedel vi lägger i valurnan efter överväganden som är komplexa. Viktigast är de frågor som engagerar och vilka partier som man förknippar med dem. Sådant kan vi mäta! Däremot kan vi inte mäta vanans makt. Många kan ju gilla ett partis utspel, men ändå inte vilja rösta på det partiet – av historiska skäl, av tradition eller utifrån ideologisk grund. Sådana saker diskuteras inte lika ofta i spalterna och nämns inte lika ofta i sociala medier. För att rätt värdera de insikter man kan få fram med ett datorprogram, krävs nog viss vana vid politik i ett större perspektiv.
Men slarvigt nedkastade tankar kan vara lika värdefulla att bokföra som analytiska essäer av statsvetare. Då behövs verktyg som klarar att få grepp om allt som skrivs.
Jussi Karlgren är grundare till textanalysföretaget Gavagai och adjungerad professor i språkteknologi på Kungliga tekniska högskolan i Stockholm.