Datorer lär sig tokengelska

Text:

Det vanligaste språket på internet är ”broken English”. Nu lanseras den första stora databasen med engelsk text – skriven av personer med annat modersmål. ”De flesta som skriver på engelska är icke-infödda engelsktalare. Detta är ett faktum som forskare ofta förbiser när de ska lära datorer känna igen naturligt språk”, säger Yevgeni Berzac, doktorand i datavetenskap vid MIT, som leder projektet.