Tal- och språkbehandling

För att ändra andraspråkstal (L2) till text med hjälp av teknologi och maskininlärning är utmanande från flera olika aspekter.

L2-talare är inte infödda talare och därför kan talet innehålla en stark brytning och det är möjligtvis inte flytande. Forskning om taligenkänning av andraspråkstal behövs eftersom det inte finns databaser för L2-svenska eller L2-finska som kunde utnyttjas för träning av modeller. Forskningsgruppen i Aalto-universitetet ska tillämpa sina toppkunskaper i taligenkänning för att bemöta klyftan mellan modeller för L1-språk och individuella L2-inlärare. Ju specifikt det som har sagts kan igenkännas, desto reliabel är bedömning av muntlig språkfärdighet.

Förutom att igenkänna tal till text finns det ett annat intressant och utmanande problem i bedömning av muntlig språkfärdighet: automatisk taligenkänning och segmentering av talet. Det innehåller bedömning av uttal, prosodi, flyt, ordförråd och grammatik. För allt detta behövs det olika metoder av maskininlärning så att det är möjligt att igenkänna de latenta variabler som kan koppla ihop en liten mängd av talprov med de officiella språknivåerna av muntlig språkfärdighet som språkexperter har definierat.

Forskare i denna projektgrupp är Mikko Kurimo, Aku Rouhe, Ekaterina Voskoboinik, Ragheb Al-Ghezi, Yaroslav Getman,Clara Akiki och Mateiu Tudor.