Kieliteknologiaa Linuxilla: Suomen romanikielen automaattinen muoto-opin analysaattori ja korjausohjelma
Hankkeeni tavoitteena on kehittää Suomen romanikielen automaattinen muoto-opin analysaattori ja korjausohjelma. Muoto-opin analysaattorilla voidaan tunnistaa romanikielisiä sananmuotoja ja päätellä niiden perusmuodot, sanaluokat ja taivutusmuodot. Korjausohjelma auttaa kirjoittajaa löytämään tekstistään kirjoitusvirheet. Muoto-opin analysaattorin pohjana on Helsingin yliopiston emeritusprofessori Kimmo Koskenniemen 1980-luvulla kehittämä kaksitasomalli (Two-level Morphology, TWOL), joka soveltuu minkä tahansa kielen muoto-opillisen rakenteen mallintamiseen. Analysaattorin keskeiset …