Suomen romanikielen kieliteknologiaa valmistunut Linuxia hyödyntäen

18.2.2024 kirjoittaja Kimmo Granqvist ROMTWOL on Suomen romanikielen automaattisen muoto-opin jäsennin. Se etsii siihen syötetylle sananmuodolle sanavartalon tai perusmuodon, jonka hyväksyttävä muoto se on. Samalla se kertoo, millaisista osista sananmuoto koostuu. Esimerkiksi romanikielen sana ”džeeno” ’mies’ analysoidaan ”^džeeno/’džeen$<n><sg><nom>$”, jossa <n> tarkoittaa sanaluokkaa substantiivi, <sg> yksikköä ja <nom> nominatiivisijaa. Jäsennin ei löydä analyysiä väärin kirjoitetulle tai …

Lue lisää

Kimmo Granqvist tietokoneella

Kieliteknologiaa Linuxilla: Suomen romanikielen automaattinen muoto-opin analysaattori ja korjausohjelma

Hankkeeni tavoitteena on kehittää Suomen romanikielen automaattinen muoto-opin analysaattori ja korjausohjelma. Muoto-opin analysaattorilla voidaan tunnistaa romanikielisiä sananmuotoja ja päätellä niiden perusmuodot, sanaluokat ja taivutusmuodot. Korjausohjelma auttaa kirjoittajaa löytämään tekstistään kirjoitusvirheet. Muoto-opin analysaattorin pohjana on Helsingin yliopiston emeritusprofessori Kimmo Koskenniemen 1980-luvulla kehittämä kaksitasomalli (Two-level Morphology, TWOL), joka soveltuu minkä tahansa kielen muoto-opillisen rakenteen mallintamiseen. Analysaattorin keskeiset …

Lue lisää