Suomi NLP: näin siinä kävi

Viime vuonna FUUG avokätisesti myönsi minulle 1500 euron apurahan Suomen kielen komponenttien dokumentointiin ja open sourcettamiseen. Olinkin niistä jo jonkin verran kirjoitellut aiemmin, tämä apuraha mahdollisti työn laajemman dokumentoinnin ja sen osien tuunaamisen open source -muotoon julkaistavaksi. Tässä linkkejä (työn tuloksiin): Suomen kielen part of speech  tägäys kompontin kehittelyä Samaisen komponentin pidemmälle kehittelyä Sanavektorien virittelyä …

Lue lisää

Luonnollisen kielen prosessointia suomalaisittain

Koneoppiminen, tekoäly, luonnollisen kielen prosessointi (Natural Language Processing, NLP). Trendikkäitä sanoja, jopa ns. hype-termejä, joiden pohjalta toivotaan mullistavia tuloksia automatisointiin ja älykkäisiin palveluihin. Nyt tällä hypellä on kuitenkin hieman pohjaakin. Suomen kielellä on omat erikoisuutensa ja se on pienehkö erikoisalueensa maailmalta katsottuna. Siksi sille ei aina ole niin suurta tukea näille viimeisimmille teknologioille tai viimeisimpiä ohjelmistokirjastoja …

Lue lisää