Viime vuonna FUUG avokätisesti myönsi minulle 1500 euron apurahan Suomen kielen komponenttien dokumentointiin ja open sourcettamiseen. Olinkin niistä jo jonkin verran kirjoitellut aiemmin, tämä apuraha mahdollisti työn laajemman dokumentoinnin ja sen osien tuunaamisen open source -muotoon julkaistavaksi.
Tässä linkkejä (työn tuloksiin):
Suomen kielen part of speech tägäys kompontin kehittelyä
Samaisen komponentin pidemmälle kehittelyä
Sanavektorien virittelyä suomen kielellä
Topic model mallien virittelyä suomen kielellä
Alkuperäisessä artikkelissa mainitun Valtuustopilvi hakukoneen toteutuksen kuvaus
Yllä olevat eivät välttämättä ole täydellisiä komponentteja suoraan kaikkeen sovellettavissa. Sellaista se NLP monesti on. Mutta niistä saanee hyvät pohjat lähteä kehittelemään ja soveltamaan aihealuetta suomen kielelle eteenpäin.
Hyvää kesää kaikille!
Teemu