Suomi NLP: näin siinä kävi

Viime vuonna FUUG avokätisesti myönsi minulle 1500 euron apurahan Suomen kielen komponenttien dokumentointiin ja open sourcettamiseen. Olinkin niistä jo jonkin verran kirjoitellut aiemmin, tämä apuraha mahdollisti työn laajemman dokumentoinnin ja sen osien tuunaamisen open source -muotoon julkaistavaksi.

”Valtuustopilvi” esimerkki

Tässä linkkejä (työn tuloksiin):

Suomen kielen part of speech  tägäys kompontin kehittelyä

Samaisen komponentin pidemmälle kehittelyä

Sanavektorien virittelyä suomen kielellä 

Topic model mallien virittelyä suomen kielellä

Samaa vielä vähän lisää

Näiden tekemiseen koodeja

Alkuperäisessä artikkelissa mainitun Valtuustopilvi hakukoneen toteutuksen kuvaus

Yllä olevat eivät välttämättä ole täydellisiä komponentteja suoraan kaikkeen sovellettavissa. Sellaista se NLP monesti on. Mutta niistä saanee hyvät pohjat lähteä kehittelemään ja soveltamaan aihealuetta suomen kielelle eteenpäin.

Hyvää kesää kaikille!

Teemu

Jätä kommentti