3.1.2008

Haaveiletko, unelmoitko, rakennatko pilvilinnoja?

Käyttääköhän kukaan Microsoft Wordin synonyymisanastoa (Word 2003: Työkalut > Kieli > Synonyymisanasto tai Vaihto+F7)? Epäilen sen kuuluvan siihen 80–90 prosenttiin ohjelman ominaisuuksista, joita tavallinen käyttäjä ei ole koskaan hoksannut tai edes kaivannut.

Jos joku kuitenkin eksyy synonyymisanastoon, nykykäyttäjästä tuntuu ehkä itsestään selvältä, että Word (ts. Lingsoftin sanasto) tunnistaa myös suomenkielisten sanojen taivutusmuodot ja osaa listata ehdotuksensa oikeassa muodossa. Tähän tarvitaan kuitenkin kahta kieliteknologian menetelmää: morfologista analyysia (taivutusmuotojen tunnistamista ja perusmuotoon palautusta) ja morfologista generointia (taivutusmuotojen tuottamista). Esimerkiksi sanan haaveiletko synonyymit tuottuvat seuraavasti:
  1. Morfologinen analyysi: Tunnista sana haaveiletko verbin haaveilla aktiivin preesensin yksikön toisen persoonan kysymysmuodoksi.
  2. Hae verbin haaveilla synonyymit, mm. rakentaa pilvilinnoja.
  3. Morfologinen generointi: Tuota ilmauksen rakentaa pilvilinnoja aktiivin preesensin yksikön toisen persoonan kysymysmuoto rakennatko pilvilinnoja.
Taivuttava synonyymisanasto sopii mielestäni myös esimerkiksi kieliteknologiatuotteita toisinaan vaivaavasta ongelmasta: kun tavallinen käyttäjä tutkii tuotetta, hänen on hyvin vaikea ymmärtää, miten paljon työtä sen tekeminen vaatii. Tässäkin tapauksessa itse synonyymisanaston lisäksi tarvitaan suomen kielen sanasto taivutusmalleineen ja ohjelmakoodi analysointia ja generointia pyörittämään. Mikä olisi taivuttavan synonyymisanaston oikea hinta?

1 kommentti: