8.12.2007

Vekkulia łǿkäłïśóìñтíà Windowsissa


Katselin kotikoneeni suomenkielisen Windows XP:ni tapahtumienvalvontaa ja törmäsin siellä mielenkiintoiseen virheilmoitukseen: ”Ťнé рěя-ύşĕг ƒįłŧęŗ рθбℓ ƒǿř śėŝ§íθл 2 çόυłđ ňοт вє āđðέð <7007,1>.”

Windowsin työpöytähaun ohjelmoijat ovat selvästi käyttäneet vanhaa kikkaa, jossa puuttuva käännös korvataan tilapäisesti vinkuraenglannilla, kun testataan, ettei missään käyttöliittymän osassa ole ”kovakoodattuja” englanninkielisiä tekstejä. Tuskin tämän olisi kuitenkaan pitänyt tuotteeseen asti päätyä.

28.10.2007

Ota mamma mato

Kotiuduimme juuri Helsingin kirjamessuilta. Oikeastaan pidän enemmän rauhallisesta kiertelystä Akateemisessa tai divareissa kuin tällaisesta tungeksimisesta, mutta Suomalaisen Kirjallisuuden Seuran osastolta olen aina löytänyt jotain mielenkiintoista. Tällä kertaa tarttui vitosella mukaan Ulla Lipposen toimittama ja Mikko Lehmusvyöryn kuvittama mainio 762 kompatehtävän kokoelma Ota mamma mato isän ja tyttären iloksi. Pitäisikö kerätä koko kirjasarja?
225. Oli iso intiaani ja pikku intiaani. Iso intiaani oli pikku intiaanin isä, mutta pikku intiaani ei ollut ison intiaanin poika. Miten tämä oli mahdollista?

25.10.2007

TKO-äly 20 vuotta

Entinen ainejärjestöni TKO-äly täyttää 20 vuotta ensi vuonna ja yrittää näköjään etsiä myös meidät reikäkorttisaurukset mukaan juhlimaan. Jos oikein muistan, pystytin yhdistyksen ensimmäisen WWW-sivuston (tai Mosaic-sivuiksi niitä silloin taidettiin kutsua) 1990-luvun alkupuolella, kun HTML oli puuta ja nörtit rautaa. Löytyisiköhän sivusto vielä jostain levynnurkasta?

11.10.2007

Albania liittyy iloiseen Internet-perheeseemme

Sain eilen luullakseni elämäni ensimmäisen albaniankielisen roskapostiviestin. Virkistävä tuulahdus Välimereltä väärin kirjoitetun amerikanenglannin ja Det här är ett riktigt fint erbjudande -tiedotteiden lomassa?
To: silvonen@iki.fi
Subject: Tv Live shqip ne internet
From: [sensuroitu]
Date: Wed, 10 Oct 2007 13:04:14 -0400

Tash e tutje edhe ne internet Tv Shqiptare Live doni te shikoni kto tv kanale ne internet 100% SHQIP BBF KTV News24V RTK Tirana TV Vizion Plus Alsat TVSH vizito : [sensuroitu] ___________________________________________ MBAJE MEND

27.9.2007

Agile-seminaari Helsingissä ensi viikolla

Ketterän kehityksen harrastajat kokoontuvat taas Helsingissä keskiviikkona 3.10.2007: Agile Seminar Helsinki, Fall 2007. Vielä 178 paikkaa vapaana!

Toyotan opetuksista ja hukan poistosta olen kyllä nähnyt jo kaksi esitystä ennestään. Ekalla kerralla reaktioni oli ”hei, tämähän on mielenkiintoista” ja toisella kerralla (luettuani Poppendieckeja) ”hohhoijaa, tämä on jo kuultu”, mutta olisikohan Craig Larmanilla jotain uutta sanottavaa aiheesta? Muiden firmojen kokemuksista on joka tapauksessa aina mielenkiintoista kuulla.

23.9.2007

Wikia-haku: Googlen tappaja vai hakukoneharrastajien haihattelua?

Jimmy Walesin Search Wikia -hankkeen kehittämää Wikia-hakua on kutsuttu Suomessakin Googlen haastajaksi, mutta tuottaako hanke muuta kuin pilvilinnoja ja kauniita artikkeleita hajautetun hakukoneen rakentamisperiaatteista (sekä jonkinmoisen säkillisen riskirahaa)?

Vietin sunnuntai-iltapäivää lueskelemalla hankkeen wikiä, foorumia ja postituslistaa ja poistuin sekavissa tunnelmissa. Yleisvaikutelmaksi jäi tässä vaiheessa pieni keskustelukerho, jossa on mukana joitakin fiksuja ihmisiä, kourallinen innokkaita tekoälyhörhöjä ja jokunen pakollinen pessimisti. Jaksaako hanke nousta oikeasti siivilleen?

Wikia-haun kehittäjien oletuksena on, että Google ja muut suljetut hakukoneet ovat ”rikki”, mutta ovatko useimmat tavalliset käyttäjät oikeasti tätä mieltä? Google syrjäytti itse aikaisemmat hakukoneet tarjoamalla hakutuloksensa kilpailijoita selvästi fiksummin lajiteltuina, mutta riittävätkö haun avoimuus ja ”yhteisöllisyys” saamaan aikaan seuraavan sukupolvenvaihdoksen? Googlessa on toki puutteensa, mm. hieman ontuva kielituki, mutta ovatko ne olennaisia puutteita?

Odotan kuitenkin kiinnostuneena joulukuuksi luvattua Wikia-hakudemoa.

19.9.2007

Uusi nimi, vanhat kujeet

Outokäynti kielitty oli vähän hankala nimi blogille, enkä ehtinyt koskaan ottaa valokuvaa kotitalomme seinässä olleesta vandaalin raaputtamasta ”Joutokäynti kielletty” -kyltistä, johon nimi perustui. Huoltoyhtiö innostui riipimään sen irti vain paria päivää ennen suunnittelemaani kuvaussessiota.

Hassua, ettei Google löytänyt yhtään osumaa hakusanalla höperavaruus. Olenko tosiaan itse keksinyt näin tarpeellisen sanan?

Jos ei muusta ole asiaa, aina voi kirjoittaa omasta blogistaan.

15.8.2007

Kontaktimuovi imee sukkaa

Tyttären koulukirjojen päällystäminen kontaktimuovilla on viheliäistä puuhaa hellepäivänä töiden jälkeen, vaikka vaimo tekikin suurimman osan työstä. Tarjoaisikohan joku tätä palveluna?

Harmi, etten löytänyt Hämeenlinnan kirjaston ohjetta Muovita ilman kyyneleitä jo ennen ensimmäisiä koekappaleita; pitää testata sitä seuraavalla kerralla. Mutta mistä mahtaisi löytää ohjeessa mainittua mahdollisimman paksua kontaktimuovia?

15.6.2007

Hujambo, bwana!

Entinen työnantajani Lingsoft lisensoi hiljattain swahilin kielen tarkistimen Microsoftille. Tie kaupallistamiseen on ollut pitkä. Osallistuin itsekin hieman tarkistimen alkukehitysvaiheeseen 1990-luvulla, ja silloin se oli vain hauska kuriositeetti kielivalikoimassamme.

Swahilin tarkistimen purkittaminen uskottiin aikoinaan sattumalta saksan tiimimme vastuulle. Vasta jälkeenpäin keksin poliittisesti epäkorrektin selityksen valinnalle: swahilia puhuttiin myös Saksan Itä-Afrikassa.

11.6.2007

IBM ostamassa Telelogicin

Digitodayn mukaan IBM aikoo ostaa Telelogicin ja yhdistää sen tuotteet Rational-tuoteperheeseensä. En tiedä, onko tämä hyvä uutinen asiakkaan kannalta: yritykset olisivat voineet hyvin toimia toistensa kirittäjinä, mutta nyt tuloksena saattaa olla laiskahko monopoli.

Mielenkiintoista nähdä, millainen ryminä suurelta osin päällekkäisten tuoteperheiden yhdistämisestä seuraa. No, ainakin IBM saa piristystä vaatimustenhallintatuotteisiinsa, joissa Rational RequisitePro on ollut DOORSia heikompi esitys.

31.5.2007

Uneksivatko nörtit tietokoneista?

Näkevätkö ohjelmoijat muita useammin vai harvemmin unia tietotekniikasta? Kollegani Lingsoftissa kertoi kerran Microsoft-projektin hikisimmässä vaiheessa nähneensä unta, jossa hän oli DLL:n sisällä, mutta itse en muista, uneksinko koskaan mistään tietokoneisiin liittyvästä aktiiviohjelmointiaikoinanikaan.

Tämä olisi ehkä selvinnyt Googlella, mutta Google-haku on lopettanut liiankin monta ihmettelyä alkuunsa.

29.5.2007

Saamen oikeinkirjoituksen tarkistus

Saamen kielen työkaluja kehittävä Divvun-projekti on julkaissut tänään pohjois- ja luulajansaamen oikeinkirjoituksen tarkistimiensa ensimmäiset beetaversiot. Ohjelmat toimivat Microsoft Officen Windows- ja Macintosh-versioissa.

4.5.2007

Prototaksiiteista tippaleipiin

Muistaakseni olin vielä pari vuotta sitten hyvin skeptinen suomenkielisen Wikipedian suhteen ja mietin, onko Suomessa ylipäätään tarpeeksi kirjoitustaitoista ja -haluista väkeä tällaiseen hankkeeseen, mutta (ihme kyllä!) Wikipediasta on tulossa jos ei nyt aina luotettava lähdeteos niin ainakin kirjoittajiaan sivistävä häkkyrä.

Kieltenvälisiä linkkejä lisätessäkin saa toisinaan pieniä ahaa-elämyksiä: viimeksi opin, että tippaleipiä syödään myös Itävallassa, Etelä-Saksassa ja Yhdysvalloissa ja että ruotsin struva on Suomessa yleensä tippaleipä, mutta Ruotsissa rosetti.

Prototaksiitit (Prototaxites) olivat muuten muinaisia jättiläissieniä, joista kerrotaan nyt Wikipediassa englanniksi, suomeksi ja esperantoksi.

5.4.2007

NEALT: Northern European Association for Language Technology

Pohjois-Euroopan kieliteknologien yhdistys NEALT (Northern European Association for Language Technology) on saanut vihdoin valmiiksi liittymislomakkeensa. Sivut ovat vielä hieman karut, ja Wiki on suunnitteilla ”tammikuuksi 2007”, mutta ehkä tämä poikii vähitellen jotain uutta, mielenkiintoista toimintaa. Jätin jo jäsenhakemukseni.

31.3.2007

Kikin lähettipalvelu Lasten Cinemassa

Perheenisänä olossa on se hyvä puoli, että pääsee katsomaan lumoavia lastenelokuvia. Tänään oli vuorossa Hayao Miyazakin Kikin lähettipalvelu aina yhtä viihtyisässä Lasten Cinemassa. Sonja piti kovasti ja isäkin nautti: aikuiskatsoja sai lisähupia elokuvan oudon tutusta kaupungista, jossa yhdistyivät usean eurooppalaisen kaupungin näkymät ja eri vuosikymmenten esineet ilmalaivoista transistoriradioihin. Leena Virtasen havaitseman Birger Jarls torg -kyltin lisäksi luulen nähneeni ainakin Visbyn muureineen ja ruusuineen.

Miksihän hurahdimme näihin 1980-luvun elokuviin vasta 2000-luvulla?

27.3.2007

CMMI-esiarviointi valmistui

Tuotekehityksemme CMMI-esiarviointi on onnellisesti ohi. Mitään suuria yllätyksiä ei löytynyt, vaan ehdotetut parannuskohteet olivat samoja, joista olemme itsekin puhuneet. Kiitostakin saimme mm. DOORS-pohjaisesta vaatimustenhallinnastamme ja testaustiimimme tuottamista automaattisista tilastoista intranetissä: ohjelmiston laadun kehittymistä ja vaatimusten valmiusastetta on nykyään varsin näppärä seurata.

Vielä ei sentään oltu CMMI:n kakkostasolla, vaan kaikkia käytäntöjä pitäisi hieman skarpata. Saisikohan käyttötapaukset ujutettua yhdeksi tekniikaksi vaatimustenhallintaamme?

13.3.2007

Gorb: sala-ampujan toiveuni?

Haluatko kehua tai kritisoida jotakuta nimettömänä? Tässä kuussa alfatestaukseen tulleessa The GORB -palvelussa voit antaa hänelle palautetta ja pisteitä yhdestä kymmeneen henkilökohtaisesta käytöksestä ja suoriutumisesta työssä. Pisteet ovat kaikkien nähtävissä, ja niitä voi antaa kenelle tahansa sähköpostiosoitteen omistavalle ilman tämän lupaa. Lisäksi voi kertoa mielipiteensä muiden käyttäjien antamista pisteistä.

Kauniina ajatuksena on ilmeisesti ollut perustaa totuudenmukaisempi foorumi kuin jokin LinkedIn ja muut keskinäisen kehumisen kerhot. Aika näyttää, tuleeko Gorbista muuta kuin iso likasanko, vai katoaako sivusto vähin äänin verkosta, kun ensimmäiset kunnianloukkaussyytteet nostetaan.

9.3.2007

Hirviömäistä suomea

Kun ”maailman johtava Internet-rekrytointipalvelu” suomennetaan nopeasti ja halvalla, syntyy outoa jälkeä. En ole vieläkään jaksanut selvittää Monster.fi:n toimialaluokituksen mysteerejä: Onko ohjelmistokehitys tietotekniikkaa vai ”IT:tä”, vai tarkoittaako IT jotain uusmediahöhää kuten suomalaisen lehdistön jutuissa? ”Eläinlääkäri palvelut”, ”tietokone palvelut” ja ”ympäristö palvelut” ovat jo jotenkin hellyttäviä. Kai tässä luokituksessa on ollut järkeä amerikaksi, mutta järki on kadonnut lappeen Rannan Käännös Toimiston käsittelyssä.

En lupaa jättää ilmoitusta, jos Monsterin kieli korjataan vähemmän hirviömäiseksi, mutta ainakin lupaan harkita...

Myykää Googlelle yhdyssanojen tunnistus

Väitin Googlen osaavan nykyään suomen kielen taivutusmuodot ja yhdyssanat, mutta ei se sentään yhdyssanoja osaa, ellei niihin ole lisätty tavutusvihjeitä, ja taivutusmuotojen tunnistus on myös aika vaillinainen. Joku voisi nyt myydä Googlelle paremman morfologiakomponentin; firma ei tosin ole aiemmin juurikaan panostanut kieliteknologiaan.

8.3.2007

Google osaa suomen taivutusmuodot

Tajusin juuri, että Google osaa nykyään suomen kielen taivutusmuodot ja yhdyssanat, ainakin jos sitä käyttää suomenkielisillä asetuksilla: jos annan esimerkiksi hakusanan konsultointi, Google löytää mm. sanat konsultoinnista ja kieliteknologiakonsultointia. Milloinhan tämä ominaisuus on lisätty? Näköjään se on ollut käytössä jo ainakin tammikuussa. Olen tainnut itse hakea viime aikoina tietoa enimmäkseen englanninkielisillä hakusanoilla, eikä Google itse ole pitänyt melua parannuksesta, vaikka ”suomalaisen ymmärtäminen” on yksi kilpailevan www.fi:n myyntivalteista.

Kukahan on tehnyt Googlelle morfologiapalikan? Yleensä valmistajan voi tunnistaa jonkin sanastossa olevan pienen erikoisuuden perusteella; pitääpä testailla...

22.2.2007

Löysin CMMI-mallin kätketyn tason

...ja sain miljoona bonuspistettä!

(Aprillia! Pitihän tähän jotain piristystä keksiä.) Valmistelen töissä yksikkömme ensimmäistä CMMI-esiarviointia. Kaksi Philipsin arvioijaa saapuu Vantaalle haastattelemaan tuotekehittäjiämme muutaman päivän ajaksi ja lausuu sitten arvionsa työtapojemme toimivuudesta ja CMMI-mallin mukaisuudesta.

Philips on käyttänyt ohjelmistokehitysprosessin parantamisessa mittatikkuna jo pitkään vanhaa SW-CMM-mallia, mutta nyt on tulossa käyttöön CMMI koko tuotekehityksessä. Pari vuotta sitten silloisen ohjelmistoprojektin työtavat olivat omasta mielestämme suurin piirtein SW-CMM:n kakkostason mukaisia ja olimme jopa suht tyytyväisiä prosesseihimme, mutta nykyinen projektimme on erilainen kuin entiset monellakin tapaa. Mielenkiintoista nähdä, millaisen tuomion saamme.

11.2.2007

Studiokahvila Pensseli ja Kuppi

Kävimme eilen tyttäremme Sonjan kanssa maalaamassa biskvii-keramiikkaa ja syömässä porkkanakakkua Studiokahvila Pensselissä ja Kupissa Eerikinkadulla. Mukava paikka, ja vieraskirjakin pursui kehuja sivu toisensa jälkeen. Hauskaa, että tällainen liikeidea on saatu toimimaan Helsingissäkin!

Yritys ei ole tosin Suomen ensimmäinen tällä alalla, kuten MTV3 väittää: Yrjönkadulla toimi Keramiikkapaletti aika samanlaisella konseptilla vielä vuonna 2004, kun järjestimme siellä Sonjan synttärit.

3.2.2007

Tmi Mikko Silvonen

Kaikkea pitää kokeilla ainakin kerran, miksei siis myös yrityksen perustamista: kekseliäästi nimetty konsultointiyritys Tmi Mikko Silvonen on syntynyt. Vielä yksi suomalainen kieliteknologiafirma siis edellisten lisäksi! Kohta yrityksiä on enemmän kuin kieliteknologeja.

Tuskin tästä miljoonabisnestä heti tulee, sivutoiminen harrastus pikemminkin. Tarjotkaapa keikka, niin saan ostettua verkkotunnuksen. :) [No eihän tuo paljon maksanutkaan: www.mikkosilvonen.fi.]

1.2.2007

Suomen kielen sanalista

Kotimaisten kielten tutkimuskeskus on julkaissut LGPL-lisenssillä yli 94 000 tietuetta sisältävän nykysuomen sanalistan, jota voi käyttää tietokoneohjelmien ja suomenkielisten käyttöliittymien kehitystyössä. Lista sisältää myös taivutustiedot, muttei yhdyssanarajoja. (Kiitos vinkistä RW:lle!)

Friteeratut banaanit ja jäätelö

Illastimme eilen työpaikan kiinalaisten vieraiden kanssa Ravintola Chinassa. Jälkiruoaksi tarjottiin tietenkin friteerattuja banaaneja ja jäätelöä. Aloimme arvailla, missä ja milloin tämä Suomen kiinalaisravintoloiden standardijälkiruoka on keksitty. Kiinassa ruokalaji on tuntematon, eivätkä makeat jälkiruoat ole muutenkaan oikein kuuluneet sikäläiseen kulttuuriin. Ehdimme pohdiskeluissamme jo Pohjois-Amerikan chinatowneihin, mutta kotona pienellä haeskelulla selvisi, että Kiinan eteläpuolella herkutellaan friteeratuilla banaaneilla, jotka tunnetaan malaijinkielisellä nimellä pisang goreng.

Olisikohan tämä jälkiruoka sitten alun perin ollut kiinalais-malesialaisten tai -indonesialaisten ravintoloiden ruokalistoilla? Ja milloin jäätelöpallo ilmestyi mukaan annokseen? Friteerattujen banaanien historia odottaa kirjoittajaansa.

27.1.2007

Kalle Kotipsykiatri

Wikipediaan on ilmestynyt artikkeli Kalle Kotipsykiatrista, Commodore 64:ssä 1980-luvulla toimineesta mainiosta keskusteluohjelmasta. En muistanutkaan, että ohjelman oli kirjoittanut Jyrki J. J. Kasvi.

Ah, nostalgiaa... Olin nimittäin yksi artikkelissa mainituista MikroBitin toimituksen rikkoman Kallen korjaajista. Korjasin muistaakseni ainakin lauseiden muuntamisen minämuotoisista sinämuotoisiksi tyyliin ”Minulla on ongelma.” ”Miksi sanot, että sinulla on ongelma?”, joten tämä oli kaikkien aikojen ensimmäinen kieliteknologiaohjelmointityöni.

26.1.2007

Ohjelmistotuotantoblogi ryhmätyönä?

Nimimerkki Teme ehdotti ryhmätyönä kirjoitettavan ohjelmistotuotantoblogin perustamista. Olisikohan sellaiselle sosiaalista tilausta? Ja olisiko suomalaisessa blogosfäärissä (tulipa tuokin sana kerran kirjoitettua) tarpeeksi kirjoittajia tällaiseen hankkeeseen? Vaikka ehkä kaikki haluavat säästää nerokkaimmat ideat omiin julkaisuihinsa.

18.1.2007

IEC 62304 tulee

Lueskelen taas standardia IEC 62304: Medical device software – Software life cycle processes. Standardissa kuvataan, millaista lääketieteellisten laitteiden ohjelmistokehityksen, testauksen, ylläpidon, riskinhallinnan, konfiguraationhallinnan jne. tulisi olla potilasturvallisuuden takaamiseksi.

Suurin uutuus tässä standardissa lienee ohjelmiston ja sen osien jakaminen turvaluokkiin A, B ja C sen mukaan, millaisia seurauksia ohjelmiston viasta voi olla potilaan terveydelle. Vähemmän vaaralliset osat voidaan sitten dokumentoida ja testata hieman kevyemmin. C-luokassa pitää jo miettiä sitäkin, voisiko riskejä pienentää jakamalla ohjelmisto pyörimään eri suorittimille.

Alan standardit ovat menossa yksityiskohtaisempaan suuntaan, mutta taataanko tiptop-kunnossa olevalla prosessilla turvallisuus? Olennaista on myös tuotteen kehittäjien ja projektinjohdon ammattitaito ja asenne turvallisuutta kohtaan, mutta niitä olisikin jo vaikeampi standardoida.

Olisi joskus mielenkiintoista verrata kehitysprosessiamme muiden turvakriittisten alojen prosesseihin. Miten kehitetään koodia vaikka ydinvoimaloiden järjestelmiin?

15.1.2007

Telelogic DOORS -projekti

Pitäisi kirjoittaa projektisuunnitelma firman Telelogic DOORS -vaatimustenhallintaohjelmiston käyttötapojen ja koulutuksen kehittämisestä ja pohdiskella DOORS/Net-liittymän käyttöönottoa.

Käyttääkö kukaan lukijoistani DOORSia tai jotakin muuta Microsoft Officea edistyneempää vaatimustenhallintatyökalua? (Ja onko minulla yhtään lukijaa? :) SoftQA:n suomenkielinen Vaatimustenhallinnan työkalut -foorumi on ainakin ollut varsin hiljainen. Armeija sentään marssii Telelogicin tahtiin: Maanpuolustuskorkeakoulun Vaatimusten hallinta -kurssilla esitellään DOORSin käyttöä.

Maailman käytetyin vaatimustenhallintaohjelmisto on kuulemma Microsoft Excel, mutta lääketieteellisen tai muun turvakriittisen laitteen kehittäminen olisi kovin tuskaista ilman kunnon linkitystyökaluja, kun laitteen riskilistasta pitää päästä helposti vaatimuksiin, toteutukseen ja testaukseen. Olemme olleet suht tyytyväisiä DOORSiin, vaikka sen käyttöliittymä voisikin olla intuitiivisempi. Ohjelmasta puuttuu oikeastaan yksi abstraktiotaso, joka tekisi sen helpommin ymmärrettäväksi vaatimusten kirjoittajalle. Tämä puute toki lisää konsulttien ja kouluttajien työllisyyttä.

13.1.2007

IBackup for Windows International Edition

En ollut tajunnutkaan, että aiemmin mainitsemassani IBackup-varmuuskopiointipalvelussa oli jotain häikkää ääkkösiä tai muita epäamerikkalaisia merkkejä sisältävien tiedostonimien kanssa. Nyt ongelma on korjattu IBackup for Windows International Edition -asiakasohjelmalla. Outoa, että ohjelmasta pitää olla erikseen amerikkalainen ja kansainvälinen versio, kun Unicode on ollut olemassa jo jonkin aikaa, mutta ehkä firman ohjelmoijat eivät usko tämän kansainvälisen version vielä toimivan?

Asiakasohjelman päivitys hävitti jostain syystä edellisessä versiossa säätämäni asetukset, mutta onneksi en ollut ehtinyt rukata niitä enemmälti. Tämä kansainvälinen versio sekoilee näemmä edelleen päiväysmuotojen kanssa. Bongasin ohjelmasta ainakin kolme erilaista muotoa: 01-13-2007, 01.13.2007 ja 13.1.2007. Pitänee raportoida firmalle; palvelu on ollut muuten ihan toimivan tuntuinen, mutta asiakasohjelma on tosiaan hieman kirveellä veistetyn oloinen.

11.1.2007

Kieliteknologiaeläkeläinen muistelee: Ruotsalaisen saukon ongelma

Kielipalikoiden tekeminen Microsoftille oli ajoittain rankkaa työtä höyrypäisine pizza-cola-suklaakeksi-vetoisine koodausmaratoneineen ja öisine debuggauskeikkoineen, mutta oli siinä hauskatkin hetkensä (tai oudot, miten sen nyt ottaa).

Vuonna 1996 syntyi Meksikossa pieni skandaali espanjan kielen synonyymisanastosta, joka tarjosi mm. intiaanin synonyymiksi ihmissyöjää. Laineet löivät Suomeen asti, ja mekin jouduimme siivoamaan sanastojamme rasistisista tai muuten rumista sanoista. Periaatteena oli, että oikeinkirjoituksen tarkistin saa hyväksyä ruman sanan, muttei koskaan ehdottaa sellaista. Synonyymisanastossa taas pitää välttää loukkaavia synonyymiehdotuksia. Poliittisesti korrektia tavutusta ei sentään tarvittane. Merkitsimme talkoilla kaikki rumat sanat sanastoihimme ¤-merkillä (jolle oli tietysti keksitty oma painokelvoton nimi).

Vaikein kanto kaskessa olivat yhdyssanat, joissa viattomat osat saattavat muodostaa törkeän yhdistelmän. Koska sanastossamme yhdyssanat muodostettiin yleensä osista, yhdyssanoille piti rakentaa ihan oma sensuurimekanismi. Kohta pyörittelimme Microsoftin suomalaisen tuotepäällikön kanssa listaa, johon yritimme kerätä mahdollisimman monta törkeää yhdyssanaa. Opin pari ihan uuttakin solvausta.

Luulin jo puuhan olevan onnellisesti ohi, kunnes microsoftilaiset huomasivat yhden ruman otuksen päässeen läpi: oikeinkirjoituksen tarkistimen sai yhä ehdottamaan sanaa Per-saukko. Yritin selittää ongelman pois väittämällä, että ruotsalaisessa eläintarhassa voisi hyvin olla saukko nimeltä Per, mutta ei auttanut: Per-saukko piti päästää päiviltä. Ongelma tunnettiin myöhemmin nimellä the Swedish Otter Problem.

10.1.2007

IBackup ja varmuuskopiointi verkkoon

Kyllästyin ennen joulua kotikoneeni (noin 4 gigatavua roinaa) varmuuskopiointiin DVD:ille ja aloin tutkailla verkosta löytyviä varmuuskopiopalveluita. Amazon.comin S3-tallennuspalvelua käyttävä Jungle Disk näytti tolkuttoman halvalta, mutta rekisteröinnissä meni jokin mönkään, eikä Amazonin palvelu vahvistanut automaattisesti luottokorttitietojani. Odotellessa alkoi sitten arveluttaa, kannattaisiko varmuuskopiointia toteuttaa autotallifirman (?) kehittämällä ilmaisohjelmalla.

Nyt olen testaillut muutaman viikon ajan IBackup-palvelua, joka on toiminut muuten hyvin, mutta asiakasohjelmaan on jäänyt joitakin hieman häiritseviä lokalisointiongelmia päivämäärämuotojen yms. kanssa. Ohjelman valmis System State Backup -toiminto ei ole kuitenkaan suostunut lainkaan toimimaan, johtuneeko sitten kotikoneeni suomalaisista asetuksista tai kuun asennosta. Olisikohan tämä nyt hintansa arvoinen palvelu (7,66 €/kk minun tallennusmäärilläni ja nykyisellä dollarin kurssilla), vai onko joku vertaillut palveluita laajemmin? Jonkin verran kannattaa mielestäni maksaa jo siitä, ettei firma mene heti konkurssiin tai lopeta palveluaan.

Paranoidi voisi tietysti vielä miettiä, ketkä pääsevät käsiksi toiselle puolelle maailmaa tallennettuihin tiedostoihin...

9.1.2007

Taas yksi kieliteknologiayritys

Vanhat työkaverini Pasi (Soikko-ohjelman tekijä) ja Eleonoora ovat pystyttäneet oikoluku- ja tavutusohjelmapajan nimeltä Sanalogia. On hämmästyttävää, miten monta kieliteknologiayritystä tämän kokoiseen maahan mahtuu (Lingsoft, Kielikone, Connexor, Master's Innovations...) ja miten päällekkäisiä tuotteita ne ovat usein kehittäneet. Antti Arppen artikkelin Ei yhtä ainoaa polkua mukaan Suomessa on kehitetty neljä suomen kielen lingvististä mallia, mutta Sanalogian ja Voikko-ohjelman käyttämät mallit nostavat luvun jo kuuteen.

7.1.2007

Lasten Cinema

Lasten Cinema Helsingin Dianapuiston kupeessa on mainio paikka pienten lasten ensimmäisille elokuvakäynneille: rauhallisempi kuin keskustan megaviihdepalatsit ja satumaisesti sisustettu vessoja myöten. Tytär halusi tänään sinne katsomaan Totoroa jo toista kertaa. Käykää ihmeessä tutustumassa!