1 / 27

Case Kielikone

Case Kielikone. Kieli koneeseen. Kieliteknologian kaupallistaminen Kielikoneen tapaan. Sisällys. Intro Oma tausta Kielikone past & present Kieliteknologian kaupallistamisesta Yhteenveto Demoja & keskustelua. Minä itse. Opinnot HY:ssä 1987-1994

carolena
Télécharger la présentation

Case Kielikone

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. Case Kielikone Kieli koneeseen.Kieliteknologian kaupallistaminen Kielikoneen tapaan

  2. Sisällys • Intro • Oma tausta • Kielikone past & present • Kieliteknologian kaupallistamisesta • Yhteenveto • Demoja & keskustelua

  3. Minä itse • Opinnot HY:ssä 1987-1994 • engl. filologia ja yleinen kirjallisuustiede • pro gradu: Sexual/Textual Identity: The Works of Kathy Acker in the Intersection of Postmodernism and Feminism • Kielikoneessa 1989  • kielellinen kehityspäällikkö, viestintäpäällikkö (o.t.o.)

  4. Kielikoneen tausta • Kielikone-projekti Sitrassa 1982, vetäjänä Harri Arnola • Morfo 1984, tuotantovalmis 1986 (Tekoplus) • jäsennin työn alla alkaen 1983 • synonyymisanakirja (WSOY 1988) • Kielikone Oy 1987: Morfo, DOS-termipankki, DOS-Virkku

  5. Kielikone-projekti siirtyy tutkimaan konekääntämistä, su-en-sanakirja • Kielikone Oy: Morse  MOT • Projekti ja Kielikone Oy yhdistyvät -92 • Kultaa ja kunniaa: • 1992: Tietotekniikan kansallinen suurpalkinto (Virkku) • 1994: Kuukauden avainteko (TranSmart) • 1996: Oiva (TranSmart)

  6. Kielikone tänään • kehittää kieliteknologiaa (geneerisiä prosesseja, tietokantoja ja kehittimiä) • kehittää kieliteknologiatuotteita • markkinoi kieliteknologiatuotteita • lisensoi kieliteknologiaa

  7. Kielikone-konserni

  8. Tuotealueet • Kielenhuolto-ohjelmistot: Morfo ja Virkku • Digitaaliset sanakirjat: MOT ja Dictor • Termipankkiohjelmat: TermIt • Konekäännösohjelmistot: TranSmart • Kieliteknologia

  9. WinMorfo • Tehokas ja tarkka suomen kielen oikaisu-lukuohjelma, joka toimii yleisimpien Windows-tekstinkäsittelyohjelmien kanssa. • Käyttäjä voi poimia luettelosta todelliset kirjoitusvirheet ja opettaa WinMorfolle uusia sanoja. • Sisältää HyperTavu-älytavuttimen, joka tavuttaa hankalatkin yhdyssanat oikein.

  10. WinVirkku • “Kapulakielen leppymätön vihaaja” • Oikaisuluvun lisäksi kattava kielenhuolto. • Käyttäjä voi valita haluamansa tarkistukset. • Huomauttaa kieliopillisista puutteista ja tyylin heikkouksista, kuten esimerkiksi • kaksoispassiivista • toistosta • kuluneista ilmaisuista

  11. MOT Sanakirjasto • Ammattikäyttöön kehitetty sanakirjasto. • Selkeän käyttöliittymän takana aina sopiva valikoima sanakirjoja. • Älykkäät hakuominaisuudet. • Sopii ympäristöön kuin ympäristöön: DOS, Windows, Macintosh ja UNIX. • Yleiskielen sanakirjat, tekniikan ja kaupan sanakirjat sekä erikoisalojen sanakirjat. • Kielet: suomi, ruotsi, englanti, saksa, ranska, venäjä, espanja, portugali, tanska ja latina.

  12. Dictor • Kompakti ja helppokäyttöinen viisikielinen sanakirjaohjelma Windows-ympäristöön. • Kielet: suomi, englanti, ruotsi, saksa, ranska, mukana kielioppitietoa. • Käyttöliittymän kielen voi valita. • Oma sanasto. • Sopuhintainen mutta laadukas työkalu kotiin, kouluun tai työpaikalle.

  13. TermIt • Ensimmäinen kotimainen termipankki-ohjelmisto. • Monipuolinen työkalu termistöjen luomiseen, ylläpitoon ja käyttöön. • Sopii niin amatöörille kuin ammattilaisellekin. • TermIt-ohjelmaan voi liittää myös valmiita kaupallisia termistöjä (esimerkiksi SFS).

  14. TranSmart • TranSmart-konekäännösjärjestelmä kääntää automaattisesti suomesta englantiin. • Tuottaa raakakäännöksen, jota käyttäjä voi muokata tarpeen mukaan. • Integroituu täydellisesti Windows-tekstinkäsittelyohjelmaan. • Yritysasiakkaille suunnattu.

  15. Kieliteknologia • Sanaprosessit: Morfo, Formo, Hahmotin, HyperTavu • Virkeprosessit: DCParser, TextMorfo • Tietokannat: suomen kielen synonyymit, kaksikieliset sanastot • Kehittimet: KMTech, kehitysympäristöt

  16. Kieliteknologiset sanaprosessit • Morfo - täydellinen suomen kielen sananmuotojen analyysiohjelma. • Formo - täydellinen suomen kielen sananmuotojen tuotto-ohjelma. • Hahmotin - suomenkielisten hakuvartaloiden tuotto-ohjelma. • HyperTavu - suomen kielen laatutavutin.

  17. Kieliteknologiset virkeprosessit • DCParser - suomen kielen virkkeiden täydellinen jäsenninohjelma, joka tekee ns. dependenssijäsennyksen. • TextMorfo - yhdistää Morfon ja DCParserin tekstinhallinnan tarpeisiin • tuottaa sananmuodoille yksikäsitteiset perusmuodot • osoittaa nominaaliset lausekkeet • osoittaa lauseenjäsenet

  18. Kieliteknologiset tietokannat • Suomen kielen synonyymisanasto • Kaksikieliset sanastot: • suomi-englanti-suomi • suomi-ruotsi-suomi • suomi-saksa-suomi • suomi-ranska-suomi • suomi-venäjä-suomi • ruotsi-venäjä-ruotsi

  19. Kieliteknologiset kehittimet • KMTech - konekäännösjärjestelmän kehitysympäristö. • Digitaalisten sanakirjojen kehitin. • Dependenssijäsentimen kehitin. • Älykäs käännösmuisti.

  20. Kieliteknologian kaupallistamisesta • Teknologiaa kahden tyyppistä: uutta ja vanhaa. • Kehitysnopeus huikea - päivityksissä jo kädet täynnä työtä. • Tie protosta ja pakettiin on pitkä ja mäkinen: tuotekonsepti voi muuttua monta kertaa. • Epätäydellisen tuotteen ongelma. • Uuden tuotteen ongelma: asiakas ei ehkä vielä tiedä tarvitsevansa sitä.

  21. Mitä onnistumiseen tarvitaan? • laadukas kieliteknologiainnovaatio • ihmisiä (i,l,m) jotka uskovat siihen • hyviä sovellusideoita • pragmaattista otetta • nöyryyttä: valmiutta tehdä asia uudestaan toisella tavalla • kykyä ottaa käyttäjä huomioon aina • munkkia (Tekoplus, Windows MOT, jm) • MT: rohkeutta olla myymättä

  22. Kielikoneen sisukset • 12 työntekijää (+ Wordmark ja Käännöskone) • kielellinen kehitys: 4 lingvistiä • ohjelmistonkehitys: 5 ohjelmoijaa • hallinto ja tuotanto: 2 henkilöä • koulutustausta: • lingvistit: 2 engl. filologia, 1 suomen kielen maisteri (OY) ja 1 muinaiskreikkateologi • ohjelmoitsijat: 4 TKK:lta, 1 HY:ltä • 1 ekonomi, 2 merkonomia • Ganesa Oy (1 PhD)

  23. Liikevaihto (MFIM) ja henkilöstömäärä

  24. PK-yrityksen ominaislaatu työnantajana ja työyhteisönä • Kaikki tekevät kaikkea. • Nopea priorisointi. • Litteä organisaatio. • Daavid ja Goljat -suhde asiakkaisiin. • Tuotekehitys kädestä suuhun. • Kieliteknologiassa: saatava insinöörit ja humanistit puhaltamaan samaan hiileen?!

  25. Tulevaisuus • Käyttäjäystävällisyys! • Integraatio! • Uusi teknologiasukupolvi!

  26. Yhteenveto • Kieliteknologian kaupallistamisessa • Määrällisesti: 1 osaa innovaatiota 9 osaa raakaa työtä • Tuotekehitys ja markkinointi/myynti ovat yhtä tärkeitä! • Laatu on tärkeää, mutta joskus nopein voittaa. • Visio ei aina ole kristallinkirkas. • Tarvitaan myös onnea. • Rahaa pitää tulla, tutkiminen onnistuu aina. • Erikoisongelma: miten saada yritykset kiinnostumaan kielestä?

  27. The End.

More Related