tietokonelingvistiikka (CL)

Tietokonelingvistiikka (CL) on tietojenkäsittelytieteen soveltamista kirjoitetun ja puhutun kielen analysointiin, synteesiin ja ymmärtämiseen. Laskennallista kielitiedettä käytetään välittömässä konekääntämisessä, puheentunnistusjärjestelmissä (SR), tekstistä puheeksi (TTS) -syntetisaattoreissa, interaktiivisissa puhevastejärjestelmissä (IVR), hakukoneissa, tekstieditoreissa ja kielenopetusmateriaaleissa. Monitieteinen tieteenala edellyttää asiantuntemusta koneoppimisesta (ML), syväoppimisesta (DL), tekoälystä (AI), kognitiivisesta tietojenkäsittelystä ja neurotieteestä.

Kielen laskennallinen ymmärtäminen antaa ihmiselle tietoa ajattelusta ja älykkyydestä. Kielitaitoiset tietokoneet eivät ainoastaan helpota ihmisten vuorovaikutusta koneiden ja ohjelmistojen kanssa, vaan ne myös tekevät internetin teksti- ja muista resursseista helposti saatavilla olevia monikielisiä. Laskennallisen kielitieteen liiketoiminnallisia tavoitteita ovat muun muassa:

  • Tekstin kääntäminen kielestä toiseen.
  • Tekstin hakeminen, joka liittyy tiettyyn aiheeseen.
  • Tekstin tai puhutun kielen analysointi asiayhteyden, tunteen tai muiden affektiivisten ominaisuuksien kannalta.
  • Kysymyksiin vastaaminen, mukaan lukien kysymykset, jotka edellyttävät päättelyä ja kuvailevia tai diskursiivisia vastauksia.
  • Tekstin tiivistäminen.
  • Dialogiagenttien rakentaminen, jotka kykenevät suorittamaan monimutkaisia tehtäviä, kuten ostosten tekemistä, matkan suunnittelua tai huollon aikatauluttamista.
  • Turingin testin läpäisevien chat-robottien luominen.

Lähinnä laskennallisessa kielitieteessä – jossa on sekä teoreettisia että soveltavia elementtejä – pyritään parantamaan tietokoneiden ja peruskielen välistä suhdetta. Siinä rakennetaan artefakteja, joita voidaan käyttää kielen käsittelyyn ja tuottamiseen. Tällaisten artefaktien rakentaminen edellyttää, että tietojenkäsittelytieteilijät analysoivat valtavia määriä kirjoitettua ja puhuttua kieltä sekä strukturoidussa että strukturoimattomassa muodossa.

Tyypillisesti laskennalliset kielentutkijat työskentelevät yliopistoissa, valtion tutkimuslaboratorioissa tai suurissa yrityksissä. Yksityisellä sektorilla vertikaaliset yritykset, kuten Caterpillar, palkkaavat tyypillisesti laskennallisia kielitieteilijöitä todentamaan teknisten käsikirjojen tarkat käännökset. Teknologiaohjelmistoyritykset, kuten Microsoft, palkkaavat tyypillisesti laskennallisia kielitieteilijöitä työskentelemään luonnollisen kielen prosessoinnin (NLP) parissa ja auttamaan ohjelmoijia luomaan äänikäyttöliittymiä, joiden avulla ihmiset voivat lopulta kommunikoida tietoteknisten laitteiden kanssa ikään kuin he olisivat toinen ihminen.

Lisää työmahdollisuuksia on tarjolla kielitieteen asiantuntijoille, jotka auttavat kehittäjiä parantamaan Internetin hakukoneita, rakentamaan virtuaalisia avustajia ja integroimaan puheentunnistusta muihin kielenkäsittelytekniikoihin. Myös julkisen sektorin laskennallisten kielentutkijoiden kysyntä kasvaa, kun hallitukset kamppailevat jäsentymättömän datan jatkuvan kasvun kanssa.

Vaikka CL-käsite liitetään usein tekoälyyn, Association for Computational Linguisticsin mukaan CL on vanhempi kuin tekoälyn kehitys.

Vastaa

Sähköpostiosoitettasi ei julkaista.