A számítógépes nyelvészet (CL) a számítástechnika alkalmazása az írott és beszélt nyelv elemzésére, szintézisére és megértésére. A számítógépes nyelvészetet használják az azonnali gépi fordításban, a beszédfelismerő (SR) rendszerekben, a szöveg-beszéd (TTS) szintetizátorokban, az interaktív hangválasz (IVR) rendszerekben, a keresőmotorokban, a szövegszerkesztőkben és a nyelvoktató anyagokban. Az interdiszciplináris tudományterület a gépi tanulás (ML), a mélytanulás (DL), a mesterséges intelligencia (AI), a kognitív számítástechnika és az idegtudományok terén igényel szakértelmet.
A nyelv számítógépes megértése betekintést nyújt az ember gondolkodásába és intelligenciájába. A nyelvi kompetenciával rendelkező számítógépek nemcsak a gépekkel és szoftverekkel való emberi interakciót segítik elő, hanem az internet szöveges és egyéb erőforrásait is könnyen elérhetővé teszik több nyelven. A számítógépes nyelvészet üzleti céljai közé tartoznak:
- Szövegek fordítása egyik nyelvről a másikra.
- Egy adott témához kapcsolódó szövegek visszakeresése.
- Szövegek vagy beszélt nyelv elemzése kontextus, érzelmek vagy más affektív tulajdonságok szempontjából.
- Kérdések megválaszolása, beleértve a következtetést és leíró vagy diszkurzív válaszokat igénylő kérdéseket is.
- Szövegek összegzése.
- Komplex feladatok, például vásárlás, utazás tervezése vagy karbantartás ütemezése elvégzésére alkalmas párbeszéd-ügynökök készítése.
- A Turing-teszt teljesítésére alkalmas chatbotok létrehozása.
A számítógépes nyelvészet – amelynek elméleti és alkalmazott elemei egyaránt vannak – legtöbb munkája a számítógépek és az alapnyelv közötti kapcsolat javítására irányul. Olyan műtárgyak építéséről van szó, amelyek a nyelv feldolgozására és előállítására használhatók. Az ilyen artefaktumok megalkotása megköveteli az adattudósoktól, hogy hatalmas mennyiségű írott és beszélt nyelvet elemezzenek strukturált és strukturálatlan formátumban egyaránt.
A számítási nyelvészeket jellemzően egyetemeken, kormányzati kutatólaboratóriumokban vagy nagyvállalatoknál alkalmazzák. A magánszektorban a vertikális vállalatok, például a Caterpillar jellemzően számítógépes nyelvészeket alkalmaznak a műszaki kézikönyvek pontos fordításának hitelesítésére. A technológiai szoftvercégek, mint például a Microsoft, jellemzően számítógépes nyelvészeket alkalmaznak a természetes nyelvi feldolgozás (NLP) területén, akik segítenek a programozóknak olyan hangalapú felhasználói felületek (VUI) létrehozásában, amelyek lehetővé teszik majd, hogy az emberek úgy kommunikáljanak a számítástechnikai eszközökkel, mintha egy másik ember lennének.
Még több munkalehetőség kínálkozik a nyelvész szakemberek számára, akik segítenek a fejlesztőknek az internetes keresőmotorok fejlesztésében, virtuális asszisztensek létrehozásában és a beszédfelismerés más nyelvfeldolgozási technikákkal való integrálásában. A közszférában is egyre nagyobb a kereslet a számítógépes nyelvészek iránt, mivel a kormányok a strukturálatlan adatok folyamatos növekedésével küzdenek.
Az Association for Computational Linguistics szerint bár a CL fogalmát gyakran a mesterséges intelligenciával hozzák összefüggésbe, a CL megelőzte a mesterséges intelligencia fejlődését.