Lingvistica computațională (CL) este aplicarea informaticii la analiza, sinteza și înțelegerea limbajului scris și vorbit. Lingvistica computațională este utilizată în traducerea automată instantanee, sistemele de recunoaștere a vorbirii (SR), sintetizatoarele text-to-speech (TTS), sistemele de răspuns vocal interactiv (IVR), motoarele de căutare, editorii de text și materialele de instruire lingvistică. Acest domeniu de studiu interdisciplinar necesită expertiză în domeniul învățării automate (ML), al învățării profunde (DL), al inteligenței artificiale (AI), al informaticii cognitive și al neuroștiințelor.
O înțelegere computațională a limbajului oferă ființelor umane o perspectivă asupra gândirii și inteligenței. Computerele care sunt competente din punct de vedere lingvistic nu numai că ajută la facilitarea interacțiunii umane cu mașinile și software-ul, ci și fac ca resursele textuale și alte resurse ale internetului să fie disponibile cu ușurință în mai multe limbi. Obiectivele comerciale ale lingvisticii computaționale includ:
- Traducerea textului dintr-o limbă în alta.
- Retragerea textului care se referă la un subiect specific.
- Analiza textului sau a limbajului vorbit pentru context, sentiment sau alte calități afective.
- Răspunsuri la întrebări, inclusiv la cele care necesită deducții și răspunsuri descriptive sau discursive.
- Sumarizarea textului.
- Crearea de agenți de dialog capabili să îndeplinească sarcini complexe, cum ar fi efectuarea unei achiziții, planificarea unei călătorii sau programarea întreținerii.
- Crearea de chatbots capabili să treacă testul Turing.
Majoritatea lucrărilor din domeniul lingvisticii computaționale – care are atât elemente teoretice, cât și aplicate – vizează îmbunătățirea relației dintre calculatoare și limbajul de bază. Aceasta implică construirea de artefacte care pot fi folosite pentru a procesa și produce limbaj. Construirea unor astfel de artefacte necesită ca cercetătorii de date să analizeze cantități masive de limbaj scris și vorbit, atât în formate structurate, cât și nestructurate.
În mod obișnuit, lingviștii computaționali sunt angajați în universități, laboratoare de cercetare guvernamentale sau întreprinderi mari. În sectorul privat, companiile verticale, precum Caterpillar, angajează de obicei lingviști computaționali pentru a autentifica traducerea exactă a manualelor tehnice. Companiile de software tehnologic, cum ar fi Microsoft, angajează de obicei lingviști computaționali pentru a lucra la procesarea limbajului natural (NLP), ajutând programatorii să creeze interfețe vocale pentru utilizatori (VUI) care vor permite în cele din urmă oamenilor să comunice cu dispozitivele informatice ca și cum ar fi o altă persoană.
Există mai multe oportunități de angajare pentru experții în lingvistică pentru a ajuta dezvoltatorii să îmbunătățească motoarele de căutare pe internet, să construiască asistenți virtuali și să integreze recunoașterea vocală cu alte tehnici de procesare a limbajului. Cererea este, de asemenea, în creștere pentru lingviștii computaționali în sectorul public, deoarece guvernul se luptă cu creșterea continuă a datelor nestructurate.
Deși conceptul de CL este adesea asociat cu IA, CL precede dezvoltarea IA, potrivit Asociației pentru Lingvistică Computațională.