Computational linguistics (CL) er anvendelsen af computervidenskab til analyse, syntese og forståelse af skrevet og talt sprog. Computerlingvistik anvendes i maskinoversættelse, systemer til talegenkendelse (SR), tekst-til-tale-syntetisatorer (TTS), interaktive voice response-systemer (IVR), søgemaskiner, tekstredigeringssystemer og sprogundervisningsmaterialer. Det tværfaglige studieområde kræver ekspertise inden for maskinindlæring (ML), dyb indlæring (DL), kunstig intelligens (AI), kognitiv databehandling og neurovidenskab.
En computerbaseret forståelse af sprog giver mennesket indsigt i tænkning og intelligens. Computere, der er sprogligt kompetente, er ikke blot med til at lette den menneskelige interaktion med maskiner og software, men gør også tekst- og andre ressourcer på internettet let tilgængelige på flere sprog. De forretningsmæssige mål for computerlingvistik omfatter:
- Oversættelse af tekst fra et sprog til et andet.
- Hentning af tekst, der vedrører et bestemt emne.
- Analyse af tekst eller talt sprog med henblik på kontekst, følelser eller andre affektive kvaliteter.
- Svar på spørgsmål, herunder spørgsmål, der kræver inferens og beskrivende eller diskursive svar.
- Summarisering af tekst.
- Bygning af dialogagenter, der er i stand til at udføre komplekse opgaver som f.eks. at foretage et køb, planlægge en rejse eller planlægge vedligeholdelse.
- Skabelse af chatbots, der er i stand til at bestå Turing-testen.
Det meste arbejde inden for computerlingvistik – som har både teoretiske og anvendte elementer – har til formål at forbedre forholdet mellem computere og grundsprog. Det drejer sig om at opbygge artefakter, der kan bruges til at behandle og producere sprog. Opbygningen af sådanne artefakter kræver, at dataloger analyserer enorme mængder af skrevet og talt sprog i både strukturerede og ustrukturerede formater.
Typisk er computerlingvister ansat på universiteter, i offentlige forskningslaboratorier eller i store virksomheder. I den private sektor beskæftiger vertikale virksomheder som Caterpillar typisk computerlingvister til at bekræfte den nøjagtige oversættelse af tekniske manualer. Teknologiske softwarevirksomheder som f.eks. Microsoft ansætter typisk computerlingvister til at arbejde med naturlig sprogbehandling (NLP) og hjælpe programmører med at skabe stemmebrugergrænseflader, der i sidste ende vil gøre det muligt for mennesker at kommunikere med computerudstyr, som om de var andre mennesker.
Der er flere jobmuligheder for lingvistikere, der kan hjælpe udviklere med at forbedre internetsøgemaskiner, opbygge virtuelle assistenter og integrere talegenkendelse med andre sprogbehandlingsteknikker. Der er også stigende efterspørgsel efter computerlingvister i den offentlige sektor, efterhånden som myndighederne kæmper med den fortsatte vækst af ustrukturerede data.
Og selv om begrebet CL ofte forbindes med AI, går CL forud for AI’s udvikling, ifølge Association for Computational Linguistics.