Computationele linguïstiek (CL) is de toepassing van de computerwetenschap op de analyse, synthese en het begrip van geschreven en gesproken taal. Computerlinguïstiek wordt gebruikt bij onmiddellijke automatische vertaling, spraakherkenningssystemen (SR), tekst-naar-spraaksynthesizers (TTS), interactieve voice response-systemen (IVR), zoekmachines, teksteditors en taalonderwijsmateriaal. Het interdisciplinaire studiegebied vereist deskundigheid op het gebied van machinaal leren (ML), diep leren (DL), kunstmatige intelligentie (AI), cognitieve informatica en neurowetenschappen.
Een computationeel begrip van taal verschaft de mens inzicht in denken en intelligentie. Computers die taalkundig competent zijn, helpen niet alleen de menselijke interactie met machines en software te vergemakkelijken, maar maken ook de tekstuele en andere bronnen van het internet gemakkelijk beschikbaar in meerdere talen. Zakelijke doelen van computationele linguïstiek omvatten:
- Het vertalen van tekst van de ene taal naar de andere.
- Het ophalen van tekst die betrekking heeft op een specifiek onderwerp.
- Analyseren van tekst of gesproken taal voor context, sentiment of andere affectieve kwaliteiten.
- Vragen beantwoorden, met inbegrip van vragen die gevolgtrekkingen en beschrijvende of discursieve antwoorden vereisen.
- Tekst samenvatten.
- Dialoogagenten bouwen die complexe taken kunnen voltooien, zoals het doen van een aankoop, het plannen van een reis of het plannen van onderhoud.
- Chatbots maken die de Turing-test kunnen doorstaan.
Het meeste werk in de computationele linguïstiek – dat zowel theoretische als toegepaste elementen heeft – is gericht op het verbeteren van de relatie tussen computers en basistaal. Het gaat om het bouwen van artefacten die kunnen worden gebruikt om taal te verwerken en te produceren. Het bouwen van dergelijke artefacten vereist datawetenschappers om enorme hoeveelheden geschreven en gesproken taal in zowel gestructureerde als ongestructureerde formaten te analyseren.
Typisch zijn computationele linguïsten werkzaam in universiteiten, onderzoekslaboratoria van de overheid of grote ondernemingen. In de particuliere sector hebben verticale bedrijven, zoals Caterpillar, doorgaans computationele linguïsten in dienst om de accurate vertaling van technische handleidingen te verifiëren. Tech softwarebedrijven, zoals Microsoft, huren doorgaans computationele taalkundigen in om te werken aan natuurlijke taalverwerking (NLP), waarbij programmeurs worden geholpen om voice user interfaces (VUI’s) te creëren waarmee mensen uiteindelijk met computerapparatuur kunnen communiceren alsof ze een ander mens zijn.
Er zijn meer vacatures voor linguïstische experts om ontwikkelaars te helpen zoekmachines op internet te verbeteren, virtuele assistenten te bouwen en spraakherkenning te integreren met andere taalverwerkingstechnieken. Er is ook steeds meer vraag naar computationele linguïsten in de publieke sector nu de overheid worstelt met de voortdurende groei van ongestructureerde gegevens.
Hoewel het concept van CL vaak wordt geassocieerd met AI, dateert CL van vóór de ontwikkeling van AI, aldus de Association for Computational Linguistics.