Computergestützte Linguistik (CL) ist die Anwendung der Informatik auf die Analyse, die Synthese und das Verständnis von geschriebener und gesprochener Sprache. Computerlinguistik wird in der maschinellen Sofortübersetzung, in Spracherkennungssystemen (SR), Text-to-Speech-Synthesizern (TTS), interaktiven Voice-Response-Systemen (IVR), Suchmaschinen, Texteditoren und Sprachlehrmitteln eingesetzt. Das interdisziplinäre Studienfach erfordert Fachwissen in den Bereichen maschinelles Lernen (ML), Deep Learning (DL), künstliche Intelligenz (AI), kognitives Computing und Neurowissenschaften.
Ein computergestütztes Verständnis von Sprache gibt dem Menschen Einblick in sein Denken und seine Intelligenz. Computer, die sprachlich kompetent sind, erleichtern nicht nur die menschliche Interaktion mit Maschinen und Software, sondern machen auch die Text- und anderen Ressourcen des Internets in mehreren Sprachen verfügbar. Zu den Geschäftszielen der Computerlinguistik gehören:
- Übersetzen von Texten von einer Sprache in eine andere.
- Auffinden von Texten, die sich auf ein bestimmtes Thema beziehen.
- Analysieren von Texten oder gesprochener Sprache auf Kontext, Stimmung oder andere affektive Eigenschaften.
- Beantwortung von Fragen, einschließlich solcher, die Schlussfolgerungen und beschreibende oder diskursive Antworten erfordern.
- Zusammenfassen von Text.
- Aufbau von Dialogagenten, die in der Lage sind, komplexe Aufgaben zu erledigen, wie z. B. einen Kauf zu tätigen, eine Reise zu planen oder Wartungsarbeiten zu planen.
- Erstellung von Chatbots, die den Turing-Test bestehen.
Die meisten Arbeiten in der Computerlinguistik – die sowohl theoretische als auch angewandte Elemente umfasst – zielen darauf ab, die Beziehung zwischen Computern und der Grundsprache zu verbessern. Es geht um die Entwicklung von Artefakten, die zur Verarbeitung und Produktion von Sprache verwendet werden können. Der Aufbau solcher Artefakte erfordert von Datenwissenschaftlern die Analyse riesiger Mengen geschriebener und gesprochener Sprache in strukturierten und unstrukturierten Formaten.
Typischerweise sind Computerlinguisten an Universitäten, in staatlichen Forschungslabors oder großen Unternehmen beschäftigt. In der Privatwirtschaft beschäftigen vertikale Unternehmen wie Caterpillar in der Regel Computerlinguisten, um die korrekte Übersetzung von technischen Handbüchern zu gewährleisten. Technische Softwareunternehmen wie Microsoft stellen in der Regel Computerlinguisten ein, um an der Verarbeitung natürlicher Sprache (NLP) zu arbeiten und Programmierern dabei zu helfen, sprachgesteuerte Benutzerschnittstellen (VUI) zu erstellen, die es Menschen schließlich ermöglichen, mit Computergeräten zu kommunizieren, als wären sie eine andere Person.
Es gibt mehr Beschäftigungsmöglichkeiten für Linguistik-Experten, die Entwicklern helfen, Internet-Suchmaschinen zu verbessern, virtuelle Assistenten zu entwickeln und Spracherkennung mit anderen Sprachverarbeitungstechniken zu integrieren. Auch im öffentlichen Sektor steigt die Nachfrage nach Computerlinguisten, da sich die Behörden mit dem ständigen Anstieg unstrukturierter Daten auseinandersetzen müssen.
Obwohl das Konzept der CL oft mit KI in Verbindung gebracht wird, geht CL laut der Association for Computational Linguistics der Entwicklung der KI voraus.