Linguistique computationnelle (CL) est l’application de l’informatique à l’analyse, la synthèse et la compréhension du langage écrit et parlé. La linguistique informatique est utilisée dans la traduction automatique instantanée, les systèmes de reconnaissance de la parole (SR), les synthétiseurs de texte à la parole (TTS), les systèmes de réponse vocale interactive (IVR), les moteurs de recherche, les éditeurs de texte et le matériel d’enseignement des langues. Ce domaine d’études interdisciplinaire nécessite une expertise en apprentissage automatique (ML), en apprentissage profond (DL), en intelligence artificielle (AI), en informatique cognitive et en neurosciences.
Une compréhension computationnelle du langage fournit aux êtres humains un aperçu de la pensée et de l’intelligence. Les ordinateurs qui ont des compétences linguistiques contribuent non seulement à faciliter l’interaction humaine avec les machines et les logiciels, mais aussi à rendre les ressources textuelles et autres de l’internet facilement disponibles dans plusieurs langues. Les objectifs commerciaux de la linguistique informatique comprennent :
- Traduire un texte d’une langue à une autre.
- Retrouver un texte qui se rapporte à un sujet spécifique.
- Analyser un texte ou un langage parlé pour le contexte, le sentiment ou d’autres qualités affectives.
- Répondre à des questions, y compris celles qui nécessitent une inférence et des réponses descriptives ou discursives.
- Sommariser un texte.
- Créer des agents de dialogue capables d’accomplir des tâches complexes telles que faire un achat, planifier un voyage ou programmer une maintenance.
- Créer des chatbots capables de passer le test de Turing.
La plupart des travaux en linguistique computationnelle – qui comporte des éléments théoriques et appliqués – visent à améliorer la relation entre les ordinateurs et le langage de base. Il s’agit de construire des artefacts qui peuvent être utilisés pour traiter et produire du langage. La construction de tels artefacts exige que les scientifiques des données analysent des quantités massives de langage écrit et parlé dans des formats structurés et non structurés.
Typiquement, les linguistes computationnels sont employés dans des universités, des laboratoires de recherche gouvernementaux ou de grandes entreprises. Dans le secteur privé, les entreprises verticales, comme Caterpillar, emploient généralement des linguistes computationnels pour authentifier la traduction précise des manuels techniques. Les entreprises de logiciels technologiques, comme Microsoft, embauchent généralement des linguistes informatiques pour travailler sur le traitement du langage naturel (NLP), en aidant les programmeurs à créer des interfaces utilisateur vocales (VUI) qui permettront éventuellement aux humains de communiquer avec des dispositifs informatiques comme s’ils étaient une autre personne.
Plus de possibilités d’emploi existent pour les experts en linguistique afin d’aider les développeurs à améliorer les moteurs de recherche Internet, à construire des assistants virtuels et à intégrer la reconnaissance vocale à d’autres techniques de traitement du langage. La demande augmente également pour les linguistes informatiques dans le secteur public, car les gouvernements sont aux prises avec la croissance continue des données non structurées.
Bien que le concept de CL soit souvent associé à l’IA, la CL est antérieure au développement de l’IA, selon l’Association for Computational Linguistics.