計算言語学 (CL) は、書き言葉や話し言葉の分析、合成、理解へのコンピュータ科学の応用である。 計算言語学は、即時機械翻訳、音声認識 (SR) システム、テキスト音声合成 (TTS)、双方向音声応答 (IVR) システム、検索エンジン、テキスト エディター、言語教育教材などに使用されています。 この学際的な研究分野では、機械学習(ML)、深層学習(DL)、人工知能(AI)、認知コンピューティング、神経科学などの専門知識が必要とされます。
言語に関する計算論的理解は、思考や知能に関する洞察を人間に与えてくれる。 言語的能力のあるコンピューターは、機械やソフトウェアと人間の相互作用を促進するだけでなく、インターネットのテキストやその他のリソースを多言語で容易に利用できるようにします。
計算言語学の研究のほとんどは、理論と応用の両方の要素を持ち、コンピュータと基本的な言語との関係を改善することを目的としています。 これには、言語を処理し生成するために使用できる人工物を構築することが含まれます。 このようなアーティファクトを構築するには、データ科学者が構造化および非構造化形式の膨大な量の書き言葉や話し言葉を分析する必要があります。 民間企業では、Caterpillar などの垂直統合型企業が、技術マニュアルの正確な翻訳を認証するために計算言語学者を採用するのが一般的です。 マイクロソフトなどのハイテク・ソフトウェア企業では、自然言語処理(NLP)に携わる計算言語学者が採用され、最終的には人間が他の人間と同じようにコンピュータ機器とコミュニケーションできるようになる音声ユーザーインターフェース(VUI)の作成をプログラマーが支援するのが一般的です。
開発者がインターネット検索エンジンを改良したり、仮想アシスタントを構築したり、音声認識と他の言語処理技術を統合したりできるように、言語学の専門家が活躍する場はさらに増えています。 また、政府は非構造化データの継続的な増加に取り組んでいるため、公共部門の計算言語学者に対する需要も高まっています。
計算言語学の概念はしばしば AI と関連付けられますが、計算言語学協会によれば、計算言語学は AI の開発より以前から存在しています。