AI Glossary: 言語学 Terms & Definitions

CoLA

CoLAは、「Corpus of Linguistic Acceptability」の略で、言語モデルを評価するためのデータセットです。

計算的ユーモア

CH

計算ユーモアは、アルゴリズムを使用してジョークやユーモアを生成または理解することを含みます。

計算言語学

CL

計算言語学は、人間の言語を処理・分析するためのコンピュータアルゴリズムの研究です。

構築された言語

コンラング

構築された言語とは、コミュニケーション、芸術、実験など特定の目的のために人工的に作られた言語です。

コーパス言語学

コーパス言語学は、コーパスと呼ばれる大量のテキストコレクションを通じて言語を研究する学問です。

対話行為

DA

A dialogue act is a communicative function of a segment of conversation, indicating the speaker's intention.

二重子音字（Digraph）

Digraphは、単一の音や音素を表すために一緒に使われる文字のペアです。

Europarlコーパス

EPC

Europarlコーパスは、欧州議会の議事録の多言語データセットであり、言語処理タスクに役立ちます。

グリフ

グリフは、書き物やグラフィックデザインにおいて文字や概念を表す視覚的記号です。

語彙多様性

LD

語彙多様性は、テキストやスピーチで使用されるユニークな単語の範囲を、総単語数に対して測定します。

言語分析

言語分析は、コミュニケーションパターンを理解するために言語の構造、意味、使用を調査することです。

言語的特徴

言語的特徴は、コミュニケーションと理解に影響を与える言語の特性です。

言語処理

言語処理は、計算手法を用いて人間の言語を分析し理解することです。

言語規則

言語規則は、言語の構造と使用を規定する形式化されたガイドラインです。

語素分割

形態素の分割は、単語を最も小さな意味単位である形態素に分解するプロセスです。

自然言語処理

自然言語処理（NLP）は、コンピュータが人間の言語を理解し、解釈し、応答できるようにします。

OntoNotes

ON

OntoNotesは、自然言語処理タスクで使用される大規模な注釈付きコーパスです。

OPUSコーパス

OPUS

OPUS Corpusは、自然言語処理タスクに使用される多言語並列コーパスのコレクションです。

多義性

多義性とは、ある単語やフレーズが複数の意味や解釈を持つことを指します。

読解理解

RC

読解力とは、書かれたテキストを理解し解釈する能力です。

語彙

語彙とは、個人やグループが知っていて使用する単語の集合を指します。