AI Glossary: データサイエンス Terms & Definitions

アクティブラーニング

AI

アクティブラーニングは、モデルがパフォーマンスを向上させるために学習するデータを選択する機械学習のアプローチです。

科学におけるAI

AIを層にして

科学におけるAIは、人工知能技術を応用して科学研究と発見を促進することを指します。

アルゴリズム選択

AS

アルゴリズム選択は、特定の問題やデータセットに最適なアルゴリズムを選ぶプロセスです。

アルゴリズムの公平性

AF

アルゴリズムの公平性は、アルゴリズムが個人やグループを公平に扱い、偏見や差別を最小限に抑えることを保証します。

異常検知

異常検知とは、予期される挙動に従わないデータのパターンを識別することです。

近似最も近い隣人

近似最近傍探索（ANN）

Approximate nearest neighbors（ANN）は、クエリポイントに最も近いデータセット内の点を迅速に見つけるアルゴリズムです。

近似誤差

近似誤差（AE）

近似誤差は、推定値と実際の値との差を測定します。

人工知能

AIを層にして

人工知能（AI）とは、通常人間の知能を必要とするタスクを実行するように設計されたコンピュータシステムを指します。

自動機械学習

Automated Machine Learning（AutoML）は、主要なタスクを自動化することで、機械学習モデルの構築を簡素化します。

自動機械学習

AutoML（自動機械学習）は、従来データサイエンティストが行っていた作業を自動化することで、機械学習の適用プロセスを簡素化します。

AutoMLパイプライン

自動機械学習

AutoMLパイプラインは、機械学習モデルの構築と最適化のプロセスを自動化します。

Databricks ML

AML

Azure Machine Learningは、クラウドベースのサービスで、機械学習モデルの構築、トレーニング、展開を行います。

ベイジアンネットワーク

BN

ベイジアンネットワークは、変数間の確率的関係を表すグラフィカルモデルです。

行動情報学

BI

行動情報学は、計算手法を用いて人間の行動に関するデータを研究する分野です。

ベンチマークデータセット

BDS

ベンチマークデータセットは、機械学習モデルの性能評価に用いられる標準的なデータセットです。

バイアス

AIにおけるバイアスとは、人種や性別などの属性に基づいて不公平な結果をもたらす、アルゴリズムの体系的な誤りを指します。

大規模データ分析

BDA

Big Data Analyticsは、大規模なデータセットを調査してパターンや洞察を見つけ出し、より良い意思決定を支援します。

キャリブレーション

校正は、システムの出力が正確で信頼できることを保証するために調整するプロセスです。

CatBoost

CatBoostは、決定木に対する勾配ブースティングを使用した機械学習アルゴリズムで、カテゴリカル特徴量向けに設計されています。

カテゴリカル変数

カテゴリ変数は、データ内の異なるカテゴリーやグループを表し、統計分析でよく使用されます。

中心性指標

CM

中心性指標は、ネットワーク内のノードの重要性を定量化します。

チャーン予測

CP

Churn Prediction は、サービスの利用停止が予想される顧客を特定する技術です。

クラスの不均衡

信頼区間

クラスの不均衡は、データセット内のクラスが均等に表現されていない場合に発生し、モデルのパフォーマンスに影響を与えます。

ClearML

CLM

ClearMLは、機械学習の実験、パイプライン、モデルを管理するためのオープンソースプラットフォームです。

クライアントドリフト

CD

Client Drift refers to the phenomenon where a model's performance declines due to changes in client data over time.

Codeforcesデータセット

CFD

AIとアルゴリズムのトレーニングに使用されるプログラミングコンテストと解答のコレクション。

コールドスタート

CS

A cold start refers to the challenge of making accurate predictions or recommendations when there's little or no data available.

コモン・クロール

CC

コモン・クロールは、研究と分析のために無料で公開されたウェブデータのアーカイブを提供する非営利団体です。