Explore 6 AI terms in Decision Theory
マルコフ決定過程は、結果が部分的にランダムであり、部分的に意思決定者の制御下にある状況での意思決定をモデル化するための数学的枠組みです。
マルチアームバンディットは、報酬が不確かな複数の選択肢の中から選択を行う意思決定の問題です。
後悔最小化は、行った選択に対する潜在的な後悔を減らすことを目的とした意思決定戦略です。
トンプソンサンプリングは、不確実な状況で意思決定を行うための方法であり、探索と活用のバランスを取るものです。
The Upper Confidence Bound is a statistical method used in decision-making to estimate the upper limit of a parameter's value.
ユーティリティ関数は、一連の選択肢に対する好みを定量化し、経済学やAIにおける意思決定のモデル化に役立ちます。