
強化学習アルゴリズム入門: 「平均」からはじめる基礎と応用
曽我部 東馬, 電気通信大学
オーム社, 2019
ISBN: 9784274223716;
言語: 日本語
平均という初歩的な数学を入口として、「価値」「探索」「マルコフ性」といった強化学習の基本をわかりやすく解説します。また、各アルゴリズムについては、「多腕バンディット問題」および「グリッドワールド問題」のいずれかを用いて、比較しやすい状態で解説します。そのため、各アルゴリズムの特徴や差異がわかりやすくなっています。さらに、中核的なアルゴリズムについては MATLAB のコードを配布しており、コードを実行することで「原理→数式→プログラム」という一連の流れを直感的に把握できます。
本書の特徴
- 難解な強化学習の原理を、中高生にもなじみ深い「平均値の計算」という観点からわかりやすく解説
- さまざまなアルゴリズムを、共通する例題を用いて特徴がわかりやすいように比較
Sélectionner un site web
Choisissez un site web pour accéder au contenu traduit dans votre langue (lorsqu'il est disponible) et voir les événements et les offres locales. D’après votre position, nous vous recommandons de sélectionner la région suivante : .
Vous pouvez également sélectionner un site web dans la liste suivante :
Comment optimiser les performances du site
Pour optimiser les performances du site, sélectionnez la région Chine (en chinois ou en anglais). Les sites de MathWorks pour les autres pays ne sont pas optimisés pour les visites provenant de votre région.
Amériques
- América Latina (Español)
- Canada (English)
- United States (English)
Europe
- Belgium (English)
- Denmark (English)
- Deutschland (Deutsch)
- España (Español)
- Finland (English)
- France (Français)
- Ireland (English)
- Italia (Italiano)
- Luxembourg (English)
- Netherlands (English)
- Norway (English)
- Österreich (Deutsch)
- Portugal (English)
- Sweden (English)
- Switzerland
- United Kingdom (English)