Copyright(c)2018 GGE Kiyosu Cyber Club Allrights Reserved

【15)OpenAI Gym/Baselines INDEX】

メインメニューへ戻る

【メインメニュー】

メインメニューへ戻る

サイトメニュー

15)OpenAI Gym

01. OpenAI Gym/Baselines～動作環境の整備～

01.01a 動作環境の整備

01.02a OpenAI Gym

01.02b OpenAI Gymのインストール

01.02c Gymインターフェース

01.03a 行動空間と状態空間

02. Stable Baselines

02.01a Stable Baselines

02.01b サンプルプログラムの構成確認

02.02a 学習アルゴリズムの分類と歴史

02.03a 模倣学習の種類と概要

02.03b 平均報酬と平均エピソード長の出力とMonitorの利用

02.03c モデルの読み書き

02.03d TensorBoardとコールバック

02.04a マルチプロセッシング part1

02.05a マルチプロセッシング part2

02.06a カスタムGym環境作成

02.07a Stable Baselines Zoo学習モデル

03. Atari環境攻略

03.01a Atari環境攻略

03.02a 学習速度と効率の向上～前処理～

03.02b 前処理の実装

03.03a 学習速度と効率の向上～ハイパーパラメータの調整～

03.03b 学習速度と効率の向上～クラウド学習～

03.03c 模倣学習

04.01a Gym Retroのインストール

05. 強化学習環境

05.01a MuJoCoとRobotics環境

05.01b オープンソースPyBullet環境

05.02a PyBullet環境の実装

05.03a PyBullet～ロボットの実装～

05.03b PyBullet～ロボットの報酬～

05.04a PyBullet～処理時間設定型改～

05.05a PyBullet～最適化～

05.06a PyBullet～ハイパーパラメータ実装～

05.07a PyBullet～ヒューマノイド追加～

05.08a PyBullet～環境分離と拡張～

05.09a PyBullet～疑似コールバック～

05.10a PyBullet～どのような仕組み？-1～

05.11a PyBullet～どのような仕組み？-2～

05.12a PyBullet～学習の傾向～

05.13a PyBullet～コールバックが無い訳～

05.14a PyBullet～学習傾向～

05.15a PyBullet～PPOとは～