Unity ML-Agents まとめ

公式サイトなどをみてもなかなか難しいものがあったのでいろいろとまとめてみます あとから別記事に分けると思いますが,いまのところこのままで... (見にくいと思いますが,許して:: (更新予定)

対象者

いまからML-Agentsをやってみたいという方~サンプルやったから,もうちょっと詳しく知りたい

環境

現在 2020/10/8

環境構築方法

ドキュメントにあるように Unity 2018.4以上 Pythonを3.6.1以上で構築する (Anacondaで作ったほうが楽?)

Install Unity 2018.4 or Later

Install Python 3.6.1 or Higher

github.com

環境構築でerrorがおきる

2020/11/19現在(Unity2019.4.14,Release_9の情報)

fails to pass a sanity check due to a bug in the windows runtime. See this issue for more information:

みたいなエラーが起きた場合は,Stack Overflowに解決策があったのでそれをやってみる

pip install numpy==1.19.3

はじめにしたほうがいいこと

Unity さんの公式ドキュメントとサンプルを確認する

github.com

はじめのサンプルの改変をしてみたので確認

こちらは私がCubeを追うものを改変したものになります. 以下のようなものが数点入っています. f:id:ayousanz:20201009163931g:plain

公式サンプルを詳しく説明しているサイト

enjoy-unity.net

ayousanz.hatenadiary.jp

Python側の実行時のコマンドライン引数

note.com

ログの見方

f:id:ayousanz:20201008231748p:plain こちらのサイトからほぼ引用

am1tanaka.hatenablog.com

  • Mean Reward:報酬の平均 訓練をするごとに高くなっていきどこかの値に収束する
  • Std of Reward: リワードの標準偏差 はじめはばらつきがあった0に近づくとよい?

訓練の高速化

note.com