化学品の市場調査、研究開発の支援、マーケット情報の出版

☆ 強化学習の基本的な考え方から、アルゴリズムの種類と使い分け、実装のポイントについて詳しく解説する!

R&D支援センターセミナー

       開催日時:2019年1月30日(水)12:30~16:30
       会  場:滝野川会館 4F 401集会室  → 会場へのアクセス 
            〒101-8324 千代田区神田駿河台3-11-5
       参 加 費:49,980円(税込、資料付)

講 師

 横浜国立大学 大学院工学研究院 教授 博士(工学)  濱上 知樹 氏

【ご専門】
 人工知能,機械学習,知能システム

定 員

 30名

受講対象・レベル

 強化学習を用いたソリューションを検討されようとしている方や,強化学習アプリケーションを実装されようとしている方。基本的な考え方から応用事例まで幅広く知識とノウハウを有する必要のある技術者・マネージャなど。

必要な予備知識

 特に予備知識は必要ありません。基礎から解説いたします。
 事前にご質問をいただければ,回答集を準備します。

習得できる知識

 ・強化学習の様々なアルゴリズムについて,それぞれのできること・できないことが
 理解できます。
 ・強化学習による実例や最近の動向・応用例について知見が得られます。
 ・強化学習アプリケーションを実現する上で必要な実装のポイントについて理解できます。

趣 旨

 強化学習は個別の教師信号が与えられない場合であっても、長期的な目的達成に必要な制御則を自律的に獲得する能動学習方法の1種です。もともとは、動物行動心理学の言葉でしたが、このしくみを模したアルゴリズムがいくつか提案されています。これらの強化学習アルゴリズムは未知の問題空間で自律的に最適化を行うことが求められる場面に適しており、特にロボットの行動獲得手法として1990年台に大きく注目されました。その後、しばらく大きな進展がない時期が続いていましたが、近年の深層学習をはじめとする機械学習技術の発展とともに強化学習のボトルネックのいくつが解消されつつあります。特に、将棋や囲碁のような決定論的ゲームにおいて大きな成果をあげたことで、様々な実問題への応用が期待されています。
 本セミナーでは、強化学習の基礎理論とアルゴリズムの原理を理解した上で、最近の展開と応用事例についてさらに知識を深めることを狙います。

プログラム

1.イントロダクション:強化学習の基本的な考え方

2.強化学習に必要な基礎知識
 (1)マルコフ決定過程
 (2)ベルマン方程式

3. 強化学習の手法の解説と使い分け
 (1)環境同定型
 (2)経験強化型学習

4.様々な強化学習アルゴリズム
 (1)TD学習
 (2)SARSA
 (3)Q学習
 (4)モンテカルロ法
 (5)ProfitSharing
 (6) ActorCritic
 (7)その他

5.効率的に学習させるための 連続空間と適応的状態分割の考え方

6.深層学習と強化学習
 (1)CNN
 (2)DQN
 (3)A3C
 (4)その他注目すべき深層強化学習

7.応用事例(論文、応用事例のレビュー)
  自律移動,異常検知,動き予測など

8.まとめと展望

 【質疑応答・名刺交換】