化学品の市場調査、研究開発の支援、マーケット情報の出版

~ 基礎から応用、最先端事例まで解説 ~

トリケップスセミナー

     開催日時:2017年9月4日(月)11:00~16:00
     会  場:オームビル  → 会場へのアクセス 
          〒101-8460 東京都千代田区神田錦町3-1
     参 加 費:お1人様受講の場合 46,000円 (税別/1名)
          1口(1社3名まで受講可能)でお申し込みの場合 57,000円 (税別/1口)

講 師

松原崇充(まつばらたかみつ)氏 
国立大学法人 奈良先端科学技術大学院大学 情報科学研究科 知能システム制御研究室
准教授(博士(工学))

<ご略歴>
 2003年3月 大阪府立大学 工学部 電気電子システム工学科 卒業
 2005年3月 奈良先端科学技術大学院大学 情報科学研究科 情報システム学専攻 修士課程修了
 2005年4月~2007年12月 日本学術振興会 特別研究員(DC1)
 2007年12月 奈良先端科学技術大学院大学 情報科学研究科 情報システム学専攻 博士後期課程修了
 2008年1月~2015年4月 奈良先端科学技術大学院大学 情報科学研究科 助教
 2016年1月~現在 奈良先端科学技術大学院大学 情報科学研究科 准教授
  2008年4月~2009年3月 ATR脳情報研究所 客員研究員(情報通信研究機構短時間研究員)
  2009年4月~現在 ATR脳情報研究所 ブレインロボットインタフェース研究室 客員研究員
  2016年10月~現在 国立研究開発法人産業技術総合研究所 客員研究員

<主な受賞>
 2011年7月 計測自動制御学会システムインテグレーション部門, SI2010優秀講演賞
 2012年2月 2011年度 計測自動制御学会 学術奨励賞 研究奨励賞
 2012年8月 平成24年度 日本神経回路学会 論文賞
 2013年3月 計測自動制御学会システムインテグレーション部門, SI2012優秀講演賞
 2015年9月 IEEE RO-MAN2015 RSJ/KROS Distinguished Interdisciplinary Research Award
 2016年11月 IEEE-RAS Humanoids2016 Best Oral Paper Award

セミナーの概要

 昨今,我々の生活空間で作業の代行や支援ができるロボットに期待が寄せられています.そのようなロボットの実現には,不確実環境下において知的かつ頑健にタスクを遂行するための運動計画・制御・学習技術が必要不可欠です.
 本講義では,そのようなロボットの運動制御系を,ロボットが試行錯誤を通じて学習する仕組みとして,強化学習と呼ばれる機械学習技術について紹介します.さらに,実際にロボットの運動制御に強化学習を適用するための基本的な考え方から応用技術についても幅広く紹介します.
 最後に研究事例として,我々の研究室で取り組んでいるロボットの運動制御や応用技術についても解説します.

講義項目

 1 導入

 2 強化学習
  2.1 歴史
  2.2 基本的な数理
   2.2.1 価値関数(Q-learning, SARSAなど)
   2.2.2 方策探索(Policy Gradient, EM policy Searchなど)
   2.2.3 モデルベース強化学習

 3 ロボットの運動制御への応用技術
  3.1 強化学習によるロボットの運動制御問題の定式化
  3.2 連続状態のための関数近似(線形モデル,カーネル法など)
  3.3 運動軌道を生成する方策モデル(経由点表現, Dynamical Movement Primitivesなど)
  3.4 学習を安定化する技術(KL制御,正則化)

 4 事例紹介
  4.1 触覚センサ付きロボットハンドによる器用な操り技能
  4.2 外骨格ロボットによる運動支援
  4.3 双腕ロボットによる柔軟物操作(ディープラーニング)