化学品の市場調査、研究開発の支援、マーケット情報の出版

~大量のデータが集められないときの~

トリケップスセミナーのご案内

     開催日時:2019年6月27日(木)11:00~17:00
     会  場:オームビル  → 会場へのアクセス 
          〒101-8460 東京都千代田区神田錦町3-1
     参 加 費:お1人様受講の場合 47,000円 (税別/1名)
          1口(1社3名まで受講可能)でお申し込みの場合 59,000円 (税別/1口)
          お申し込み受付中

申込方法

 お1人様受講の場合、下記のカートへの投入、あるいはFAX用紙にてお申込ください。
 1口でお申し込みの場合、下記のFAX用紙にてお申込ください。
 折り返し、聴講券、会場地図、請求書を送付いたします。

  お1人様申込み
     FAX申込用紙PDF 
  1口(1社3名まで受講可能)でお申し込み    FAX申込用紙PDF 
 

講 師

松原 崇 氏  神戸大学大学院 システム情報学研究科 助教 (博士(工学))

<経 歴>
 2015年 大阪大学大学院基礎工学研究科 博士後期課程修了
 2018年度 人工知能学会 全国大会優秀賞 (一般セッション口頭部門)

<所属学会>
 IEEE,電子情報通信学会,人工知能学会

セミナーの概要

 ディープラーニングはデータから帰納的に識別モデルを構築するため,十分な性能を得るためには大量のデータを集めなければならない.しかし実用上,目的に合わせて大量のデータを収集することは非常に困難である.そのため

 ・識別対象に対する知識を使うことでディープラーニングに制約を課す(データ拡張,深層生成モデル)
 ・別のデータで得られた知見を応用する(ドメイン適応)

などの工夫を行うことで,比較的少ないデータ量でも悪くない性能を達成することができる.
 データ拡張とはデータに手を加えて量を増やすことである.例えば,自動車の画像は拡大縮小・左右反転させても自動車として識別されてほしい.そのような操作を加えることで,元の画像の大きさに依存せずに,普遍的な特徴を学習する.またドロップアウト(dropout)のように,データにノイズを加える手法もある.それだけでなく,一部を切り取ったりくっつけたりすることもある.なぜこのような手法が有効なのか,理論的な背景も含めて説明する.
 また深層生成モデル(変分自己符号化器VAEや敵対的生成ネットワークGAN)はリアルな擬似データを作ることができるが,この擬似データを追加の学習データにすることもできる.また深層生成モデルそのものを分類に使うことで,小規模データの分類も可能である.
 ドメイン適応は目的以外に大規模データセットが存在するときに有効な方策である.ImageNetのような大規模データで学習した特徴量を流用したり,ラベルを付与したデータの情報から,ラベルを与えていないデータを学習を手助けしたりできる.
 これらの手法について,いくつかの実例とともに紹介していく.

講義項目

  1. ディープラーニング入門
      1.1. ディープラーニングとは
      1.2. ディープラーニングの現状
      1.3. データ量と性能の関係

  2. データの増やし方
      2.1. 一般的なデータ拡張とその意味
      2.2. 一般的でないデータ拡張と用途   
      2.3. 生成モデルを用いたデータ拡張
      2.4. 生成モデルを用いた設計

  3. ドメイン適応と転移学習
      3.1. 転移学習
      3.2. ドメイン適応
      3.3. ドメイン適応を用いたデータ拡張

  4. その他の話題