化学品の市場調査、研究開発の支援、マーケット情報の出版

機械学習を用いたデータ分析を行う際の正しい手順,注意点を分かりやすく解説!

R&D支援センターセミナー

       開催日時:2019年2月18日(月)10:30~16:30
       会  場:商工情報センター(カメリアプラザ) 9F 会議室
                → 会場へのアクセス 
       参 加 費:49,980円(税込、昼食・資料付)

講 師

 ㈱日立製作所 研究開発グループ 知能情報研究部 主任研究員  鴨志田 亮太 氏

【専 門】
 機械学習・最適化技術を利用したシステムの研究開発/データ分析プロセス習熟サポートに関する研究

【活 動】
 トップエスイー(http://www.topse.jp/ja/)講師(2018年11月現在)
 未習熟者の機械学習によるデータ分析を支援するPythonライブラリ「MALSS」(https://github.com/canard0328/malss)の開発

定 員

 30名

受講対象・レベル

 機械学習を用いたデータ分析を行う初学者,データ分析の結果を受け取りその妥当性を判断する必要のある方,データ分析を外部に依頼する方

習得できる知識

 ・機械学習を用いたデータ分析の正しい手順
 ・分析の質を向上させるためにやるべきこと,やってはいけないこと
 ・データ分析時の落とし穴

趣 旨

 機械学習・ディープラーニング・人工知能技術の流行により、これらの技術を用いてビジネスの課題を解決するデータサイエンティストという職種が注目を集めています。
機械学習・ディープラーニングについてはさまざまな書籍が刊行され、オープンソースのライブラリも充実してきています。これらの書籍を参照し、ライブラリを利用することで、誰でも簡単に機械学習を利用したデータ分析を行うことが可能となりました。
しかし、実際のビジネスに機械学習技術を適用するためには、ライブラリを利用できるだけでは不十分です。
 データの前処理やパラメータの調整、結果の評価手法など、データ分析の正しいやり方・手順を理解していなければ、質の高い分析結果を得ることができないだけでなく、誤った判断を下してしまう危険性もあります。
また、データ分析を外部に委託する場合も、分析結果の妥当性を正しく判断するためには、分析を依頼する側にも正しい知識が求められます。
本セミナーでは、データ分析の正しいやり方・手順を学び、自分自身でデータ分析を行えるようになること、または他者のデータ分析結果を正しく評価できるようになることを目指します。

プログラム

1.データの前処理・扱い方
  1-1 データ分析のためのデータ形式
  1-2 特徴量(説明変数)の分類
  1-3 カテゴリ変数の扱い方
  1-4 欠損値の扱い方
  1-5 データの正しい可視化方法
  1-6 データ収集・整形時の注意点

2.機械学習の基本と利用時の留意点
  2-1 機械学習とは
  2-2 機械学習によるデータ分析でできること
  2-3 代表的なアルゴリズム
  2-4 データ特性に応じた手法の選択
  2-5 ディープラーニングとは
  2-6 ディープラーニングの使いどころ

3.分析結果の評価法
  3-1 回帰モデルの評価基準
  3-2 分類(識別)モデルの評価基準
  3-3 精度以外の評価基準の重要性
  3-4 適合率・再現率・F値
  3-5 ROC曲線・AUC

4.機械学習によるデータ分析の進め方
  4-1 パラメータ調整の必要性とその方法
  4-2 過学習とその対策(交差検証法など)
  4-3 バイアスとバリアンスについて
  4-4 学習曲線による現状の把握

5.ビジネスへの適用について
  5-1 分析結果を現場にどう受け入れてもらうか
  5-2 機械学習の前にやるべきことはないか
  5-3 実運用時の課題
  5-4 その分析は解くべき課題を解決するものか
  5-5 分析結果の公平性
  5-6 真実は常に一つ?
  5-7 ディスカッション