機械学習ですぐに使えるモデル集/インフラ参考

機械学習ですぐに使えるモデル集

どうも、Yuki Hiraiです。

今日は前回の続きで

Google Developers ML Summit Tokyo 2018

に参加してきた際のメモを書いていきます。

前回の記事はこちらからどうぞ

TensorFlow/Cloud ML の概要(機械学習・人口知能の活用例)

機械学習はモデルの選定にセンスが必要

機械学習のモデルを一から構築できる専門家が少ないため

Googleでは

AI(機械学習)の民主化がミッション

となっている。

Googleを活用すれば
機械学習モデル開発のライフサイクルはざっくり以下のような流れになる。

  1. 機械学習モデルの選定
  2. 機械学習モデルのカスタマイズ
  3. カスタムモデルの保守運用

1->2->3->2->1のサイクルを繰り返して開発していく。

特に1のモデルの選定にセンスが必要とされる。

様々な業界で様々な目的のために機械学習が使われていく。

  • 製造業 予測メンテナンス
  • 小売業 売り場での商品検索効率化
  • ヘルスケア 医療画像からの症状分析
  • メディア&エンターテイメント メディアコンテンツの検索性向上

目的に応じたモデルの選定が重要となる

機械学習ですぐ使えるサンプル・モデル集

TensorFlowが2015年にオープンソースとして世に公開されてから

様々な人々が独自に訓練したモデルのデータをオープンに公開していたりする。

そういったモデルをつかえば簡単に機械学習の恩恵を授かることができる。

以下のリンク集が役立つかも

なかでもAI Hubはワンストップカタログになろうとしているとのこと。
今後はここにくれば期待しているモデルがみつかる、くらいにしたいとのことだ。

機械学習を学習する上で便利なツール

Colaboratoryはとても便利。

1日を超える長時間のトレーニングはできないが
オンラインである程度強力な機械学習の学習ができる。

またColaboratoryはローカルのRuntimeに接続することができる。
Colaboratoryのフロントはそのまま使ってバックエンドを別に用意することができる。

Cloud Deep Learning VM Image(beta)も便利。
GCEインスタンスで利用できるディープラーニング用イメージ。

  1. 有名な機械学習フレームワークが導入済み
  2. 設定が不要
  3. JupyterLabで開発時の試行錯誤にかかる時間を大幅に短縮

といったように前準備がほとんどいらない状態でインスタンスを利用できる。

=> https://cloud.google.com/deep-learning-vm/

Google社内で利用されている機械学習プラットフォームとして

https://www.tensorflow.org/tfx/

がある。
これを一般でも使えるようにしたのがKubeflow Pipeline。

機械学習パイプラインの作成・実行・管理、そしてモジュールの再利用が簡単にできるよういんある。

機械学習パイプラインの定期実行
機械学習モデルの性能比較も簡単にできる優れもの。

デプロイ判断が迅速化する。

機械学習のインフラ周りを整備する際はぜひ使用したい。