タグ

機械学習とAWSに関するskypenguinsのブックマーク (2)

  • AWSのEC2 P2スポットインスタンスにCUDA8.0とChainerをセットアップ - はらぺこらいおん

    AWSでP2インスタンスがリリースされました!(結構前になりますが。。。) Amazon EC2 P2 インスタンス| AWS 今までのG2インスタンスやElasticGPU(インスタンスにアタッチできるGPU)より、汎用的な計算に向いており、Tesla K80を搭載しているようです。 今回はp2.xlargeのスポットインスタンスを使ってみたいと思います。簡単に行いたい場合はオンデマンドインスタンスの方が良いです。オンデマンドインスタンスの場合、NVIDIA公式からドライバー等がセットアップされたAMI(OSのテンプレートみたいなもの)が提供されているためです。 それでもなぜスポットインスタンスを使うのかというと、価格が安いからです。以下に料金がありますが、P2インスタンスの中で一番小さいp2.xlargeで$0.9/1 時間(約100円/1時間)となります。バージニア北部リージョンの場

    AWSのEC2 P2スポットインスタンスにCUDA8.0とChainerをセットアップ - はらぺこらいおん
  • AWS スポットインスタンスでの TensorFlow 学習の自動化 - Qiita

    mizti さんの AWS Step FunctionsとLambdaでディープラーニングの訓練を全自動化する を自分の求めるものに従って微修正したものです。 背景 AWS の高性能 GPU マシン、 p2 インスタンスで DeepLearning (TensorFlow) の学習を回したい でも p2 は高い!! スポットインスタンスを使うと安い! しかしスポットインスタンスは実行中に入札額によって強制シャットダウンされる 学習中データを定期的に S3 にアップロードしたい スポットインスタンスを立ち上げて学習開始するのを自動化したい 学習完了時に勝手にインスタンスをシャットダウンしたい 仕様 学習開始の Slack 通知 データ格納先の S3 のチェック bucket は存在するか? 既に学習結果格納ディレクトリが無いか?(上書きしないようチェック) スポットインスタンスへの入札と、結

    AWS スポットインスタンスでの TensorFlow 学習の自動化 - Qiita
  • 1