Cloud Datalabの使い方を解説!TensorflowのGPU環境を簡単構築

こんにちは!ピジョンです!

今日はPythonコードの実行に非常に便利なGoogle Cloud Datalabの使用方法を紹介したいと思います。

Google Cloud DatalabはGoogleのクラウドを利用していて、かつデータ分析を行っている方には必須のツールです。

なぜなら作業の効率性が圧倒的に増すからです。

データサイエンスに興味を持っている方はいずれ触れることになる思います。

それではさっそくみていきましょう。

スポンサーリンク

Google Cloud Datalabとは

Google Cloud Datalabとは簡単にいうと、データ分析に非常に便利なJupyter NotebookのGoogle版です。

Jupyter上に構築されているということで、AIサービス構築者に人気のPythonの実行環境が整っています。またデータ管理と視覚化の容易さはいうまでもありませんね。

Google Compute Engine上で動作するため、数テラバイトのデータを扱うことができます。GPUも実行可能になります。

今はGoogleのデータストレージやエンジンを利用する必要のあるデータサイエンティストには必須のツールです。

僕はこれからのデータ分析のあり方を体現するようなクラウドサービスだと思っています。

Datalab自体の利用料金は無料です。ただしコンピューティングやストレージのリソース料金は発生しますのでご注意を。

スポンサーリンク

前準備(Google Cloud Platformのセットアップ)

Datalabを扱うには事前に以下の3つの準備が必要です。どれも非常に簡単ですし、もちろん既に実行されている方は改めて実行する必要はありません

1. Google Cloud SDKのインストール
2. datalab コンポーネントのインストール
3. アカウントのアクセス権の取得

順を追ってみていきましょう。

1,2. Google Cloud SDKのインストール / datalab コンポーネントのインストール

これに関しては以下の公式ドキュメントが非常によくまとまっています。既に多くの方が実行済みだと思うので今回は説明はしません。

Cloud SDK のインストール

Cloud SDK コンポーネントの管理

3. アカウントのアクセス権の取得

CLIとアカウントとの紐付けは非常に簡単で次のコマンドで実行できます。ブラウザが自動的に起動するのでおなじみのGoogleログインを行ってください。

gcloud auth login

この使いやすさに関してはさすがGoogle様といった感じでしょうか。

アカウントの切りかえも次のコマンドで簡単に行えます。

gcloud config set account account-name

スポンサーリンク

Google Cloud Datalabの使い方

いよいよGoogle Cloud Datalabの使い方を説明します。

といってもDatalabの使い方はとっても簡単

Google Cloud Platfromプロジェクトに紐づけたDatalabインスタンスを作成するだけです。

そのインスタンスにローカルから接続するだけで、ブラウザからDatalabを使用することができます。

実際に行ってみたいと思います。以下の2ステップです。

1. プロジェクトの選択(紐付け)

まずプロジェクトの一覧を次のコマンドで表示します。

gcloud projects list

次のコマンドでgloud CLIとプロジェクトを紐付けます。project-idの値は今回使いたいプロジェクトIDにしてください

gcloud config set core/project project-id

次のコマンドでタイムゾーンの指定を行います。僕はタイムゾーンとしてus-west1-aを選択しました。

gcloud config set compute/zone zone

2. Datalab インスタンスの作成

さあようやく、次のコマンドでDatalab インスタンスの作成を行います。赤文字のinstance-nameは自分の好きなもの(一意)に設定してください。

datalab create instance-name

実行途中でパスワードの作成が求められると思うので、任意のパスワードを入力してください。
インスタンスの作成後は自動的にブラウザからDatalabを起動してくれます。

ブラウザはお好みのものをつかってください。ブラウザのurl入力バーにコンソールに表示されているローカルホスト(なにも設定しなければhttp://localhost:8081/)を打ち込めば大丈夫です。

次回からはこのインスタンスに次のコマンドで接続するだけでDatalabを簡単に使用できます

datalab connect instance-name

Cloud Datalabの試用が終了したら不要な課金を防ぐために次のコマンドでインスタンスの削除を実行してください。

datalab delete instance-name

  

どうでしたか。とっても簡単にDatalabを使用できることが分かったと思います。

次は実際にコードを実行してみてください。

下記リンク先にpythonライブラリのTensorflowの実行方法をまとめていますので、ぜひトライしてくださいね。とっても簡単です。

GPU動作確認をTensorFlowで行う方法!サンプルチュートリアルも
こんにちは!ピジョンです! 今日はGPUの動作確認をTensorFlowを通して行ってみたいと思います。 GPUの主な使...

スポンサーリンク

シェアする

  • このエントリーをはてなブックマークに追加

フォローする