Python でのデータ解析に必須!? Jupyter Notebook に挑戦してみた | SiTest (サイテスト) ブログ

メニューボタン閉じるボタン

Python でのデータ解析に必須!? Jupyter Notebook に挑戦してみた

データ解析でよく使われる言語の一つに Python があります。
データ解析をする際は、どんなデータか表形式で見てみたり、
散布図や棒グラフなどでプロットしてみたりと、
試行錯誤することが多いかと思います。

そんな過程を、実際に実行できる処理の形として残せるのが
Jupyter Notebook ( Ipython )です。
その Jupyter Notebook についての入門編です。

Jupyter Notebook をインストールする

一般的には Anaconda を使ってインストールすることが多いらしいですが、今回は別の方法でインストールしています。
環境は、 Mac の OS が Sierra です。

流れとしては、以下のようになります。
■ Homebrew のインストール(こちらは説明省略)
■ pyenv のインストール
■ 対象のバージョンの Python のインストール
■ Jupyter Notebook のインストール

pyenv のインストール

pyenv とは、 Python バージョン管理を行うためのツールです。
Homebrew は最新にしておいてください。

$ brew install pyenv
$ echo 'export PYENV_ROOT="$HOME/.pyenv"' >> ~/.bashrc
$ echo 'export PATH="$PYENV_ROOT/bin:$PATH"' >> ~/.bashrc
$ echo 'eval "$(pyenv init -)"' >> ~/.bashrc
$ source ~/.bashrc

上記のコマンドをを実行します。
1行目で pyenv がインストールされ、
2行目以降では、 pyenv のパスが設定されます。

対象のバージョンの Python のインストール

pyenv を使って、 Python をインストールします。

$ pyenv install 2.7

今回はバージョン2.7にしてみました。

$ pyenv local 2.7

インストールしたら、任意のディレクトリで、上記のコマンドを実行します。
このコマンドでは、そのディレクトリで有効な Python のバージョンを設定できます。

$ python -V
Python 2.7

うまく設定できているか、バージョンを確認してみましょう。
指定したバージョンが表示されればOKです。

Jupyter Notebook のインストール

Python の設定ができると、自動的に pip がインストールされているはずです。
※ バージョンによっては別途インストールが必要

$ pip install jupyter

上記のコマンドで、 Jupyter Notebook をインストールします。

$ jupyter --version
4.3.0

上手くインストールできているとバージョンが表示されます。

Jupyter Notebook を起動して、 Notebook を作成

これまでで、 Jupyter Notebook のインストールができました。
では、起動して Notebook を作成しましょう!

Jupyter Notebook の起動

$ jupyter notebook

上記のコマンドで、 Jupyter Notebook が立ち上がります。
出力された内容に以下の様なURLが含まれているので、そちらを開きます。
http://localhost:8888/?token=xxxx

JupyterNotebook起動直後

すると、ブラウザで上記のように Jupyter Notebook が現れます。

Jupyter Notebook の作成

では、 Notebook を作成しましょう。

Notebookの作成

上記のように、右上の New ボタンを押して、 Python のバージョンを選択します。

Notebook作成直後

するとこのように、 Notebook が作成されて、開かれます。

ソースコードを動かす

ここでは、以下の内容を見ていきます。
■ 文字列出力
■ グラフを描いてみる
■ ショートカットを確認

文字列出力

まずは定番の Hello World! をしましょう。

print("Hello Jupyter Notebook!")

このように入力し、 Option + Enter を押します。
再生ボタンを押しても構いません。

HelloWorld
すると、このように「Hello Jupyter Notebook!」が表示されます。

グラフを描いてみる

グラフを描く前に以下のコマンドで、モジュールを入れておきます。

$ pip install numpy
$ pip install matplotlib

numpy は数値計算を効率的に行うためのモジュールです。
matplotlib はグラフ描画モジュールです。

%matplotlib inline
import numpy as np
import matplotlib.pyplot as plt
x = np.linspace(0, 10, 100)
y  = np.sin(x)
plt.plot(x, y)

この処理を書いて実行すると、sinカーブが描画されます。
グラフ描画

「%matplotlib inline」はグラフ描画のお作法です。
「import 〜」でモジュールをインポートして、「as 〜」で名前を定義します。
「np.linspace(0, 10, 100)」で、0から10までの間で100個の等間隔データを作成します。
「plt.plot(x, y)」で、グラフを描画しています。

ショートカットを確認

Jupyter Notebook には、便利なショートカットが多数用意されています。
コマンドモードで h を押すと、以下のように確認できます。

ショートカット集

さいごに

Jupyter Notebook の名前の由来は、 Julia + Python + R という言語が使えることから来ているらしいです。
木星の Jupiter とはスペルも別なんですね。

今回は入門編で、簡単に Jupyter Notebook の使い方を説明しました。
いずれ Jupyter Notebook で、 Tensorflow にチャレンジしてみたいと思います。
お楽しみに!