Python でのデータ解析に必須!? Jupyter Notebook に挑戦してみた
データ解析でよく使われる言語の一つに Python があります。
データ解析をする際は、どんなデータか表形式で見てみたり、
散布図や棒グラフなどでプロットしてみたりと、
試行錯誤することが多いかと思います。
そんな過程を、実際に実行できる処理の形として残せるのが
Jupyter Notebook ( Ipython )です。
その Jupyter Notebook についての入門編です。
Jupyter Notebook をインストールする
一般的には Anaconda を使ってインストールすることが多いらしいですが、今回は別の方法でインストールしています。
環境は、 Mac の OS が Sierra です。
流れとしては、以下のようになります。
■ Homebrew のインストール(こちらは説明省略)
■ pyenv のインストール
■ 対象のバージョンの Python のインストール
■ Jupyter Notebook のインストール
pyenv のインストール
pyenv とは、 Python バージョン管理を行うためのツールです。
Homebrew は最新にしておいてください。
$ brew install pyenv
$ echo 'export PYENV_ROOT="$HOME/.pyenv"' >> ~/.bashrc
$ echo 'export PATH="$PYENV_ROOT/bin:$PATH"' >> ~/.bashrc
$ echo 'eval "$(pyenv init -)"' >> ~/.bashrc
$ source ~/.bashrc
上記のコマンドをを実行します。
1行目で pyenv がインストールされ、
2行目以降では、 pyenv のパスが設定されます。
対象のバージョンの Python のインストール
pyenv を使って、 Python をインストールします。
$ pyenv install 2.7
今回はバージョン2.7にしてみました。
$ pyenv local 2.7
インストールしたら、任意のディレクトリで、上記のコマンドを実行します。
このコマンドでは、そのディレクトリで有効な Python のバージョンを設定できます。
$ python -V
Python 2.7
うまく設定できているか、バージョンを確認してみましょう。
指定したバージョンが表示されればOKです。
Jupyter Notebook のインストール
Python の設定ができると、自動的に pip がインストールされているはずです。
※ バージョンによっては別途インストールが必要
$ pip install jupyter
上記のコマンドで、 Jupyter Notebook をインストールします。
$ jupyter --version
4.3.0
上手くインストールできているとバージョンが表示されます。
Jupyter Notebook を起動して、 Notebook を作成
これまでで、 Jupyter Notebook のインストールができました。
では、起動して Notebook を作成しましょう!
Jupyter Notebook の起動
$ jupyter notebook
上記のコマンドで、 Jupyter Notebook が立ち上がります。
出力された内容に以下の様なURLが含まれているので、そちらを開きます。
http://localhost:8888/?token=xxxx
すると、ブラウザで上記のように Jupyter Notebook が現れます。
Jupyter Notebook の作成
では、 Notebook を作成しましょう。
上記のように、右上の New ボタンを押して、 Python のバージョンを選択します。
するとこのように、 Notebook が作成されて、開かれます。
ソースコードを動かす
ここでは、以下の内容を見ていきます。
■ 文字列出力
■ グラフを描いてみる
■ ショートカットを確認
文字列出力
まずは定番の Hello World! をしましょう。
print("Hello Jupyter Notebook!")
このように入力し、 Option + Enter を押します。
再生ボタンを押しても構いません。
すると、このように「Hello Jupyter Notebook!」が表示されます。
グラフを描いてみる
グラフを描く前に以下のコマンドで、モジュールを入れておきます。
$ pip install numpy
$ pip install matplotlib
numpy は数値計算を効率的に行うためのモジュールです。
matplotlib はグラフ描画モジュールです。
%matplotlib inline
import numpy as np
import matplotlib.pyplot as plt
x = np.linspace(0, 10, 100)
y = np.sin(x)
plt.plot(x, y)
この処理を書いて実行すると、sinカーブが描画されます。
「%matplotlib inline」はグラフ描画のお作法です。
「import 〜」でモジュールをインポートして、「as 〜」で名前を定義します。
「np.linspace(0, 10, 100)」で、0から10までの間で100個の等間隔データを作成します。
「plt.plot(x, y)」で、グラフを描画しています。
ショートカットを確認
Jupyter Notebook には、便利なショートカットが多数用意されています。
コマンドモードで h を押すと、以下のように確認できます。
さいごに
Jupyter Notebook の名前の由来は、 Julia + Python + R という言語が使えることから来ているらしいです。
木星の Jupiter とはスペルも別なんですね。
今回は入門編で、簡単に Jupyter Notebook の使い方を説明しました。
いずれ Jupyter Notebook で、 Tensorflow にチャレンジしてみたいと思います。
お楽しみに!
-
お問い合わせ
SiTest の導入検討や
他社ツールとの違い・比較について
弊社のプロフェッショナルが
喜んでサポートいたします。 -
コンサルティング
ヒートマップの活用、ABテストの実施や
フォームの改善でお困りの方は、
弊社のプロフェッショナルが
コンサルティングいたします。
今すぐお気軽にご相談ください。
今すぐお気軽に
ご相談ください。
(平日 10:00~19:00)
今すぐお気軽に
ご相談ください。
0120-315-465
(平日 10:00~19:00)
グラッドキューブは
「ISMS認証」を取得しています。
認証範囲:
インターネットマーケティング支援事業、インターネットASPサービスの提供、コンテンツメディア事業
「ISMS認証」とは、財団法人・日本情報処理開発協会が定めた企業の情報情報セキュリティマネジメントシステムの評価制度です。