統計解析をするならこれ!R言語基礎入門 | SiTest (サイテスト) ブログ

メニューボタン閉じるボタン

統計解析をするならこれ!R言語基礎入門

こんにちは、プロダクト開発チームの牧です。

統計解析やデータマイニングの解析手段として、一般的にPythonやR言語などのプログラミング言語が用いられるようになってきました。
便利と聞いていてもプログラミング言語を触るとなると、とても難しく感じてしまうかもしれませんがそんなことはありません!

今回は統計解析向けの言語として開発されたR言語について、構文の説明なども交えながらご紹介します。

R言語とは

cran.rstudio
R言語とはオークランド大学で開発された、OSSの統計解析向けプログラミング言語です。
柔軟な言語構成であり、複雑な計算処理を行える高速な組み込み関数群が常備されグラフ機能による視覚化もできるため、計算結果をすぐに視覚化することが出来ます。

最近では統計学にとどまらず、金融工学や機械学習、データマイニングなど幅広い分野で利用されています。
IEEE SPECTRUMが発表したThe 2016 Top Programming LanguagesではR言語が5位となっており、人気の高さが伺えます。
The_2016_Top_Programming_Languages_-_IEEE_Spectrum
利用場面としては、R言語でプロトタイプを作りPythonなどでシステムに組み込む使い方が多いです。
試しに解析してみたいという場合にはもってこいの言語となります。

環境構築

まずはR言語をインストールしてみましょう。
公式サイトからインストーラをダウンロードしインストールします。
次にR Studioと呼ばれるR言語用のIDE(統合開発環境)をダウンロードしインストールしましょう。

R言語はインタプリタで動く言語ですので、R Studioを使用しない場合はコマンドラインやターミナルなどで動かす必要があります。
R Studioを使うことでGUI上でR言語を触ることができますので、
今回のように試しに触ってみるときにはとても便利です。

早速触ってみる

RStudio_initial
R Studioを起動すると上記画像のような画面が表示されます。
左側のコンソール画面を使って色々遊んでみましょう。


# 四則演算
> (123 + 456 - 234) * 567 / 89 # 2197.921

# 変数
> a <- 123
> a # 123
> a * 345 # 42435

# 配列
> arr <- c(123, 456, 789)
> arr # 123 456 789

# 他のプログラミング言語と違い
# 配列へのアクセスは1から始まることに注意しましょう
> arr[1] # 123

# 配列を入れた変数の処理は配列全体に適用されます
> arr * 20 # 2460  9120 15780

# 関数の定義と呼び出し
> fn <- function(a, b){
  return(a * b)
}
> fn(2, 4) # 8
> fn(b=3, a=2) # 6

まとめ

今回はR言語の入門編ということでインストールから、一番基本的な簡単な構文までをご紹介しました。
次回からは色々なパッケージを利用してグラフを表示したり。Google Analytics のデータを解析していきたいと思います。
ぜひ次回を楽しみにお待ち下さい!