統計解析のための専用言語R(R言語)とは

杉山貴章(オングス)
2011-11-29 19:47:00
  • このエントリーをはてなブックマークに追加
最新特集【一覧】

R(R言語)とは

 「R(またはR言語とも呼ぶ)」は、オープンソースの統計解析向けのプログラミング言語とその開発実行環境である。現在はR Development Core Teamによって開発およびメンテナンスが進められており、GPLにもとづいて無料で利用することができる。LinuxやFreeBSDをはじめとするUNIX系OSやMac OS、Windowsなど、複数のOSでの開発・実行に対応している。

 Rは利用目的を統計解析に特化した言語であり、データを効率的に操作・保管するための仕組みや、配列や行列の演算をサポートした演算子のセット、結果を可視化するためのグラフ作成機能などを備えている。プログラミング言語としては条件分岐やループ処理、ユーザー定義の再帰的関数、テキスト形式のデータ入出力などといった基本的な機能を備えているほか、オブジェクト指向の手法も取り入れている。

 最大の強みは、多くの標準的な統計手法を標準でサポートし、それらを簡単なコマンドで実行できる点である。さらにパッケージによる拡張機構も備えており、追加パッケージを導入すれば標準ではサポートされない関数やデータセットなどを利用することができるようになる。パッケージはCRAN(The Comprehensive R Archive Network)と呼ばれる仕組みを利用して配信されており、これによってインターネット経由で随時パッケージの検索やインストール、アップデートなどを行うことが可能。CRAN上では世界中のユーザーが作成したパッケージが公開されており、非常に幅広い分野の統計手法がカバーされているほか、近年では統計学以外にも様々な業界や学問分野で利用されているという。

 Rの位置づけは、プログラミング言語の処理系を中心とした環境の上に、統計的な手法が実装されているといったものである。また、R言語という呼ばれ方が一般的なことからプログラミング言語の一種としてのイメージが強いが、グラフィカルな実行ツールや高度なパッケージ管理システムを備えていること、コマンド的に統計処理を実行できるなど、単なる言語にとどまらない統合的な環境が成立している。

Rの使用方法

 Rの実行環境は、各種パッケージと同様にCRANのミラーサイトからダウンロードすることができる。図1はWindows版をインストールして起動した例である。

 「R Console」はRを対話的に利用するためのコンソール画面であり、Rのコードを1行ずつステップバイステップで実行することができる。スクリプトをファイルに保存するには、[ファイル]メニューから[新しいスクリプト]を選んでスクリプトエディタを立ち上げて、このエディタ上にスクリプトを記述すればよい。スクリプトエディタからスクリプトを実行するには、実行したい箇所を選択した上で、マウスを右クリックして[カーソル行または選択中のRコードを実行]を選べばよい。またはメニューバーのアイコンや[Ctrl]+[N]のショートカットキーなどでも実行できる。

 パッケージをインストールするには、[パッケージ]メニューから[パッケージのインストール]を選択する。そしてCRANのミラーサイトを選んで、インストールしたいパッケージを探せばよい。インストールに成功したら[パッケージ]-[パッケージの読み込み]メニューで表示されるパッケージ一覧に追加されるので、このリストから実行したいパッケージを選べばよい。もし依存する別のパッケージが必要な場合には、このときに追加することができる。図3は「Rコマンダー」(パッケージ名は「Rcmdr」)をインストールして実行した例である。Rコマンダーはマウス操作で統計処理を実行するためツールだ。

オブジェクト指向を取り入れたRの演算例

  • コメント(3件)
#1 R user   2011-12-02 19:56:04
最後のサンプルは

plot(sin,xlim=c(0,2*pi))

のほうが綺麗かもしれませんね。
#2 ac   2011-12-05 21:00:28
同じことですがcurve(sin,0,2*pi)の方がタイプ量が少なくて済みます
#3 TT   2011-12-14 12:29:55
result <- vector1 * vector2 # 結果は(4,8,16)
??
結果は(4,10,18) じゃないですか?
  • 新着記事
  • 特集
  • ブログ