Rをつかってみよう

伊東宏樹

2025-05-10

本日の内容

  • Rとは?

  • RStudio

  • 基本的な使い方

  • Tidyなデータとデータ処理

  • グラフ作成

自己紹介

R歴

  • Rをつかいはじめたのは2003年はじめごろらしい(Ver. 1.6.1あたり)

【参考】

残っていた記録

R : Copyright 2002, The R Development Core Team
Version 1.6.1  (2002-11-01)

R is free software and comes with ABSOLUTELY NO WARRANTY.
You are welcome to redistribute it under certain conditions.
Type `license()' or `licence()' for distribution details.

R is a collaborative project with many contributors.
Type `contributors()' for more information.

Type `demo()' for some demos, `help()' for on-line help, or
`help.start()' for a HTML browser interface to help.
Type `q()' to quit R.

> library(survival)
> 
> abies <- read.table("abies_l.data", header=T)
> data <- abies[(abies$start %in% 19970101:19971231),]
> data$a <- (1 - data$a) * (1 - data$c)
> fit <- survfit(Surv(mo, a) ~ D + S, data=data)
> 
> postscript("abies_l.eps", horizontal=FALSE, height=(8/2.54), width=(8/2.54), pointsize=9)
> plot(fit, xlab="Months", ylab="Survival Rate", main="Abies homolepis (1997)",
+      xlim=c(0,70), ylim=c(0,1), col=c(2,2,4,4), lty=c(1,2,1,2))
> dev.off()
null device 
          1 

Rとは?

インストール

パッケージ

  • 特定の解析方法などの関数やデータ類をまとめたもの

  • CRANなどからインストールできる

  • マニアックな解析方法もたいていある

  • ユーザーが自分で作って公開できる

RStudio

RStudioの設定とか

実際の画面をご覧ください

GUI環境

コマンドラインの操作が苦手な方にはGUI環境もあり

R Commander

インストール

install.packages("Rcmdr", dependencies = TRUE)

起動

library(Rcmdr)
  • 手作業ではエラーしがち
    • → Rスクリプトを保存しておくとよい
      • 再現性の確保にもなる

実演(基本的な使い方)

  • 計算

  • ヘルプ

  • データの型

Tidyなデータとデータ処理

  • Tidy data(整然データ)

    1. 個々の変数 (variable) が1つの列 (column) をなす。

    2. 個々の観測 (observation) が1つの行 (row) をなす。

    3. 個々の観測の構成単位の類型 (type of observational unit) が1つの表 (table) をなす。

    4. 個々の値 (value) が1つのセル (cell) をなす。

整然データとはなにか

Tidyでないデータ

最高気温

都市 2025/5/1 2025/5/2
札幌 18.7 16.3
東京 23.8 18.7
那覇 26.0 24.6

Tidy data

都市 日付 最高気温
札幌 2025/5/1 18.7
札幌 2025/5/2 16.3
東京 2025/5/1 23.8
東京 2025/5/2 18.7
那覇 2025/5/1 26.0
那覇 2025/5/2 24.6

tidyverse

  • Tidyなデータ処理のためのパッケージ群
  • tidyverseパッケージ(メタパッケージ)
    • tidyr
    • dplyr
    • ggplot2
    • などなど

データの読み込み

  • CSVファイル

    • 標準のread.csv関数

    • readrパッケージのread_csv関数

  • Excelファイル

    • readxlパッケージのread_excel関数

RStudioではメニューからも実行可能

実演(パッケージ利用とTidy data)

  • パッケージの読み込み

  • Tidy data

  • tidyverseを使ったデータ処理

グラフの作成

  • Rのグラフ作成環境

    • デフォルトで組み込みのグラフ作成関数群(base graphics)

    • ggplot2

    • plotly など

実演(グラフの作成)

  • ggplot2パッケージを使用する方法

  • デフォルトのグラフィック環境(base graphics)を使用する方法

さらに知るには