2023.10.24作成  2024.3.14更新

これから研究を始める高校生と指導教員のために 第2版
探究活動と課題研究の進め方・論文の書き方・口頭とポスター発表の仕方
(これ研)

副読文書
作者 酒井 聡樹(東北大学大学院生命科学研究科)
sakaiあっとtohoku.ac.jp

私のサイトでの本書紹介文

共立出版の本書紹介サイト ご購入もこちらからどうぞ

 この文書は、「これから研究を始める高校生と指導教員のために 第2版;探究活動と課題研究の進め方・論文の書き方・口頭とポスター発表の仕方」(これ研)の第3部で行っている解析と作図を、統計作図ソフトR(Rの説明は次段落参照)を使って行う方法を解説したものです。Rのことをまったく知らない高校生が理解できるように、わかりやすく丁寧に説明しています。本文書と「これから研究を始める高校生と指導教員のために 第2版」を合わせ読んで、ぜひ、Rの使い方を身に着けて下さい。

 Rは、データ解析と作図を行うためのソフトです。世界中の専門家が開発に加わっており、日々改良が加えられています。その機能は、信じられないくらい素晴らしいです。作図能力はExcelをはるかにしのぎ、統計解析能力に至ってははるかにはるかにはるかにしのぎます。それなのに無料であり、インターネットから自由にインストールすることができます。そのため、さまざまな研究分野で標準的なソフトとなっています。大学・大学院で、データ解析を行う分野に進んだら、まず確実に使うことになります。Rは絶対に、あなたの大きな武器となるソフトです。

 Rを使うためにはパソコンが必要です。タブレットやスマートフォンでは使えません(使えなくはないが難しい)。パソコンをお持ちでない方は、学校のパソコンを使って下さい。

 質問等がありましたらお気軽に酒井まで。1) わかりにくい部分、2) 載せて欲しい解析もお教え下さい。改善の参考にします。

本文書の使い方

解析と作図のための事前準備

1. I. RおよびRStudioのインストールを読んで、RおよびRStudioというものをインストールして下さい。

2. II. RおよびRStudioの使い方の基本と作図の準備を読んで、使い方の基本を身に付けて下さい。作図のための事前準備もして下さい。

3. Rでは、Excelのファイルを読み込んで解析を行います。III. ExcelのファイルのRへの読み込み方の説明に従い、ExcelファイルをRに読み込んで下さい。

解析と作図

 「これから研究を始める高校生と指導教員のために 第2版」の第3部(p. 67)を読みながら、該当部分の解析と作図を行ってください。

本文書の目次

命令文集

I. RおよびRStudioのインストール(「これ研」本文の5.3.1項;p. 101)
  1. RおよびRStusioをダウンロードするサイト
  2. Rのインストール
    1. Windows版のRのインストール
    2. Mac版のRのインストール
  3. RStudioのインストール
    1. Windows版のRStudioのインストール
    2. Windowsで、RStudioをピン留めする
    3. Mac版のRStudioのインストール
    4. Mac版で、RStudioをDockに入れる
II. RおよびRStudioの使い方の基本と作図の準備(「これ研」本文の第3部5.3.2, 5.3.3項;p. 105)
  1. RStusioの起動の仕方
    1. Windows版の起動
    2. Mac版の起動
  2. Rの使い方
    1. RStudioの画面
    2. RStudioの使い方
      1. 命令文の書き込み
      2. 命令文の実行
      3. 実行結果の出力
      4. 図の保存・コピー
    3. 命令文ファイルの扱い方
      1. 新しい命令文ファイルの作成と保存
      2. 保存していた命令文ファイルを開く
      3. 命令文ファイルを書き替えて別ファイルとして保存
      4. 命令文ファイルを閉じる
  3. 作図の準備
  4. RStudioの終了の仕方
III. ExcelのファイルのRへの読み込み方(「これ研」本文の第3部5.3.4項;p. 110)
  1. 解析用フォルダの作成
    1. Windowsでのフォルダの作成
    2. Macでのフォルダの作成
  2. Excelでの、解析用ファイルの作成
  3. Excelで作った解析用ファイルのcsv形式での保存
  4. Excelで作った解析用ファイルのRへの読み込み
    1. 作業ディレクトリの指定
    2. 解析用ファイルのRへの読み込み
    3. データの並び順の指定
IV-1. 唯一の真の値がある対象の解析
条件に依存した、真の値の推定値の変化の解析
(「これ研」本文の第3部第2章;p. 71)
  1. 解析に用いるcsvファイルのRへの読み込み
  2. ペットボトルロケットの飛行距離の平均と標準誤差の計算(「これ研」本文の表3.1; p. 81)
    1. 全発射角度についてまとめて計算
    2. 特定の発射角度について計算
  3. ペットボトルロケットの飛行距離の平均と標準誤差の作図(「これ研」本文の図3.3; p. 80)
    1. 作図に用いる値の格納
    2. 作図
IV-2. 唯一の真の値がある対象の解析
複数の対象間での真の値の違いの示し方
(「これ研」本文の第3部2.3.1項;p. 79)
  1. 解析に用いるcsvファイルのRへの読み込み
  2. カフェイン量の平均と標準誤差の作図(「これ研」本文の図3.4; p. 80)
V-1. データの値がそもそもばらつく対象の解析
母集団間での、データ分布の違いの解析
(「これ研」本文の第3部第3.1, 3.2節;p. 84)
  1. 解析に用いるcsvファイルのRへの読み込み
  2. 統計量(平均・標準偏差・中央値・四分位数)の計算(「これ研」本文の第3部3.1.1, 3.1.2項;p. 85, 第3部5.3.6項; p. 115)
    1. 平均と標準偏差の計算(「これ研」本文の第3部3.1.1項;p. 85, 第3部5.3.6項; p. 115)
      1. 全地域についてまとめて計算
      2. 特定の地域について計算
    2. 中央値と四分位数の計算(「これ研」本文の第3部3.1.2項;p. 86)
      1. 全地域についてまとめて計算
      2. 特定の地域について計算
  3. 作図(「これ研」本文の第3部3.2項;p. 87)
    1. メダカの体長のヒストグラム(「これ研」本文の図3.7;p. 88)
      1. 全地域のヒストグラムを並べて描く
      2. 全地域のヒストグラムを一枚の図に描く
      3. 特定の地域のヒストグラムを描く
    2. メダカの体長の箱ひげ図(「これ研」本文の図3.8;p. 90)
      1. 全地域の箱ひげ図を並べて描く
      2. 特定の地域の箱ひげ図を描く
    3. メダカの体長の点グラフ(「これ研」本文の図3.9;p. 91)
      1. 全地域の点グラフ並べてを描く
      2. 特定の地域の点グラフを描く
    4. メダカの産卵数の棒グラフ(「これ研」本文の図3.10;p. 91)
      1. 全地域の棒グラフを並べて描く
      2. 特定の地域の棒グラフを描く
V-2. データの値がそもそもばらつく対象の解析
2種類のデータの関係性の示し方
(「これ研」本文の第3部3.3.1, 3.3.2項;p. 93)
  1. 解析に用いるcsvファイルのRへの読み込み
  2. 作図;メダカにおける、体長と産卵数の関係(「これ研」本文の図3.11;p. 94)
    1. 全地域の散布図を並べて描く
    2. 全地域の散布図を一枚の図に描く
    3. 特定の地域の散布図を描く
  3. 相関係数の計算;メダカにおける、体長と体重の関係(「これ研」本文の第3部3.3.2項;p. 95)
V-3. データの値がそもそもばらつく対象の解析
1種類のデータの解析の仕方
(「これ研」本文の第3部3.3.3項;p.96)
  1. 解析に用いるcsvファイルのRへの読み込み
  2. 作図;ミドリムシの走光性(「これ研」本文の図3.13;p. 97)
VI-1. アンケート結果の示し方
選択肢から1つを選んで回答して貰うアンケート(複数選択が不可)
他のアンケート結果との比較ではなく、そのアンケート結果における回答の分布を見ることが目的
  1. 解析に用いるcsvファイルのRへの読み込み
  2. 作図
    1. 円グラフの作図
    2. 帯グラフの作図
VI-2. アンケート結果の示し方
選択肢から1つを選んで回答して貰うアンケート(複数選択が不可)
関連する設問の間で回答の分布を比較することが目的
(「これ研」本文の第3部第4章;p. 98)
  1. 解析に用いるcsvファイルのRへの読み込み
  2. アンケート結果の集計
  3. 作図(「これ研」本文の図3.14;p. 99)
    1. 帯グラフの作図(「これ研」本文の図3.14; p. 99)
    2. 円グラフの作図(参考のため)(「これ研」本文の図3.14; p. 99)
VI-3. アンケート結果の示し方
選択肢から1つを選んで回答して貰うアンケート(複数選択が不可)
異なる設問の間での回答の関係性を見る場合
  1. 解析に用いるcsvファイルのRへの読み込み
  2. 作図
    1. 円グラフの作図(基礎情報として)
    2. 帯グラフの作図
VI-4. アンケート結果の示し方
選択肢から複数を選んで回答できるアンケート
  1. 解析に用いるcsvファイルのRへの読み込み
  2. 作図
VII. t検定(ウェルチのt検定)(「これ研」本文の第3部6.4節;p. 128)
  1. t検定の手順
  2. 解析に用いるcsvファイルのRへの読み込み
  3. 作図
    1. 就寝前および起床後の単語記憶成績のヒストグラム
    2. 同じ生徒の成績を線で結びつけた点グラフ
    3. 就寝前および起床後の単語記憶成績の箱ひげ図
  4. t検定
    1. データ間に対応のあるt検定
    2. データ間に対応のないt検定
  5. 正規分布かどうかの検定
VIII-1. 一般化線形モデル入門
一般化線形モデルで行うこと
(「これ研」本文の第3部6.6節;p. 133)
  1. 一般化線形モデルの解析の目的
  2. 確率分布とは
  3. 条件に依存した平均値の変化
    1. 説明変数が範疇の場合
    2. 説明変数が数値の場合
  4. 説明変数の値と応答変数の平均値の関係性:連結関数を用いた解析
  5. 一般化線形モデル実行の手順
    1. 解析したいデータのデータフレームへの格納
    2. 説明変数と応答変数の指定
    3. 適用する確率分布の指定
    4. 適用する連結関数の指定
    5. 一般化線形モデルの命令文の実行
    6. AICによる、確率分布と連結関数の選択
VIII-2. 一般化線形モデル入門
説明変数が範疇の場合の、各条件間での平均値の差の解析;確率分布が正規分布の場合
発射角度に依存した、ペットボトルロケットの平均飛行距離の差の解析
(「これ研」本文の第3部2.3節;p. 79)
  1. 解析に用いるcsvファイルのRへの読み込み
  2. 一般化線形モデルによる解析
    1. 適用する確率分布の指定
    2. 連結関数は比例(identity)に
    3. 一般化線形モデルの実行
  3. 多重比較における補正
  4. 作図
VIII-3. 一般化線形モデル入門
説明変数が範疇の場合の、各条件間での平均値の差の解析;確率分布がポアソンの場合
製造社間での、レーズンロールに入っている干し葡萄の平均数の差の解析
  1. 解析に用いるcsvファイルのRへの読み込み
  2. 一般化線形モデルによる解析
    1. 確率分布はポアソン分布に
    2. 連結関数は比例(identity)に
    3. 一般化線形モデルの実行
  3. 作図
VIII-4. 一般化線形モデル入門
説明変数が数値の場合の、目的変数の平均の依存性の解析
メダカにおける、体長と産卵数の関係の解析
(「これ研」の本文の第3部3.3.1, 3.3.2項;p. 93)
  1. 解析に用いるcsvファイルのRへの読み込み
  2. 一般化線形モデルによる解析
    1. 適用する確率分布の指定
    2. 適用する連結関数の指定
    3. 一般化線形モデルの実行
  3. 散布図への回帰式の描き込み
VIII-5. 一般化線形モデル入門
1種類のデータにおけるデータ分布の偏りの解析
条件の変化の影響を見ない場合
ミドリムシの走光性の解析
(「これ研」の本文の第3部3.3.3項;p. 96)
  1. 解析に用いるcsvファイルのRへの読み込み
  2. 一般化線形モデルによる解析
    1. 確率分布は二項分布(binomial)に、連結関数はS字(logit)に
    2. 本解析における説明変数
    3. 一般化線形モデルの実行
  3. 作図
VIII-6. 一般化線形モデル入門
1種類のデータにおけるデータ分布の偏りの解析
条件の変化の影響を見る場合
誇大広告の店に行くか正直な広告の店に行くかの選択の解析
  1. 解析に用いるcsvファイルのRへの読み込み
  2. 一般化線形モデルによる解析
    1. 確率分布は二項分布(binomial)に、連結関数はS字(logit)に
    2. データフレームの形式の変換
    3. 一般化線形モデルの実行
  3. 作図