Rをはじめよう 生命科学のためのRStudio入門

  • ページ数 : 254頁
  • 書籍発行日 : 2019年3月
  • 電子版発売日 : 2019年6月14日
¥3,960(税込)
ポイント : 72 pt (2%)
今すぐ立ち読み
今すぐ立ち読み

商品情報

内容

基本的な考え方と作業の流れを理解◎難しい統計の理論は(ほとんど)ないので、わかりやすい!

リンゴ収量やウシ生育状況,カサガイ産卵数...イメージしやすい8つのモデルデータを元に手を動かし,堅実な作業手順を身に着けよう。行儀の悪いデータの整形からsummaryの見方まで,手取り足取り教えます。

序文

訳者からの序

この本は、たとえば大学で研究室配属になって「あぁ......これから統計解析の勉強をしなきゃ......やっぱパソコンとか使わないといけないよね......」と憂鬱な気分になっている学生が、とりあえず何も考えずに買っても大丈夫な本です。この本にしたがって統計解析の実習をやることで、解析作業の基礎的なステップが身に付きます。使うのは、パソコンとRStudioです。世の中ではパソコンと言えばWindowsが多い一方、生命科学分野の研究室ではMacが増えていると思いますが、RStudioの使い方はどちらでも同じです。さらにRStudioはパソコンがなくても、タブレットでも使えます(RStudio Cloudというのがブラウザから使えます)。つまりいろんな人が、この本1冊で勉強できるわけです。大学の研究室や高校の部活(学生だけでなく先生たちにも)、またデータサイエンスに興味を持つ企業の研究チームなどにも最適です。Rはバージョンアップがよくありますが、この本にはRversion 3.5.1/RStudio 1.1.463をWindows 10での結果を載せています。Rのバージョンなどによっては実行結果が少し違ったりするかもしれませんが、大きな問題になることはないだろうと思います。

この本には、統計そのものの原理や検定の理論の解説はほとんどありません。統計解析の知識が少しある人に向けて、堅実な結論を出すための作業手順をケーススタディで練習する内容です。なので、最初のページから順に進んでいくように書いてあります(知りたいところだけを必要な時に抜き出して読む、というような書き方にはなっていません)。このような作業手順を身に付けるのは、間違った結論を出して、そうとは知らずに堂々と主張する、といった悲劇を避けるためです。多くの統計検定には、データの分布やモデルの当てはまり方などについて前提条件があります。また、データを観測した時の実験計画の意図をよく理解していないと、適切なモデルを選べません。これらの点について繰り返し実習して、どんなデータ形式にどんな検定法を使うのかを体験しつつ、作業手順を体で覚えるのがこの本の目的です。

近年、人工知能やビッグデータといったキーワードが注目されていますが、この本はそのどちらも扱っていません。ただ、これらはデータサイエンスの一分野です。そしてこの本はデータサイエンスのもっとも重要な基礎を身に付けるためのものです。生命科学分野でビッグデータ解析に興味を持っている人も、基礎的な解析作業を身に付けておいて損はありません。むしろ、身に付けておくべきだろうと思います。これが、自分の扱おうとしているデータがビッグデータかどうかを判断する力の基礎にもなるでしょう。

生命科学分野では、遺伝子発現データを始めとして大規模な数値データがよく見られますが、これらは必ずしもビッグデータではありません。遺伝子数が多くてもサンプル数が少なければ、各遺伝子についてはむしろ小サンプルです。小サンプルデータの解析にはしばしば落とし穴があって、出版されている論文でも怪しい統計解析がときどきあります。その原因の一部は、モデルが適切でなかったり、データの分布が前提を満たしていなかったりすることです。これにはやはり、適切で堅実な作業手順を身に付けることが重要です。

この本はまさにそのための本です。「基礎的で堅実な作業方法」が主題なので、これ一冊あれば生命科学分野の統計解析法は一通りわかるといった網羅性は(全然)ありません。実際の研究現場では、この本に載ってない解析法をたくさん調べて使う必要があります(たとえば、フィッシャーの正確確率検定とかウィルコクソンの順位和検定とか、またいろんな次元縮約も重要です)。RStudio(が内部で使っているR)には必要な機能はほぼすべて揃っていますが、それを使うためには、自分でやり方を調べる必要があります。と言っても臆することはありません。この本で基本的な考え方と作業の流れを理解したなら、応用的なことを理解する力も備わっていると言えるでしょう。この本の中では「Rのヘルプ画面が役に立つ」と書いてありますが、全部英語なので、敷居が高いと思ったら調べものはネット検索か、または自分にとってわかりやすい解説書を探すとよいと思います。

この本は、楽しい本です。また、難しい統計の理論は(ほとんど)ないので、わかりやすいと思います。ちゃんと解析して、堅実な結論を出して、きれいな図を描くと、一流の研究者がやっているのと同じ統計解析が自分にもできた、この結論は自信を持って発表できるのだ、という喜び、うれしさが沸いてきます。「自信が持てる結論と発表のための解析手順を身に付けて、楽しく、みんなの役に立つ研究ができる」のが幸せな研究生活だろうと思います。みなさんがそうできるよう、心より祈っています。この本の原著者らは楽しくやってそうですしね。


2019年2月

富永 大介

目次

訳者からの序

前書き

この本を書いた理由

この本は何の本なの?

この本の構成

Rを使う理由

この本のアップデート

謝辞

第1章 Rと仲よくなろう

1.1.はじめてみる

1.2.まずはRをインストールする

1.3.RStudioをインストールする

1.4.どこからはじめるか

1.5.とりあえずデカい電卓として使ってみよう

1.6.スクリプトを書いてみる

1.7.総まとめ(ここまでの)

1.8.大事なのはパッケージ

1.9.いつでもヘルプ

1.10.本格的な例(ちょっとだけ)

1.11.最初のうち(そして今後も)うまくやっていくコツ

付録1a.課題の解答例

付録1b.ファイルの拡張子とOSによる違い

第2章 データを読み込む

2.1.読み込むデータを用意する

2.2.Rにデータを読み込む

2.3.読み込まれているのが自分のデータかどうか、ちゃんと確認する

2.4.ありがちなトラブル

2.5.まとめ

付録2.応用編―うまく整理されていないデータをどうにかするには

第3章 dplyrでデータを整える

3.1.各変数の統計量を見る

3.2.dplyrの命令

3.3.行や列の取り出し

3.4.データの変換と追加

3.5.ソート

3.6.ここまでのまとめと、2つの技

3.7.データの各群の要約統計

3.8.これまでに学んだこと

付録3a.dplyrとそれを使わない方法の比較

付録3b.dplyr応用編

第4章 データを図で見る

4.1.どんなデータでも最初に図を描く

4.2.ggplot2の作法

4.3.箱ヒゲ図

4.4.分布の様子:数値変数のヒストグラム

4.5.プレゼンや論文に使う図を保存する

4.6.終わりに

第5章 統計解析をちゃんとした手順でやってみる

5.1.まずはRで統計解析をはじめてみよう

5.2.χ^2分割表を使った解析

5.3.二標本t検定

5.4.線形モデルという種類の解析法

5.5.シンプルな線形回帰

5.6.一元配置分散分析(one-way ANOVA)

5.7.まとめ

付録5.CRAN以外からのパッケージのインストール

第6章 もっと高度な統計解析をやろう

6.1.さらに高度で複雑な統計解析

6.2.二元配置分散分析(two-way ANOVA)

6.3.共分散分析(ANCOVA)

6.4.この章の概要:解析のはじめから終わりまでの流れ

第7章 一般化線形モデル(GLM)を使ってみる

7.1. はじめに

7.2. 計数データと比率データ:ポアソンGLM

7.3. ダメなやり方がどうダメなのか、やってみる

7.4. 正しいやり方―ポアソンGLM

7.5. 計数データなのにポアソンGLMが適さないときは?

7.6. まとめとポアソン回帰の先

第8章 プロットをきれいに整える:ggplotで座標軸とテーマをいじる

8.1. ここまでに出てきたプロットの技

8.2. 新しいプロットの準備

8.3. 変えたいところはたくさんある

8.4. 軸ラベル、軸の範囲、注釈

8.5. プロット範囲と目盛り

8.6. theme() で全体の様子をいじる

8.7. まとめ

第9章 終わりに:最後のコメントとはげまし

巻末付録

巻末付録 1.データの出典

巻末付録 2.参考文献

巻末付録 3.R.Markdown


索引

便利機能

  • 対応
  • 一部対応
  • 未対応
便利機能アイコン説明
  • 全文・
    串刺検索
  • 目次・
    索引リンク
  • PCブラウザ閲覧
  • メモ・付箋
  • PubMed
    リンク
  • 動画再生
  • 音声再生
  • 今日の治療薬リンク
  • イヤーノートリンク
  • 南山堂医学
    大辞典
    リンク
  • 対応
  • 一部対応
  • 未対応

対応機種

  • ios icon

    iOS 10.0 以降

    外部メモリ:7.1MB以上(インストール時:18.1MB以上)

    ダウンロード時に必要なメモリ:28.4MB以上

  • android icon

    AndroidOS 5.0 以降

    外部メモリ:35.2MB以上(インストール時:74.1MB以上)

    ダウンロード時に必要なメモリ:140.8MB以上

  • コンテンツのインストールにあたり、無線LANへの接続環境が必要です(3G回線によるインストールも可能ですが、データ量の多い通信のため、通信料が高額となりますので、無線LANを推奨しております)。
  • コンテンツの使用にあたり、M2Plus Launcherが必要です。 導入方法の詳細はこちら
  • Appleロゴは、Apple Inc.の商標です。
  • Androidロゴは Google LLC の商標です。

書籍情報

  • ISBN:9784758120951
  • ページ数:254頁
  • 書籍発行日:2019年3月
  • 電子版発売日:2019年6月14日
  • 判:B5判
  • 種別:eBook版 → 詳細はこちら
  • 同時利用可能端末数:3

まだ投稿されていません

特記事項

※今日リンク、YNリンク、南山リンクについて、AndroidOSは今後一部製品から順次対応予定です。製品毎の対応/非対応は上の「便利機能」のアイコンをご確認下さいませ。


※ご入金確認後、メールにてご案内するダウンロード方法によりダウンロードしていただくとご使用いただけます。


※コンテンツの使用にあたり、M2Plus Launcher(iOS/iPhoneOS/AndroidOS)が必要です。


※書籍の体裁そのままで表示しますため、ディスプレイサイズが7インチ以上の端末でのご使用を推奨します。