フリーソフトRを使ったらくらく医療統計解析入門

  • ページ数 : 200頁
  • 書籍発行日 : 2016年2月
  • 電子版発売日 : 2016年9月30日
¥4,400(税込)
ポイント : 80 pt (2%)
今すぐ立ち読み
今すぐ立ち読み

商品情報

内容

高額な統計ソフトはもういらない!?

本書は「スクリプト」を記述する必要があり「難しい」という印象がある、「フリーソフトR」について、統計に必要なスクリプトをあらかじめ準備。そのスクリプトからRを実行でき、さらに実際にデータに基づいて学習ができ、初学者でも取り組みやすい内容となっています。

序文

はじめに─フリーソフトRの薦めと本書の特徴─

医学をはじめ,経済学,教育学,心理学などは人間を対象とした科学・学問です.人は複雑な生き物で,同じウイルスに感染しても発病する人もいれば,発病しない人もいます.病気の治療でも,ある薬剤で大きな効果のある人もいれば,効果のない人もいます.ある人の発症する可能性や,特定の人に対する薬剤の効果を予測することは簡単ではありません.また,がんや糖尿病などの生活習慣病には,原因物質への暴露状態,栄養状態,運動習慣,遺伝的要因など多くの因子が関係しています.これらの因子のうち何が重要かを特定するには,膨大な症例の蓄積が必要で,ひとりの医師の臨床経験だけでは不十分です.

統計学を使うと,上にあげた医療上の諸問題に対しての解答(エビデンス)を得ることができます.個人ごとの疾病の発症率の予測や,特定の薬剤の治療率や副作用の発生率を予測することも可能です.統計学では,過去のデータを集めて解析しますが,その結果は目の前の健康診断の受診者や患者の近未来の生活の質を最大にするために使われるのです.

統計処理には難しい計算が必要なので,苦手だと思う学生や医療関係者が多いでしょう.しかし,最近は質の良い統計ソフトウェアが開発されていますので,計算はコンピュータに任せればいいのです.皆さんは,統計的な判断のやり方を理解して,データの収集と統計手法の選択をするだけでいいのです.この本でも,R と名付けられたソフトウェアを使って医学統計の実習ができるようになっています.

統計ソフトウェアには,有名なSAS やSPSS などの市販されているものもありますが,医学論文に使われているオプションを含むと50 万円前後となり,学生個人や統計処理がときどき必要となるだけの医師にとってはあまりにも高価な商品となっています.R はフリーソフトで,インターネットのWeb サイトから無料でダウンロードでき,自由に使うことができます.R の解説書は無料で提供されていますし,日本語の解説書もインターネット上に多くの研究者から提供されています.また,医学論文で使われる最新の統計処理も網羅されています.世界中の統計専門家が協力して開発し,利用者数も多いので,信頼性は市販ソフトウェアと同等です.R を使って解析された医学論文は増えており,2015 年の英語論文は307件ありました(PubMed で"R package"で検索).市販ソフトウェアでは毎年のアップデートのたびに購入価格の半額程度も必要になりますから,これもかなりの経済的負担です.R は随時アップデートされており,更新もフリーなので最新の統計ソフトウェアを使えます.

本書は2007 年に刊行した「看護・福祉・医学統計学─ SPSS 入門から研究まで」(福村出版)の姉妹版です.R の出力結果はSPSSと全く同じであることを確認しています.

R で問題となるのはその操作性です.利用者としては,統計学やコンピュータの熟練者が想定されているために,簡単とはいえキーボードからスクリプトという文字列を入力して動かさなければなりません.しかも英語なので,統計やコンピュータが得意でない人では難解かも知れません.また,利用説明書が公開されてはいますが,ものすごく多くの統計手法が掲載されており,膨大なので見るべきページを探すこと自体が簡単ではありません.さらに,統計学やコンピュータの用語で書かれていますから,やはり難解です.

本書では,医学領域で使われるほぼすべての統計手法を,簡単なものから最新の多変量解析や多重比較までを分類整理して,わかりやすく説明しています.数式は,結果を理解するために必要なものだけの最小限にとどめてあります.難解な統計処理は,PC画面の画像を掲載して,R での操作手順を丁寧に示しました.

本書の最も大きな特徴は,実際のデータに基づいて実習しながら理解できるようにしたことです.本書には豊富な事例を掲載しています.これらのデータは,ほとんどが実際の研究に使われたもので,統計処理の具体的な理解や,統計処理用データのつくり方に役立つと思われます.本書にる【例】では,詳細な処理手順と結果を示しており,各自のデータをつくるときに参考になり,教師が授業で説明するときの事例になります.【問】は,巻末に略解を掲示しており,読者の復習や学習達成度の確認や,教師が学生に対する課題として使うこともできます.付録の「Rスクリプト一覧」や「統計処理のガイダンス」も役立つはずです.

実習で必要となるR,事例データ,R スクリプトは,中山書店のサイトからダウンロードできます.なお,ダウンロード方法については序章をご参照ください.

ダウンロードしたR スクリプトを使えば,ほとんどマウス操作だけで実習ができます.また,皆さんが収集したデータの統計処理を行いたい場合は,スクリプトに含まれるデータファイル名と変数名を置き換えれば,後はマウス操作で統計処理を行うことができます.スクリプトに慣れてくれば,本書の範囲を超えてR の大きな世界にチャレンジすることも夢ではありません.

2016 年1 月

東海大学名誉教授

大櫛陽一

目次

はじめに

序章 統計ソフトRのインストールと使い方

A Rの特徴と動作環境

B Rのインストール

1.Rスクリプト・R_dataのダウンロード

2.Rのインストール

C Rの使い方

1.Rを走らせる

2.実習用スクリプトの読み込み

3.ディレクトリ(フォルダ)の固定方法

4.実習用スクリプトを使ってみる

5.スクリプトの修正と保存

6.終了手順と再開手順

第1章 統計の基礎

A Rによる統計処理の基礎的知識

1.「EXCEL」でデータを作成する

例1.1 データの読み込みと確認

2.Rでデータセットの読み込み

1)テキストデータの読み込み

2)EXCEL ファイルの読み込み

3.Rでデータセットの確認

4.Rのデータセットの構造

5.変数名の明示化(データセットの1 行目を変数名に使える)

6.ケース(行)の抽出

7.一部の変数のみを抽出したデータセットを作成

8.変数の抽出

9.変数の追加

10.Rでの注意点

11.Rの式と関数

12.統計関数

13.Rのデータタイプ(型)

B 記述統計

1.データの種類

1)データ

(1)スケール(間隔・比率尺度)に基づくもの

(2)順序尺度(順位尺度)に基づくもの

(3)名義尺度(名目尺度)に基づくもの

(4)2値データ

問1.1 次のデータはどの尺度か?

2)基本統計量

(1)代表値(中心傾向の測度)

(2)ばらつきを表す値(ばらつきを表す測度)

コラム 数式が苦手な人のために

例1.2 代表値の計算

例1.3 ばらつきの計算

例1.4 基本統計量の計算

問1.2

3)分布型の話

問1.3

4)正規分布

例1.5 偏差値の使い方

問1.4

例1.6 中性脂肪に対する正規性の検定(Shapiro-Wilk検定)

例1.7 中性脂肪の対数変換とその正規性の検定

5)不偏推定量

問1.5

6)平均値の標準偏差が標準誤差となる理由

7)グラフ表示

例1.8 ヒストグラムと箱ひげ図

C データの収集

1.対照群の必要性

2.無作為抽出または無作為割り当てとマッチング

(1)無作為抽出

(2)無作為割り当て

(3)マッチング

問1.6

問1.7

3.無記名アンケートと二重盲検法

4.層別化

例1.9 層別化を必要とする例

D 統計的判断とは

1.仮説検定

2.両側検定と片側検定

3.仮説検定の立て方と検定用統計量

4.統計処理についての手順と注意

(1)研究計画とデータの収集

(2)統計前処理

(3)統計ソフトの選択

(4)統計手法の選択

(5)比較の方法

第2章 2群の比較

A 母集団と標本との比較

1.母平均と標本平均の比較(スケールの場合)

1)正規分布するデータで母SDが既知の場合:Z検定

2)正規分布するデータで母SDが未知の場合:t検定

例2.1 母平均と標本平均の比較(1標本t検定)

問2.1 全国平均との比較(1標本のt検定)

2.母比率と標本比率の比較(1標本カイ2乗検定)

1)カイ2乗検定(1標本カイ2乗検定)

例2.2 母比率と標本比率の比較(1標本カイ2乗検定)

問2.2 全国比率との比較(1標本のカイ2乗検定)

B 対応のある2群の比較

1.正規分布をしている場合:対応のあるt検定

例2.3 2群の比較:正規分布をしている場合:対応のあるt検定

問2.3 肥満対策の評価(対応のあるt検定)

2.符号付き順位和検定(WilcoxonのT検定)

例2.4 符号付き順位和検定(WilcoxonのT検定)

3.符号検定(S検定:sign test)

例2.5 符号検定(S検定:sign test)

C 独立した標本の比較

1.母SDが既知で等しい場合:Z検定-1

2.母SDは既知であるが等しくない場合:Z検定-2

3.等分散性の検定(F検定)

1)母分散は未知でF検定で分散が等しいと判断された場合(Student のt検定)

2)母分散は未知でF検定で分散が等しくないと判断された場合(Welchのt 検定)

例2.6 F検定の結果によるt検定

問2.4 身長の男女比較(対応のないt検定)

4.データが正規分布していない場合の独立した標本の比較:平均ランク検定(Mann-WhitneyのU検定)

例2.7 Mann-WhitneyのU検定

問2.5 研修受講率に対する管理職の影響(Mann-WhitneyのU検定)

第3章 関係を調べる

A 2変量の統計

1.基本統計量

1)平方和と積和

2)修正ずみ平方和と積和

3)分散と共分散

4)不偏分散と不偏共分散

B 順序およびスケール尺度データの統計図表と相関係数および回帰式

1.クロス集計表と箱ひげ図

例3.1 関係を示す統計図表

2.散布図とPearsonの相関係数

例3.2 散布図と相関係数および回帰式

問3.1 身長と体重の関係(散布図,相関係数)

3.Spearmanの相関係数(順位相関係数)

例3.3 肥満度と循環器判定(クロス集計表とSpearmanの相関係数)

問3.2 理解能力と表現能力の関係(クロス集計表,順位相関係数)

C 名義尺度データの統計表と検定

1.対応のない2群の比率を比較する

例3.4 避妊教育の性差(2×2表)

例3.5 肥満と循環器判定の関連性(大きな表)

2.母比率との比較

例3.6 性行動比率の過去との比較(母比率との比較)

コラム 診断精度関係用語

3.対応のある2群の比率を比較する

例3.7 授業の効果(対応のある2群の比率を比較)

問3.3 授業の効果(マクネマーのカイ2 乗検定)

D ROC 曲線

例3.8 便潜血検査の有効性(ROC曲線)

問3.4 体調,腫瘍マーカ,便潜血について大腸がんの診断への有効性(ROC曲線)

コラム パッケージのインストール方法

第4章 生存率と危険度

A 生存率

1.生存率の計算方法:Kaplan-Meier法

2.生存率曲線の検定

例4.1 抗がん剤の副作用抑制(生存率曲線と検定)

問4.1 心臓移植と生存率(生存率曲線と検定)

B 危険度

1.前向き研究:コホート調査

例4.2 喫煙と肺がん(相対リスク)

問4.2 喫煙と肺疾患のコホート研究(相対リスク)

2.後ろ向き研究:ケース・コントロール研究

例4.3 大腸がんと母親のがん既往歴(オッズ比)

第5章 多変量解析

A 多変量解析とは

1.多変量データと多変量解析

2.多変量解析の分類

B 重回帰分析

1.重回帰モデル

2.検定

例5.1 生物学的年齢予測式(重回帰分析)

C 多重ロジスティック回帰分析

1.重回帰分析との違い

2.多重口ジスティック関数

3.順序データと名義データの2値化

1)順序データの2値化

(1)ダミー変数を使う方法

(2)科学的根拠や経験により前半と後半に分ける方法

(3)中央値により前半と後半に分ける方法

2)名義データの2値化

4.多重ロジスティック回帰

例5.2 大腸がんのリスク因子(多重ロジスティック回帰)

D Cox比例ハザード解析

例5.3 ライフスタイルと糖尿病発症(Cox比例ハザード回帰)

E 判別分析

1.マハラノビスの距離

2.線形判別式

例5.4 複数の検査結果からの疾病の診断(線形判別関数)

F 主成分分析

1.主成分とは

2.主成分分析の実際

例5.5 患者が病院を選ぶ因子(主成分分析)

G 因子分析

1.因子負荷量

2.共通性の推定

3.因子数の決定

4.因子軸の回転

5.因子分析の実際

例5.6 患者が病院を選ぶ因子(因子分析)

第6章 多群の比較

A 同時推測

1.対照群との比較とすべての対の比較

2.対応のある多群の比較と対応のない多群の比較

3.なぜ個別の2 群の比較の単純な繰り返しではいけないのか?

B 独立した多群の比較

1.一元配置分散分析

例6.1 赤血球数の年齢間比較(一元配置分散分析)

2.二元配置分散分析

例6.2 年代およびストレスレベルの違いによる女性の赤血球数の比較(二元配置分散分析)

3.Kruskal-Wallis検定

例6.3 6つの地域間での女性の赤血球数の同時比較(Kruskal-Wallis検定)

4.Mann-WhitneyのU検定

C 対応のある標本の比較

1.反復測定の分散分析

例6.4 3つの年度間での20歳代女性の赤血球数の対応のある比較(反復測定の分散分析)

2.Friedman検定

例6.5 40歳代女性の3つの年度間でのBMIの対応のある比較(反復測定のFriedman検定)

3.WilcoxonのT検定

例6.6 ポストホック検定(WilcoxonのT検定とBonferroniの補正)

4.CochranのQ検定

例6.7 20歳代男性の健診総合判定変化の同時比較(CochranのQ検定)

5.McNemarのカイ2乗検定

例6.8 ポストホック検定(McNemarのカイ2乗検定とBonferroniの補正)

第7章 研究計画法

A 研究の目的について

B 研究方法について

1.ケース・シリーズ研究

2.断面調査研究

3.ケース・コントロール研究

4.コホート研究

5.自己コントロール試験研究

6.無作為化試験研究

1)無作為抽出

2)無作為割り当て

7.クロスオーバー試験研究

C 研究計画の不備で起こる諸問題

1.脱落によるバイアス

2.頻度によるバイアス

3.参加意識差によるバイアス

4.所属グループによるバイアス

5.割り当てによるバイアス

D 統計的判断に必要なデータ数について

1.プリテスト

2.計算による必要データ数の推計

3.統計パッケージを使ったシミュレーションによる必要データ数の推計

4.標本数の推計支援プログラム

E 論文の書き方について

付録

1 統計処理のガイダンス

2 正規分布の例

3 算数的判断と統計学的判断

(1)コインを4 回トスする実験

(2)箱からボールを20 回取り出す実験

(3)サイコロを12 回撮る実験

4 退院患者と入院患者の疾患統計の違い

略解

本書で取りあげたRスクリプト一覧

索引

便利機能

  • 対応
  • 一部対応
  • 未対応
便利機能アイコン説明
  • 全文・
    串刺検索
  • 目次・
    索引リンク
  • PCブラウザ閲覧
  • メモ・付箋
  • PubMed
    リンク
  • 動画再生
  • 音声再生
  • 今日の治療薬リンク
  • イヤーノートリンク
  • 南山堂医学
    大辞典
    リンク
  • 対応
  • 一部対応
  • 未対応

対応機種

  • ios icon

    iOS 10.0 以降

    外部メモリ:18.4MB以上(インストール時:40.0MB以上)

    ダウンロード時に必要なメモリ:73.6MB以上

  • android icon

    AndroidOS 5.0 以降

    外部メモリ:24.7MB以上(インストール時:61.7MB以上)

    ダウンロード時に必要なメモリ:98.8MB以上

  • コンテンツのインストールにあたり、無線LANへの接続環境が必要です(3G回線によるインストールも可能ですが、データ量の多い通信のため、通信料が高額となりますので、無線LANを推奨しております)。
  • コンテンツの使用にあたり、M2Plus Launcherが必要です。 導入方法の詳細はこちら
  • Appleロゴは、Apple Inc.の商標です。
  • Androidロゴは Google LLC の商標です。

書籍情報

  • ISBN:9784521743646
  • ページ数:200頁
  • 書籍発行日:2016年2月
  • 電子版発売日:2016年9月30日
  • 判:B5判
  • 種別:eBook版 → 詳細はこちら
  • 同時利用可能端末数:3

まだ投稿されていません

特記事項

※今日リンク、YNリンク、南山リンクについて、AndroidOSは今後一部製品から順次対応予定です。製品毎の対応/非対応は上の「便利機能」のアイコンをご確認下さいませ。


※ご入金確認後、メールにてご案内するダウンロード方法によりダウンロードしていただくとご使用いただけます。


※コンテンツの使用にあたり、M2Plus Launcher(iOS/iPhoneOS/AndroidOS)が必要です。


※書籍の体裁そのままで表示しますため、ディスプレイサイズが7インチ以上の端末でのご使用を推奨します。