Home

租界〈R〉の門前にて —— 統計言語「R」との極私的格闘記録


Last Modified: 19 October 2021 by MINAKA Nobuhiro

※東京都立大学都市環境学部「観光統計解析II」講義:2021年10月〜11月講義情報
※茨城大学農学部食生命科学科「統計学入門」講義:2021年12月〜2022年2月講義情報
※大分県農林水産研究指導センター主催「数理統計研修(基礎編)」:2021年12月1日(水)〜3日(金)講義情報

●統計学への道 —— 出家修行と在家修練



◇書籍案内

  • 三中信宏『統計思考の世界:曼荼羅で読み解くデータ解析の基礎』2018年6月1日刊行,技術評論社,東京,239 pp., 本体価格2,300円, ISBN:978-4-7741-9753-1 → 版元ページコンパニオンサイト
  • 三中信宏『みなか先生といっしょに 統計学の王国を歩いてみよう:情報の海と推論の山を越える翼をアナタに!』2015年6月5日第1刷刊行|2017年3月15日第2刷刊行,羊土社,東京,191 pp., 本体価格2,300円, ISBN:978-4-7581-2058-6 → 目次版元ページコンパニオンサイト


統計高座中継(YouTube)

以下に公開する統計高座の YouTube 動画ファイルは,2011年2月8日(火)〜10日(木)の三日間にわたって,九州大学大学院比較社会文化研究科(伊都キャンパス)で私が行なった集中講義〈データ解析概論〉の全録画です(→九大・比社文サイト).集中講義のシラバスにしたがって動画ファイルは下記の通り分割され YouTube 上に公開されています.[謝辞]集中講義当日の撮影と動画編集をしていただいた楠見淳子(九大・比文)さんに深く感謝いたします.(23 April 2011)

  • 2月8日(火) ——
    1. 統計学概論−統計学的な「ものの見方」 → 123
    2. R/Rcmdrのインストールとパッケージ動作確認
      1. インストール Win編 → 1
      2. インストール Mac編 → 1
    3. データ解析は視覚化に始まり視覚化に終わる → 123
    4. 確率変数・確率分布とパラメトリック統計理論 → 123
  • 2月9日(水) ——
    1. はじめに「ばらつき」ありき−偏差・平方和・分散 → 12
    2. 実験計画法と分散分析;多重比較;線形モデル
      1. Rでのデータ読み込み → 1
      2. 完全無作為化法 → 123
      3. 多重比較 → 12
      4. 乱塊法 → 1234
      5. 乱塊法応用編 → 123
  • 2月10日(木) ——
    1. モデル選択論;一般化線形モデルへの拡張
      1. モデル選択論 → 123456
      2. 線形モデルを鍛える → 12
      3. 一般線形モデル → 123
    2. 共分散と相関係数;多変量パラメトリック分布 → 123
    3. リサンプリング計算統計学と多変量解析 → 123
    4. ベイズ統計学とベイジアンMCMC/質疑応答 → 123

連載〈統計の落とし穴と蜘蛛の糸〉

羊土社の雑誌『実験医学』に2014年2月号から2015年4月号まで掲載されたワタクシの連載記事〈統計の落とし穴と蜘蛛の糸〉記事のオンライン版です.以前は〈実験医学online〉上で公開されていたコンテンツがまるごと同社の新設サイト〈Smart Lab Life〉にて再公開されましたのでごらんください.[2018年2月3日]

Smart Lab Life 連載トップページ
  第1回 データ解析の第一歩は計算ではない(2014年2月号, pp. 442-447:2017年11月10日公開)
  第2回 データの位置とばらつきを可視化しよう(2014年4月号, pp. 935-940:2017年11月17日公開)
  第3回 データのふるまいをモデル化する(2014年6月号, pp. 1427-1433:2017年11月24日公開)
  第4回 パラメトリック統計学への登り道〔1〕:ばらつきを数値化する(2014年8月号, pp. 2160-2163:2017年12月1日公開)
  第5回 パラメトリック統計学への登り道〔2〕:自由度とは何か(2014年9月号, pp. 2314-2318:2017年12月8日公開)
  第6回 確率変数と確率分布をもって山門をくぐる(2014年10月号, pp. 2642-2645:2017年12月15日公開)
  第7回 正規分布という王様が誕生する(2014年11月号, pp. 2990-2994:2017年12月22日公開)
  第8回 ピアソンが築いたパラメトリック統計学の土台(2014年12月号掲載, pp. 3123-3126:2018年1月5日公開)
  第9回 秘宝:確率分布曼荼羅の発見!(2015年1月号掲載, pp. 110-113:2018年1月12日公開)
  第10回 実験計画はお早めに:完全無作為化法(2015年2月号掲載, pp. 510-513:2018年1月19日公開)
  第11回 正規分布を踏まえたパラメトリック統計学の降臨(2015年3月号掲載, pp. 628-632:2018年1月26日公開)
  第12回 統計データ解析の地上世界と天空世界:連載の総括として(2015年4月号掲載, pp. 978-982:2018年2月2日公開)

※本連載はすでに単行本として出版されています:三中信宏『みなか先生といっしょに 統計学の王国を歩いてみよう:情報の海と推論の山を越える翼をアナタに!』(2015年6月5日刊行,羊土社,東京,191 pp., 本体価格2,300円, ISBN:978-4-7581-2058-6 → 目次版元ページコンパニオンサイト).


農環研ウェブ高座 〈農業環境のための統計学〉

本連載記事は,独立行政法人農業環境技術研究所が発行するウェブマガジン『農業と環境』に2012年8月から2013年8月まで連載されました.

  第1回 前口上:統計学の世界を鳥瞰するためにNo. 148 | 2012年8月1日発行]
  第2回 統計学のロジックとフィーリングNo. 149 | 2012年9月1日発行]
  第3回 直感的な素朴統計学からはじまる道No. 150 | 2012年10月1日発行]
  第4回 統計学的推論としてのアブダクションNo. 151 | 2012年11月1日発行]
  第5回 データを観る・見る・診るNo. 153 | 2013年1月1日発行]
  第6回 情報可視化と統計グラフィクスNo. 154 | 2013年2月1日発行]
  第7回 データのふるまいを数値化する:平均と分散No. 155 | 2013年3月1日発行]
  第8回 記述統計学と推測統計学:世界観のちがいNo. 156 | 2013年4月1日発行]
  第9回 統計モデルとは何か:既知から未知へNo. 157 | 2013年5月7日発行]
  第10回 確率変数と確率分布:確率分布曼荼羅をたどるNo. 158 | 2013年6月1日発行]
  第11回 正規分布帝国とその臣下たちNo. 159 | 2013年7月1日発行]
  第12回 パラメトリック統計学の世界を眺めるNo. 160 | 2013年8月1日発行]

※本連載は技術評論社から刊行される下記書籍の一部として含まれます:三中信宏『統計思考の世界:曼荼羅で読み解くデータ解析の基礎』(2018年6月6日刊行,技術評論社,東京,ca 240 pp., 本体価格2,300円, ISBN:978-4-7741-9753-1 → 版元ページコンパニオンサイト


◇〈R〉への参道

0. 門前まで
  1. Rインストレーションガイド[2016年9月12日バージョン] → R-InstallationGuide.zip(自己解凍ファイル)※R / RStudio / R Commander のインストールガイド.Windows PC を念頭に書かれているが,他のOSでも参考になるだろう.
  2. R最新版のインストール方法 → Cf: RjpWiki「Rのインストール
  3. Windows環境で「R」を導入するための絶対確実な方法(2014年11月12日)
  4. CRANに詣でる
  5. Rを知る[参考になるサイトや資料]→ Cf: RjpWiki「リンク集
  6. Rを学ぶ[教科書・参考書リスト]→ Cf: RjpWiki「参考書リスト
1. 確率分布とグラフィクス
2. 分散分析の理論と事例集
  1. 実験計画と分散分析——総論
  2. 【Box1】1要因完全無作為化法→データファイル:Box1_R.tabBox1_R.data
  3. 【Box2】1要因乱塊法→データファイル:Box2_R.tabBox2_R.data
  4. 【Box3】2要因乱塊法→データファイル:Box3_R.tabBox3_R.data
  5. 【Box4】2要因分割区法(Split-plot)→データファイル:Box4_R.tabBox4_R.data
  6. 【Box5】2要因細分区法(Strip-plot)→データファイル:Box5_R.tabBox5_R.data
  7. ネスト分散分析
3. クラスター分析と樹形図ユーティリティ
7. R commander での TukeyHSD 検定の使用の注意点Rcmdr計算スクリプト修正スクリプト


◇大統計大曼荼羅

  JPEG(小)(676KB)
  JPEG(大)(1.4MB)
  3Dバージョン(1.9MB)※徳永幸彦画伯の作品


●講義用のブログやサイト


  • 形態測定学(応用編)の講義用ページ(2007年10月〜2010年3月,通年:東京農業大学)
  • 形態測定学(基礎編)の講義用ページ(2006年2月〜2007年10月,通年:東京農業大学)
  • 生物統計学の講義用ページ(2005年4月〜2006年2月,通年:東京農業大学)

東京都立大学都市環境学部「観光統計解析II」10:30〜12:00(2021年10月〜11月)※zoom オンライン講義

タイムテーブル
  • 10月12日(火)10:30〜12:00
    • R・Rcmdr・RStudioの起動確認
    • 統計学概論
    • データの視覚化(1):インデックスプロットとドットプロット
  • 10月19日(火)10:30〜12:00
    • データの視覚化(2):箱ひげ図と散布図
    • データとモデルの関係
    • パラメトリック統計学の世界観
  • 10月26日(火)10:30〜12:00
    • 分散概念の導出
    • 確率分布曼荼羅
    • 正規分布の諸性質
  • 11月9日(火)10:30〜12:00
    • 実験計画法(1):完全無作為化法の基礎
  • 11月16日(火)10:30〜12:00
    • 実験計画法(2):分散分析と多重比較
    • 実験計画法(3):乱塊法とその応用
  • 11月23日(火)10:30〜12:00
    • 統計モデルを再考する
    • モデル選択論とその利用
  • 11月30日(火)10:30〜12:00(※オンデマンド録画による)
    • 一般化線形モデル(1):何が一般化されたのか?
    • 一般化線形モデル(2):ロジスティック回帰とポアソン回帰の例

  1. 上記のタイムテーブルはおおよその予定で,講義と実習とはきっちり分けられてはいません.講義しながら受講生にそのつどRを操作してもらうというやり方で授業を進める予定です.zoom会議室のURLは別途周知いたします.東京都立大学の学内LANあるいは各自Wi-Fi接続できるようにパソコンの設定を確認してください.
  2. 講義資料類(スライド,スクリプト,データファイルなど)はすべて新規開設する Slack 会議室から配布いたします.本講義に関する質問回答と情報提供にも Slack を利用する予定です.
  3. 【R事前インストールのお願い】今回の集中講義で使用するRならびにパッケージ R Commander,さらに RStudio については事前に最新バージョンのインストールをお願いいたします.インストールの手順と起動の確認については「R-InstallationGuide.zip(Windows版R)」を参照してください.
  4. 【Mac OSX あるいは Linux ユーザーへの注意】Mac OS X 版あるいは Linux 版の R / Rcmdr / RStudio を使用される場合は,上記と同じくR関連ソフトウェアを前もってインストールした上で,各自の責任で作動確認をお願いいたします.なお,Mac OS X については,事前に〈X11〉をアップルのサイトからインストールしておいてください(→ Apple サイト:「X11 および OS X について」).X11 がないと R Commander が使用できなくなりますのでこれは必須です.
  5. その他,Rをインストールする際の注意点はこちらを参照してください:三中信宏「RとRコマンダーをフシアワセなくインストールする前準備」.


2021年度・茨城大学農学部食生命科学科「統計学入門」講義(2021年12月〜2022年2月)

 ※本講義は対面で開講します(zoom オンライン中継併用)

2021年12月9日(木)4限:Rのインストール確認とセットアップ
  • Slack 会議室の開設と登録
  • 講義全体のガイダンスとシラバスの説明,成績評価について
  • R と R Commander の作動確認
  • 統計学概論の前口上
  • トラブル・シューティング(R インストール関連)
2021年12月9日(木)5限:統計学概論とデータ可視化
  • 統計曼荼羅(統計学世界の鳥瞰)
  • 統計学概論(統計的なものの考え方と素朴統計学さらにデータ可視化)
  • R の初期設定変更
  • R Commander を用いたデータ可視化演習
  • トラブル・シューティング(R インストール関連)
2021年12月14日(木)4限:データとモデル:統計学的推論について
  • 箱ひげ図によるデータの特性(位置パラメーターと分散パラメーター)の表示
  • パラメトリック統計学への道:観察データと統計モデルとの関係
  • RStudio の作動確認と初期設定変更
2021年12月21日(木)4限:確率変数と確率分布
  • 確率変数と確率分布 参考:確率分布曼荼羅(ウェブ版)
  • 偏差・平方和・分散の導出と自由度の概念
  • RStudio を用いた分散計算演習(不偏性のシミュレーション)
2022年1月6日(木)4限:パラメトリック統計学概論
  • パラメーターと推定値:記述統計学と推測統計学のちがい
  • 実験計画法の “ふるさと” 探訪
2022年1月11日(木)4限:正規分布とその利用
  • 正規分布 \( N(\mu,\sigma^2) \) の諸性質(線形変換での正規性保存・関連確率分布の導出・中心極限定理)
  • R パッケージ「TeachingDemos」を用いた演習
2022年1月13日(木)4限:実験計画法(1):完全無作為化法
  • 実験計画法の“家訓”(反復実施・無作為化・局所管理)
  • 実験処理区のレイアウトと線形統計モデルの構築
  • 完全無作為化法のもとでのデータ解析の手順
  • 偏差・平方和・平均平方(分散)・ \( F \) 値
  • 偏差の分割と線形統計モデルの直感的理解
  • 正規分布が降臨する
  • 実験計画法での仮説検定の考え方について
2022年1月13日(木)5限:実験計画法(2):分散分析と多重比較
  • R を用いた分散分析の実習
  • 分散分析から多重比較へ
  • 水準間の平均値差の検定で生じる第一種過誤の制御
  • R を用いたいくつかの多重比較検定法
2022年1月18日(火)4限:実験計画法(3):乱塊法
  • 乱塊法のもとでの線形統計モデルとデータ処理の手順
  • 複数の要因を含む実験計画と要因間の交互作用について
  • 二要因乱塊法とその応用
2022年1月25日(火)4限:モデル選択論と一般化線形モデル
  • 線形統計モデルを再考する
  • モデル選択論:尤度とAIC
  • Rを用いたモデル選択の実習:多項式回帰を中心に
  • 一般化線形統計モデル(GLM)
  • Rを用いたGLMの実習:ロジスティック回帰とポアソン回帰
2022年1月27日(木)4限:多変量解析(1):変量間の共変動とそのパターン
  • 二つの変量間の共分散と相関係数
  • Rを用いた2変量正規分布の実習
2022年1月27日(木)5限:多変量解析(2):情報の視覚化とインフォグラフィクス
  • 多変量解析:クラスター分析と主成分分析を例に
  • Rを用いた多変量解析の実習
2022年2月1日(火)4限:リサンプリング統計手法
  • 計算機統計学とリサンプリング手法
  • ブーツストラップ,ジャックナイフ,モンテ・カルロ
  • Rを用いたリサンプリング法の実習
2022年2月3日(水)4限:ベイズ統計学(1):ベイズの定理を中心に
  • ベイズの定理とベイジアン確証推論について
2022年2月3日(水)5限:ベイズ統計学(2):ベイズ確証理論とMCMC
  • 事後確率分布の推定とベイジアンMCMCによる強行突破 ※参考:MCMC Robot
  • 総括 —— 統計学ブックガイド(どんな統計本を手にしてはいけないか)→ 統計学ブックガイド

  1. 本年度の講義時間は毎週火・木曜の第4限(14:20〜15:50)と第5限(16:00〜17:30)です.新型コロナウィルスの蔓延状況によってはオンライン授業に切り替える可能性があります.
  2. 講義資料類(スライド,スクリプト,データファイルなど)はすべて新規開設する Slack 会議室から配布いたします.本講義に関する質問回答と情報提供にも Slack を利用する予定です.
  3. 【R事前インストールのお願い】今回の講義で使用するRならびにパッケージ R Commander,さらに RStudio については事前にインストールした上で,各自の責任で作動確認をお願いいたします.まずはじめに「RとRコマンダーをフシアワセなくインストールする前準備」を参照の上,使用するPC環境を整えてください.とくに,Mac OS X については,事前に〈X11〉をアップルのサイトからインストールしておいてください(→ Apple「X11 および OS X について」).X11 がないと R Commander が使用できなくなりますのでこれは必須です.
  4. Windows 版 Rのインストールの手順と起動の確認については「R-InstallationGuide.zip」をご覧ください.Mac OS X 版あるいは Linux 版の R / R Commander / RStudio を使用される場合は,同様のやり方で R 関連ファイルを事前にインストールした上で,各自の責任で作動確認をお願いいたします.
  5. 最初の講義の際に R 関連ソフトウェアのインストールのトラブル個別対応の時間も設けていますので,フシアワセに打ちひしがれる受講生はぜひご利用ください.


大分県農林水産研究指導センター主催「数理統計研修(基礎編)」:2021年12月1日(水)〜3日(金)

タイムテーブル(会場:大分県庁OAプラザ,大分市)
  • 12月1日(水)
    • 09:30〜10:30 R・Rコマンダー・RStudioの動作確認
    • 10:45〜12:00 統計曼荼羅と統計学概論
    • 13:00〜14:30 データのばらつきの数値化/パラメトリック統計学
    • 14:45〜16:30 実験計画法(1):完全無作為化法
  • 12月4日(木)
    • 09:30〜10:30 実験計画法(2):乱塊法
    • 10:45〜12:00 多重比較の諸方法
    • 13:00〜14:30 実験計画法(3):分割区法と細分区法
    • 14:45〜16:30 モデル選択論
  • 12月5日(金)
    • 09:30〜10:30 一般化線形モデル
    • 10:45〜12:00 多変量データと多変量解析
    • 13:00〜16:30 質疑討論と個別コンサルティング

※上記のタイムテーブルはおおよその予定で,講義と実習とはきっちり分けられてはいません.講義しながら受講生にそのつどRを操作してもらうというやり方で授業を進める予定です.講義スライドならびに実習で用いるRスクリプトは別途ファイルで配布しますのでUSBメモリーを持参してください.


 →古いハンドアウト類は〈三中信宏・統計学講義のハンドアウト倉庫〉に格納しました.