Home

租界〈R〉の門前にて —— 統計言語「R」との極私的格闘記録


Last Modified: 27 April 2024 by MINAKA Nobuhiro
※2024年度・東京大学大学院理学系研究科「生物統計学」2024年4月11日(木)〜7月18日(木)14:55〜16:40毎週木曜(Sセメスター)※オンライン講義講義情報
※2024年度・東京都立大学都市環境学部「観光統計解析I」2024年5月28日(火)〜7月9日(火)13:00〜14:30毎週火曜※オンライン講義講義情報

●統計学への道 —— 出家修行と在家修練



◇書籍案内

  • 三中信宏『統計思考の世界:曼荼羅で読み解くデータ解析の基礎』2018年6月1日第1刷刊行|2023年2月18日第2刷刊行,技術評論社,東京,239 pp., 本体価格2,300円, ISBN:978-4-7741-9753-1 → 版元ページコンパニオンサイト
  • 三中信宏『みなか先生といっしょに 統計学の王国を歩いてみよう:情報の海と推論の山を越える翼をアナタに!』2015年6月5日第1刷刊行|2017年3月15日第2刷刊行,羊土社,東京,191 pp., 本体価格2,300円, ISBN:978-4-7581-2058-6 → 目次版元ページコンパニオンサイト


統計高座中継(YouTube)

以下に公開する統計高座の YouTube 動画ファイルは,2011年2月8日(火)〜10日(木)の三日間にわたって,九州大学大学院比較社会文化研究科(伊都キャンパス)で私が行なった集中講義〈データ解析概論〉の全録画です(→九大・比社文サイト).集中講義のシラバスにしたがって動画ファイルは下記の通り分割され YouTube 上に公開されています.[謝辞]集中講義当日の撮影と動画編集をしていただいた楠見淳子(九大・比文)さんに深く感謝いたします.(23 April 2011)

  • 2月8日(火) ——
    1. 統計学概論−統計学的な「ものの見方」 → 123
    2. R/Rcmdrのインストールとパッケージ動作確認
      1. インストール Win編 → 1
      2. インストール Mac編 → 1
    3. データ解析は視覚化に始まり視覚化に終わる → 123
    4. 確率変数・確率分布とパラメトリック統計理論 → 123
  • 2月9日(水) ——
    1. はじめに「ばらつき」ありき−偏差・平方和・分散 → 12
    2. 実験計画法と分散分析;多重比較;線形モデル
      1. Rでのデータ読み込み → 1
      2. 完全無作為化法 → 123
      3. 多重比較 → 12
      4. 乱塊法 → 1234
      5. 乱塊法応用編 → 123
  • 2月10日(木) ——
    1. モデル選択論;一般化線形モデルへの拡張
      1. モデル選択論 → 123456
      2. 線形モデルを鍛える → 12
      3. 一般線形モデル → 123
    2. 共分散と相関係数;多変量パラメトリック分布 → 123
    3. リサンプリング計算統計学と多変量解析 → 123
    4. ベイズ統計学とベイジアンMCMC/質疑応答 → 123

連載〈統計の落とし穴と蜘蛛の糸〉

羊土社の雑誌『実験医学』に2014年2月号から2015年4月号まで掲載されたワタクシの連載記事〈統計の落とし穴と蜘蛛の糸〉記事のオンライン版です.以前は〈実験医学online〉上で公開されていたコンテンツがまるごと同社の新設サイト〈Smart Lab Life〉にて再公開されましたのでごらんください.[2018年2月3日]

Smart Lab Life 連載トップページ
  第1回 データ解析の第一歩は計算ではない(2014年2月号, pp. 442-447:2017年11月10日公開)
  第2回 データの位置とばらつきを可視化しよう(2014年4月号, pp. 935-940:2017年11月17日公開)
  第3回 データのふるまいをモデル化する(2014年6月号, pp. 1427-1433:2017年11月24日公開)
  第4回 パラメトリック統計学への登り道〔1〕:ばらつきを数値化する(2014年8月号, pp. 2160-2163:2017年12月1日公開)
  第5回 パラメトリック統計学への登り道〔2〕:自由度とは何か(2014年9月号, pp. 2314-2318:2017年12月8日公開)
  第6回 確率変数と確率分布をもって山門をくぐる(2014年10月号, pp. 2642-2645:2017年12月15日公開)
  第7回 正規分布という王様が誕生する(2014年11月号, pp. 2990-2994:2017年12月22日公開)
  第8回 ピアソンが築いたパラメトリック統計学の土台(2014年12月号掲載, pp. 3123-3126:2018年1月5日公開)
  第9回 秘宝:確率分布曼荼羅の発見!(2015年1月号掲載, pp. 110-113:2018年1月12日公開)
  第10回 実験計画はお早めに:完全無作為化法(2015年2月号掲載, pp. 510-513:2018年1月19日公開)
  第11回 正規分布を踏まえたパラメトリック統計学の降臨(2015年3月号掲載, pp. 628-632:2018年1月26日公開)
  第12回 統計データ解析の地上世界と天空世界:連載の総括として(2015年4月号掲載, pp. 978-982:2018年2月2日公開)

※本連載はすでに単行本として出版されています:三中信宏『みなか先生といっしょに 統計学の王国を歩いてみよう:情報の海と推論の山を越える翼をアナタに!』(2015年6月5日刊行,羊土社,東京,191 pp., 本体価格2,300円, ISBN:978-4-7581-2058-6 → 目次版元ページコンパニオンサイト).


農環研ウェブ高座 〈農業環境のための統計学〉

本連載記事は,独立行政法人農業環境技術研究所が発行するウェブマガジン『農業と環境』に2012年8月から2013年8月まで連載されました.

  第1回 前口上:統計学の世界を鳥瞰するためにNo. 148 | 2012年8月1日発行]
  第2回 統計学のロジックとフィーリングNo. 149 | 2012年9月1日発行]
  第3回 直感的な素朴統計学からはじまる道No. 150 | 2012年10月1日発行]
  第4回 統計学的推論としてのアブダクションNo. 151 | 2012年11月1日発行]
  第5回 データを観る・見る・診るNo. 153 | 2013年1月1日発行]
  第6回 情報可視化と統計グラフィクスNo. 154 | 2013年2月1日発行]
  第7回 データのふるまいを数値化する:平均と分散No. 155 | 2013年3月1日発行]
  第8回 記述統計学と推測統計学:世界観のちがいNo. 156 | 2013年4月1日発行]
  第9回 統計モデルとは何か:既知から未知へNo. 157 | 2013年5月7日発行]
  第10回 確率変数と確率分布:確率分布曼荼羅をたどるNo. 158 | 2013年6月1日発行]
  第11回 正規分布帝国とその臣下たちNo. 159 | 2013年7月1日発行]
  第12回 パラメトリック統計学の世界を眺めるNo. 160 | 2013年8月1日発行]

※本連載は技術評論社から刊行される下記書籍の一部として含まれます:三中信宏『統計思考の世界:曼荼羅で読み解くデータ解析の基礎』(2018年6月6日刊行,技術評論社,東京,ca 240 pp., 本体価格2,300円, ISBN:978-4-7741-9753-1 → 版元ページコンパニオンサイト


◇〈R〉への参道

0. 門前まで
  1. Rインストレーションガイド[2016年9月12日バージョン] → R-InstallationGuide.zip(自己解凍ファイル)※R / RStudio / R Commander のインストールガイド.Windows PC を念頭に書かれているが,他のOSでも参考になるだろう.
  2. R最新版のインストール方法 → Cf: RjpWiki「Rのインストール
  3. Windows環境で「R」を導入するための絶対確実な方法(2014年11月12日)
  4. CRANに詣でる
  5. Rを知る[参考になるサイトや資料]→ Cf: RjpWiki「リンク集
  6. Rを学ぶ[教科書・参考書リスト]→ Cf: RjpWiki「参考書リスト
1. 確率分布とグラフィクス
2. 分散分析の理論と事例集
  1. 実験計画と分散分析——総論
  2. 【Box1】1要因完全無作為化法→データファイル:Box1_R.tabBox1_R.data
  3. 【Box2】1要因乱塊法→データファイル:Box2_R.tabBox2_R.data
  4. 【Box3】2要因乱塊法→データファイル:Box3_R.tabBox3_R.data
  5. 【Box4】2要因分割区法(Split-plot)→データファイル:Box4_R.tabBox4_R.data
  6. 【Box5】2要因細分区法(Strip-plot)→データファイル:Box5_R.tabBox5_R.data
  7. ネスト分散分析
3. クラスター分析と樹形図ユーティリティ
7. R commander での TukeyHSD 検定の使用の注意点Rcmdr計算スクリプト修正スクリプト


◇大統計大曼荼羅

  JPEG(小)(676KB)
  JPEG(大)(1.4MB)
  3Dバージョン(1.9MB)※徳永幸彦画伯の作品


●講義用のブログやサイト


  • 形態測定学(応用編)の講義用ページ(2007年10月〜2010年3月,通年:東京農業大学)
  • 形態測定学(基礎編)の講義用ページ(2006年2月〜2007年10月,通年:東京農業大学)
  • 生物統計学の講義用ページ(2005年4月〜2006年2月,通年:東京農業大学)

2024年度・東京大学大学院理学系研究科「生物統計学」(Sセメスター)

 ※本講義はオンラインで開講します

2024年4月11日(木)Rのセットアップと統計学概論
  • Zoom の作動確認/Slack チャンネルの開設
  • 講義全体のガイダンスとシラバスの説明,成績評価について
  • R と R Commander の作動確認と初期設定変更
  • 統計学概論の前口上
  • 統計曼荼羅(統計学世界の鳥瞰と素朴統計学)
  • トラブル・シューティング(R インストール関連)
2024年4月18日(木)統計学概論とデータ可視化
  • 統計学概論(統計的なものの考え方とデータ可視化)
  • R Commander を用いたデータ可視化演習(1Dグラフ作成)
  • トラブル・シューティング(R インストール関連)
2024年4月25日(木)データ可視化(続)
  • R Commander を用いたデータ可視化演習(2D, 3Dグラフ作成)
  • 箱ひげ図によるデータの特性(位置パラメーターと分散パラメーター)の表示
2024年5月2日(木)パラメトリック統計学と確率分布
  • パラメトリック統計学への道:観察データと統計モデルとの関係
  • 偏差・平方和・分散の導出と自由度の概念
  • RStudio の作動確認と初期設定変更
  • RStudio を用いた分散計算演習(不偏性のシミュレーション)
  • パラメーターと推定値:記述統計学と推測統計学のちがい
2024年5月9日(木)正規分布
  • 確率変数と確率分布 参考:確率分布曼荼羅(ウェブ版)
  • 正規分布 \( N(\mu,\sigma^2) \) の諸性質(線形変換での正規性保存・関連確率分布の導出・中心極限定理)
  • R パッケージ「TeachingDemos」を用いた演習
  • 実験計画法の “ふるさと” 探訪
2024年5月16日(木)実験計画法(1)
  • 実験計画法の“家訓”(反復実施・無作為化・局所管理)
  • 実験処理区のレイアウトと線形統計モデルの構築
  • 完全無作為化法のもとでのデータ解析の手順
  • 偏差・平方和・平均平方(分散)・ \( F \) 値
  • 偏差の分割と線形統計モデルの直感的理解
  • 正規分布が降臨する
  • 実験計画法での仮説検定の考え方について
2024年5月23日(木)実験計画法(2)※曜日注意
  • R を用いた分散分析の実習
  • 分散分析から多重比較へ
  • 水準間の平均値差の検定で生じる第一種過誤の制御
  • R を用いたいくつかの多重比較検定法
2024年6月6日(木)実験計画法(3)
  • 乱塊法のもとでの線形統計モデルとデータ処理の手順
  • 複数の要因を含む実験計画と要因間の交互作用について
  • 二要因乱塊法とその応用
2024年6月13日(木)統計モデルとモデル選択論
  • 線形統計モデルを再考する
  • モデル選択論:尤度とAIC
  • Rを用いたモデル選択の実習:多項式回帰を中心に
2024年6月20日(木)一般化線形モデル
  • 一般化線形統計モデル(GLM)
  • Rを用いたGLMの実習:ロジスティック回帰とポアソン回帰
2024年6月27日(木)多変量解析(1):変量間の共変動とそのパターン
  • 二つの変量間の共分散と相関係数
  • Rを用いた2変量正規分布の実習
  • 多変量データと高次元空間
2024年7月4日(木)多変量解析(2):情報の視覚化とインフォグラフィクス
  • 多変量解析:クラスター分析と主成分分析を例に
  • Rを用いた多変量解析の実習
  • 計算機統計学とリサンプリング手法
  • ブーツストラップ,ジャックナイフ,モンテ・カルロ
2024年7月11日(木)リサンプリング統計手法/ベイズ統計学(1)
  • Rを用いたリサンプリング法の実習
  • ベイズの定理とベイジアン確証推論について
2024年7月18日(木)ベイズ統計学(2)
  • 事後確率分布の推定とベイジアンMCMCによる強行突破 ※参考:MCMC Robot
  • 総括

  1. 講義時間は毎週木曜第4限(14:55〜16:40).本講義はすべてオンライン講義なので Zoom と Discord のアプリを持参PCに事前にインストールしてください.Zoom を用いたオンライン講義については東京大学情報基盤センター&大学総合教育研究センター〈オンライン授業・Web会議 ポータルサイト@ 東京大学〉をごらんください.
  2. 講義に関する情報(Zoom会議室URLを含め)は UTOL該当ページに掲載しました(随時更新).講義資料類(スライド,スクリプト,データファイルなど)もすべてこのページから配布します.
  3. 自宅や研究室など外部から受講される場合は容量無制限の Wi-Fi ルーターを各自用意してください.
  4. 【R事前インストールのお願い】今回の講義で使用するRならびにパッケージ R Commander,さらに RStudio については事前にインストールした上で,各自の責任で作動確認をお願いいたします.まずはじめに「RとRコマンダーをフシアワセなくインストールする前準備」を参照の上,使用するPC環境を整えてください.とくに,Mac OS X については,事前に〈X11〉をアップルのサイトからインストールしておいてください(→ Apple「X11 および OS X について」).X11 がないと R Commander が使用できなくなりますのでこれは必須です.
  5. Windows 版 Rのインストールの手順と起動の確認については「R-InstallationGuide.zip」をご覧ください.Mac OS X 版あるいは Linux 版の R / R Commander / RStudio を使用される場合は,同様のやり方で R 関連ファイルを事前にインストールした上で,各自の責任で作動確認をお願いいたします.
  6. 4月11日(木)と4月18日(木)には,R 関連ソフトウェアのインストールのトラブル個別対応の時間も設けていますので,フシアワセに打ちひしがれる受講生はご利用ください.
  7. 本講義に関する質問回答と情報提供には Discord のを利用する予定です.また,ツイッター(現𝕏)や Bluesky のハッシュタグ #TodaiStat も使えます.


東京都立大学都市環境学部「観光統計解析I」13:00〜14:30(2024年5月〜7月)※zoom オンライン講義

 ※本講義はオンラインで開講します

タイムテーブル
  • 5月28日(火)13:00〜14:30
    • 統計曼荼羅/統計学概論
    • R・Rcmdrの起動確認
    • データの視覚化(1):インデックスプロット
  • 6月4日(火)13:00〜14:30
    • データの視覚化(2):ドットプロット,散布図(2D・3D),箱ひげ図
    • データとモデルの関係
    • パラメトリック統計学の世界観
  • 6月11日(火)13:00〜14:30
    • 分散概念の導出
    • RStudio の起動確認と演習
  • 6月18日(火)13:00〜14:30
  • 6月25日(火)13:00〜14:30
    • 実験計画法(1):完全無作為化法の基礎
  • 7月2日(火)13:00〜14:30
    • 実験計画法(2):分散分析と多重比較
  • 7月9日(火)13:00〜14:30
    • 実験計画法(3):乱塊法とその応用
    • 課題レポート出題とその解説

  1. 上記のタイムテーブルはおおよその予定で,講義と実習とはきっちり分けられてはいません.講義しながら受講生にそのつどRを操作してもらうというやり方で授業を進める予定です.zoom会議室のURLは別途周知いたします.東京都立大学の学内LANあるいは各自Wi-Fi接続できるようにパソコンの設定を確認してください.
  2. 講義資料類(スライド,スクリプト,データファイルなど)はすべて別途開設する Discord 会議室から配布いたします.本講義に関する質問回答と情報提供にもこの Discord を利用する予定です.
  3. 【R事前インストールのお願い】今回の講義で使用するRならびにパッケージ R Commander,さらに RStudio については事前に最新バージョンのインストールをお願いいたします.インストールの手順と起動の確認については「R-InstallationGuide.zip(Windows版R)」を参照してください.
  4. 【Mac OSX あるいは Linux ユーザーへの注意】Mac OS X 版あるいは Linux 版の R / Rcmdr / RStudio を使用される場合は,上記と同じくR関連ソフトウェアを前もってインストールした上で,各自の責任で作動確認をお願いいたします.なお,Mac OS X については,事前に〈X11〉をアップルのサイトからインストールしておいてください(→ Apple サイト:「X11 および OS X について」).X11 がないと R Commander が使用できなくなりますのでこれは必須です.
  5. その他,Rをインストールする際の注意点はこちらを参照してください:三中信宏「RとRコマンダーをフシアワセなくインストールする前準備」.


 →古いハンドアウト類は〈三中信宏・統計学講義のハンドアウト倉庫〉に格納しました.