実験計画と分散分析――総論


三中信宏(農業環境技術研究所)
minaka@affrc.go.jp

●ばらつきを調教する−実験を計画する基本的意義

さまざまな要因によって観察データはばらつく.データが示すこの変動の様相を分析することにより,実験処理の変動因としての効果を判定することができる.ある実験処理の効果を調べる目的で実験区を配置することを実験計画と呼ぶ.ある方式で配置された実験区から得られたデータの変動は分散分析によって統計的に分析される.本項目では実験計画とそれに続く分散分析の基本について述べる.
 今世紀初頭に生物統計学者ロナルド・フィッシャー(Ronald A. Fisher)が数理統計学の基礎理論をつくろうとしていた当時,圃場試験データはもっぱら変量間の相関分析のためだけに利用されていた.フィッシャーは単に相関係数の計算だけではデータの解析方法としては不十分であると考え,反復測定・無作為化・局所管理という実験計画の基礎原理群を定式化した.
 フィッシャーの実験計画の考え方の基本は,データのばらつきを調教することにあった.ある実験区から得られる標本からの測定データは,制御された実験処理効果(主効果・交互作用効果)・制御できない背景環境要因の効果・偶然誤差効果の集積として値がばらつく.したがって,単に観察データ値をそのまま見ているだけでは,いったいどの変動因の効果がどれだけ作用したのかはいつまでたってもわからない.そこで,まずはじめにデータのばらつきを各変動因ごとに分割する必要がある.そして,分割されたばらつき成分をそれぞれ評価できるような実験計画を組む必要がある.
 ここで,実験計画という作業には,必ずしも統計学だけでは解決できない側面があることに留意しなければならない.たとえば,圃場試験を考えてみよう.われわれ実験者は,ある程度多くの実験反復を可能にする広さのある,できれば環境的に均質な圃場があってほしいと望む.その希望はうまく実現することもあるし,そうでないこともある.現実的な制約は,数理統計学が要求するような理想的実験環境を必ずしも具現するわけではない.むしろ,現実的に厳しい制約のもとで,いかにして実験目的を達成できる実験計画を組めるかを考えるべきだろう.大規模実験で威力を発揮する直交表に基づいて節約された実験区配置がその良い例である.

●ばらつきを定量化する−偏差・平方和・分散

実験計画の根幹はばらつきの調教であると上で述べた.しかし,まずはじめにばらつきをどのように数値として表現するのかを説明する必要がある.観察データの値がばらつくと認知されるためには,各データ値がそこからばらつく基準値が必要である.ばらつきの測定基準値としては全データxi(i=1,2,...,n)の算術平均値xを採用する.
 無作為標本の各データのばらつきは,偏差xi−x(i=1,2,...,n)として与えられる.しかし,われわれが関心をもつのは,データ全体のばらつきの程度である.そのための第1段階は,偏差それぞれの平方の総和すなわち偏差平方和(略して平方和)Σ(xi−x)^2 である.この平方和には自由度という数値が付随する.平方和の自由度とは,偏差がどのくらい自由に変化できるかを表わす数値である.元データ群xi(i=1,2,...,n)それ自身は無作為標本ゆえ自由度nである.しかし,n個の偏差xi−x(i=1,2,...,n)の間にはΣ(xi−x)=0という制約式が1つあるので,平方和の自由度はデータ数nから制約数(ここでは1)を減じたn−1となる.
 あるデータ集合から計算された平方和はそのデータ集合全体のばらつきの程度を表わす.しかし,データ集合間でばらつきの程度を比較するためには,平方和は不適切である.なぜなら,平方和はデータ集合に含まれるデータの個数に影響されてしまうからである.もっと正確に言うならば,平方和を構成する偏差の自由度(偏差個数−1)がデータ集合間で異なる場合には,平方和によってばらつきを比較することができなくなるという欠点がある.
 この欠点を回避するためには,平方和の自由度による算術平均すなわち平方和/自由度を平均平方と定義し,この平均平方をもって比較可能なばらつきの尺度とみなせばよい.この平均平方は分散の不偏推定値となっている.したがって,データ集合のばらつきを反映する分散という記述統計量の推定値がここからの主役となる.

●ばらつきを分割する−実験計画と構造模型

ある観察データに対して,上の方法で計算された平方和は,データ集合全体の総平均からのばらつきを表わしているので,全平方和と呼ぶ.実験計画とそれに続く分散分析は,この全平方和を構成成分に分割することから始まる.しかし,全平方和の分割のしかたは,実験計画における実験区の配置に全面的に依存している.ここでは,もっとも単純な実験計画である完全無作為化法を例にとって,全平方和の各変動因への分割について説明する.
 一般の1要因完全無作為化法(→【Box1】は殺虫剤7水準[TRT]・4反復による収量調査)に基づく実験計画では,あるひとつの要因に関するいくつかの処理水準を設定し,各処理水準をもつ実験区を複数設定し,しかも実験区の配置を無作為化する.実験区を複数設定することにより,ある実験処理に伴うばらつきを評価できる.実験区配置の無作為化は制御できない背景要因(さまざまな環境要因など)に起因する体系誤差を偶然誤差に転換できる.体系誤差は実験処理効果の判定に影響を与える可能性があるが,無作為化によって偶然誤差に転換してしまえば問題ない.
 いま要因の水準数をtとし,実験区の反復数をrと書けば,この実験で観察されるデータ値はx[i,j](i=1,2,...,t; j=1,2,...,r)と表わせる.ここでx[i,j]は第i番目の処理水準の第j番目の観測値であることを意味する.さらに,第i番目の行の平均(すなわち処理平均)をx[i]と表わし,このデータ集合全体の総平均をxと表わす.
 ある実験計画は観察データの構造模型を設定することにほかならない.ここで考えている1要因完全無作為化法の構造模型とは,x[i,j]=μ+α[i]+ε[i,j] と書き下せる.この構造模型において,μ,α[i],ε[i,j]はそれぞれ母平均,第i処理効果,誤差項である.母平均と処理効果は未知パラメーターという定数だが,すべての誤差項ε[i,j]は独立かつ同一の平均0,分散σ^2の正規分布にしたがう変量(確率変数)であると仮定する.したがって,この構造模型は,第i処理水準の観察値x[i,j]が独立かつ同一に平均μ+α[i],分散ε[i,j]の正規分布をすると仮定しているわけである.
 観察データがこの構造模型にしたがう正規分布をすると仮定した上で,模型に含まれる変動因α[i]とε[i,j]の効果を調べることがここでの目的となる.
 上の表記のもとで,データの全平方和は Σ[i]Σ[j](x[i,j]−x)^2 と計算される.上の構造模型を変形するとx[i,j]−μ=α[i]+ε[i,j] となる.左辺は偏差であるから,この式は偏差を処理効果と誤差効果の和として分割することを求めている.処理平均x[i]を組み込んで偏差を分割するとx[i,j]−x=(x[i]−x)+(x[i,j]−x[i])となる.全平方和の定義式に代入すると:
Σ[i]Σ[j](x[i,j]−x)^2
=Σ[i]Σ[j]{(x[i]−x)+(x[i,j]−x[i])}^2
=Σ[i]Σ[j](x[i]−x)^2+Σ[i]Σ[j](x[i,j]−x[i])^2
と計算される.上式右辺の第1項の平方和Σ[i]Σ[j](x[i]−x)^2は,処理平均の総平均まわりのばらつきを表わしており,処理平方和と呼ぶ.一方,第2項の平方和Σ[i]Σ[j](x[i,j]−x[i])^2は,各処理内での観察データの処理平均まわりのばらつきを表わす誤差平方和である.このようにして構造模型に対応する全平方和の分割が完了する.
 全平方和の自由度(全自由度)は(データ個数)−(総平均制約)=tr−1である.処理平方和の自由度(処理自由度)は同様にして(処理平均個数)−(総平均制約)=t−1となる.誤差平方和の自由度(誤差自由度)については,(データ個数)−(処理平均制約)=tr−tとなる.平方和の分割式:全平方和=処理平方和+誤差平方和に対応して,自由度についても対応する分割式:全自由度=処理自由度+誤差自由度が成立することに注意されたい.

●ばらつきを評価する−分散比の意味の直感的理解

全平方和を構成する処理平方和と誤差平方和およびそれぞれに付随する自由度が求められれば,各変動因の平均平方すなわち分散の不偏推定値が次式により計算できる:
処理平均平方=処理平方和/処理自由度;
誤差平均平方=誤差平方和/誤差自由度.
 データx[i,j]が上記構造模型にしたがって正規分布をする変量であるとき,処理平方和と誤差平方和はそれぞれ処理自由度と誤差自由度に対応するχ二乗分布にしたがう変量となる.ここで,処理平均平方と誤差平均平方の比のもつ直感的意味を考えよう.この比は処理変動/誤差変動を意味している.日常感覚で考えたとき,偶然誤差と比べてある実験処理によって生じたちがいが十分に大きければ,われわれは「実験効果はあった」と判断する.逆に,実験によるちがいが偶然誤差によるばらつきとくらべてさほど差がなければ,「実験効果はなかった」と判定するだろう.この直感的判断に統計学的根拠を与えるのが,次に述べるF分布に基づくF検定である.
 一般に統計学的仮説検定においては,棄却を前提とする帰無仮説を設定する.上の完全無作為化法に基づく実験計画の例では,「すべての処理効果はない」すなわち「α[i]=0」という帰無仮説を設定する.この帰無仮説のもとで,上述の処理平均平方と誤差平均平方の比(F値と呼ぶ)は分母と分子の自由度をあわせもつF分布(F(t−1,tr−t))にしたがう変量であることが証明されている.F分布の「F」とはフィッシャーのイニシャルである.この平均平方とは分散推定値であるから,このF値は分散比にほかならない.分散比の確率分布に基づく仮説検定(F検定)が分散分析の根幹である.
 実際に観察されたデータから計算されたF値が,帰無仮説のもとでのF分布の上でどこに位置するのかがF検定の結果を左右する.得られたF値が小さいならば,帰無仮説を棄却することはできない.一方,そのF値が十分に大きければ(上側確率が5%または1%の棄却域に入るとき),最初に設定した帰無仮説は棄却され,「ある処理効果はゼロではない」という対立仮説を選ぶことになる.実際にどの処理が有意な効果をもつのかは,分散分析ではなく,処理平均間の多重比較という別の統計分析を必要とする.ここで,F値の大小によって実験処理の効果に関するF検定をすることがわれわれの直感的な判断の統計学版であることを確認しよう.

●ブロックを置くこと−乱塊法を用いた実験計画

完全無作為化法というのは,実験計画法を学ぶ上でのいわば入門的方法である.もちろん,実際の研究現場でそれが用いられることはある.しかし,ある程度以上に実験の規模(要因や反復の数)が大きくなったときには,完全無作為化法は使いづらくなる.完全無作為化法の暗黙の前提である実験場所の「大域的な管理」---つまり背景となる実験環境の均一性を全体として維持すること---が困難になるからである.このような大規模な実験を行なうときには,むしろ実験場所全体をいくつかの部分(ブロック)に細分化し,それぞれのブロックの中での実験環境を「局所的に管理」する方がより容易である.
 乱塊法(→【Box2】は,播種密度6水準[TRT]・4ブロック[REP]による収量調査)という実験計画法は,完全無作為化法が組み込んでいる処理反復と無作為化に加えて,ブロック設定による局所管理を付加した実験区配置を行なう.ブロックを作るという乱塊法の特徴は,分散分析をする上では,ブロック効果という新しい変動因を持ち込む.いま要因の水準数をtとする1要因乱塊法を考え,ブロック(反復)の数がrであるとする.このとき,観察データの構造模型はx[i,j]=μ+α[i]+ρ[j]+ε[i,j] と書き下せる.ここで,μ,α[i],ρ[j],ε[i,j]はそれぞれ母平均,第i処理効果,第jブロック効果,誤差項である.母平均・処理効果・ブロック効果は未知パラメーター(定数)だが,すべての誤差項ε[i,j]は完全無作為化法のときと同じく,独立かつ同一に平均0,分散σ^2の正規分布変量であると仮定する.したがって,乱塊法の構造模型でも,第i処理水準・第jブロックの観察値x[i,j]は正規分布をすると仮定している.
 乱塊法の構造模型にしたがって全平方和を分割すると,(全平方和)=(処理平方和)+(ブロック平方和)+(誤差平方和)となり,これと並行して自由度も分割される.平方和を自由度で割ることでχ二乗分布をする平均平方(処理平均平方・ブロック平均平方・誤差平均平方)が得られる.乱塊法の分散分析ではF検定すべき帰無仮説は,「すべての処理効果はない(α[i]=0)」および「すべてのブロック効果はない(ρ[j]=0)」のふたつである.これらの帰無仮説を検定するための検定統計量であるF値もふたつあり:
処理F値=処理平均平方/誤差平均平方
ブロックF値=ブロック平均平方/誤差平均平方
をもちいて,それぞれの帰無仮説をF検定する.

●多要因間の交互作用・多変量分散分析・一般線形モデル

本項目では,実験計画と分散分析の基本を説明するために,あえてごく単純な事例に話題を絞った.しかし,実際の研究・調査の現場では,もっと複雑な実験計画が必要となり,その実行には高性能のコンピューターと統計分析ソフトウェアが要求される.
 大規模かつ複雑な実験計画では,実験要因の複数化と観察変量の複数化そしてこれらにともなう実験区配置の高度化がともなう.実験要因が複数あるときには,各要因ごとの主効果だけでなく要因間の交互作用効果の考慮が必要となる(→【Box3】は窒素施肥量5水準[N]・品種3水準[V]・4ブロック[REP]による収量調査).通常の多要因実験計画では,いずれの要因も等価に扱うが,実験の目的によっては要因間にランクを付けることがある.たとえば,2要因A,Bのうち,要因BをAよりも高精度に調べたい,あるいはBの方がAよりも実験的に制御しにくい要因である場合には,Aの反復数を減らして,Bの反復を相対的に多く取る実験計画を行なう.このような実験計画を分割区法(スプリット・プロット法)と呼ぶ(→【Box4】は,1次要因main-plot factorを窒素施肥量6水準[N],2次要因subplot factorを品種4水準[V],3ブロック[REP]による収量調査).この分割区法では反復の回数がそのまま分散分析の精度に反映される.ほかにも,枝分かれ配置法やラテン方格法といった実験区の組み方もある.実験区の配置法は,実験の目的と管理の容易さによっておのずと制約される.さらに,細分区法(ストリップ・プロット法)のように,要因間の交互作用を精密に調査する実験計画法もある(→【Box5】は,垂直要因vertical factorを窒素施肥量3水準[N],水平要因horizontal factorを品種6水準[V],3ブロック[REP]による収量調査).
 また,観察変量が複数あるときには,多変量分散分析が必要になる.観察変量数が増加しても分散分析の方法論そのものに変わりはないが,計算量は飛躍的に増大する.このような大規模実験では,実験区配置のやり方にも工夫が必要になり,完全な実験実施ではなく,直交表などを用いた部分実施など効率的な実験計画が必要となる.
 分散分析の理論は正規分布に基づく標準的な線形統計学理論の上に構築されており,もっとも包括的な一般線形モデル理論のもとで,すべての実験計画ならびに分散分析の理論的体系化がなされている.

[2 September 2003]