〈ベイズ進化学〉シンポジウム報告


三中信宏(農業環境技術研究所)


第6回日本進化学会大会(東京大学)会期中の2004年8月6日に開催された「〈ベイズ進化学〉―― 進化研究における新しい計算統計学手法の利用」の報告をします.私はこのシンポジウムのオーガナイザーでしたが,私自身が現代版「ベイズ統計学」の最前線について知りたいと思ったのが,このシンポを企画した動機です.生物学・進化学にとって統計解析は研究活動のさまざまな局面で欠くことのできないツールとなっています.しかも,統計学そのものが長足の進歩を遂げており,そこから出力された新たなツールが研究現場での実際の問題解決にどれくらい役に立つのかは,リスクとベネフィットをつねに合わせもっています.実際に具体的な問題に適用してみて,初めてある手法の利点と欠点が見えてくることがあります.とくに,既存の対立手法があるときには,新旧のツール間の競合がどのような結果に終わるかは,少なくともその最中にいるときには,判断できないことが少なくありません.とりわけ,多くの分野にほとんど同時的に浸透し始めた手法があるとき,なぜその手法が多くのユーザーにとって魅力的に見えるのか,その実体と実態について知ることは潜在的ユーザーにとってきっと有益だろうと考えられます(使うかどうかの判断はもちろん各ユーザーに委ねられていますが).

強力な統計ツールが「開発されること」は,必ずしもそれが実際に「使用されること」とは必ずしも相関しません.そのツールの存在がユーザー側に周知されるかどうか,そしてそれが現場のデータに対して使えるかどうかは別問題です.しかも理論としてすぐれているかどうかというレベルではなく,現実的な計算時間の範囲内で解答を出してくれるかどうかという点で,普及にタイムラグが生じるということもあります.今回のシンポジウムのテーマである〈ベイズ統計学〉はこの後者の事例にあたると私は考えています.

ベイズ統計学それ自身は決して新しい統計学理論ではなく,統計学史の上ではむしろ古くからある研究プログラムのひとつです.確率の主観的解釈をめぐる統計学の頻度派(frequentist) vs. ベイズ派(Bayesian)の対立は有名です.しかし,現在,生物学を含む多くの学問分野でその利用が急速に広まっている「ベイズ的手法」は,そういう歴史的文脈とはいささか異なった軸の上で展開しているように見えます.今回,私が企画したシンポジウムは,この新しい「軸」がいったいどのようなものなのか,そして進化学の研究にどのような利点(と問題点)をもたらすのかという問題意識のもとに企画しました.

ベイズの逆確率定理に書かれているような,事前確率と事後確率との関係は,われわれ自身がある問題の解決に際して有している背景的な知識や知見をどのように利用できるのかという重要な論点につながります.事前情報を事前確率の形で組み込もうするのが“ベイズ的”なものの考え方であり,ベイズ統計学に関わる歴史的論議のある部分は,事前情報を統計学的に組み込むことは果たして可能なのかに関わっていました.最初の演者である岸野洋久(東京大学)さんの講演「進化・適応の系統間の分布,遺伝子間の分布」では,ベイズ統計学の現代的発展形である「階層ベイズ法」と「経験ベイズ法」について具体的な適用例を挙げながら説明されました.推定対象である未知パラメーターを上位で支配する「超パラメーター」を設定するというのがポイントとなります.事前情報を超パラメーターに関するモデル(制約)として組込み,データから同時に推定してしまおうということです.パラメーターの階層は原理的にはいくらでも積み重ねられるわけですが,その階層化に起因するモデルの複雑度の増大にどのようにして歯止めをかけるのかという問題は残りそうです.

続く宮正樹(千葉県立中央博物館)さんの講演「大規模データ解析から明らかになった分子系統学におけるベイズ推定の効用,問題点,そしてその解決策」では,ベイズ法による系統推定プログラム〈MrBayes〉を用いた魚類の分子系統推定を例に挙げながら,系統学へのベイズ的手法の功罪について話題が提供されました.現実のデータ解析の中で,探索的なパラメーター推定を行なうに当たっては,計算時間の負荷が無視できません.ベイズ推定を行なうためには,通常の最尤法(これだけでも十分に計算時間がかかる)に加えて,事前確率(超パラメーター)に関する積分計算をしなければ事後確率が得られないからです.ほんの10年ほど前までは,まさにこの理由によりベイズ的手法は実践的な解析ツールとなり得なかったのだと私は推測しています.しかし,1990年代半ばに開発された「マルコフ連鎖モンテカルロ法(MCMC)」の登場により,状況は大きく変わりました.逐次的に事後確率分布からのサンプリングを繰り返すことで最適解を求めるというMCMCに基づくベイズ推定法は,宮さんが話された分子系統学を含め,数多くの生物学の領域に急速に浸透しつつあります.パラメーター推定のための新しい有効なツールとしての性格を現在のベイズ推定法は色濃く帯びています.

最後の北門利英(東京海洋大学)さんの講演「ベイズ統計とMCMC:分集団構造と空間分布の解析を通じて」は,階層ベイズ法・経験ベイズ法そしてMCMCのメカニクスを理解する上でとても教育的でした.“ベイズ”といえば哲学的なレベルでの確率論・統計学の理念的対立がかつてはあったわけですが,ここ数年浮上してきた“ベイズ”はそれとは別の次元での「解析ツール」として効用がつねに強調されています.これまでは数値的に解けなかった推定問題が MCMC を用いて解決できるようになったという技術的なブレークスルーが,ツールとしてのベイズをいろいろな学問分野に普及させた原動力なのでしょう.もちろん,モデルがいくら複雑になってもそれなりの時間をかければ数値的に解けてしまうというのは,モデル選択の立場からいえば「諸刃の剣」のように私には感じられるけど,そのあたりの問題はなお残されているようです.