乱塊法:実験計画法の基礎知識5

実験計画法の基礎知識

更新日:2021年12月8日(初回投稿)
著者:大阪大学 大学院 情報科学研究科 教授 森田 浩

前回は、交互作用の考え方を紹介しました。今回は、初めに変量因子について説明します。特性に影響を与える因子には、実験者が制御できないものがあります。例えば、使用環境に気温が影響している場合などです。寒い日もあれば暑い日もあるので、最適な気温を設定しても意味はありません。このような因子にはばらつきはあるものの、水準を指定できないため再現性がありません。これを変量因子といいます。また、今回は、乱塊法の仕組みと、最適水準における推定や予測方法についても説明します。乱塊法とは、変量因子を計画に取り入れることで、変量因子のばらつきをとらえ、解析の精度を上げる手法です。

1. 局所管理

データを記録するとき、実験を行う時間帯や場所(系統誤差)に影響を受ける可能性があります。局所管理とは、その際に実験を行う時間帯や場所を均等にした条件(ブロック)を作り、そのブロック内でのバックグラウンドができるだけ均一になるように配慮することをいいます。

特性に影響を与えはするものの、最適な水準を決めることに意味のない因子があります。例えば、タイヤの摩耗量は走行路の状態に影響を受けます。タイヤの摩耗性を比較するとき、あるタイヤは舗装道路では摩耗量が少なかったとしても、舗装道路しか走行しないわけではないので、そのタイヤが優れているとはいえません。さまざまな道路を走行した上で、タイヤの摩耗量を比較しなければなりません。この場合、走行路の状態は重要な因子となるものの、その最適水準を特定することには意味はありません。このような因子を、変量因子といいます。

一方、これまで扱ってきた処理温度や配合比率のような因子は、最適水準を設定することで特性を高めることが期待できます。このような因子を母数因子といいます。

変量因子の水準を決めずに実験を行うと、そのばらつきも誤差と見なされ、誤差分散が大きくなります。つまり、走行路の違いによるばらつきも誤差と見なされます。その結果、分散分析を行っても、要因効果を適切に検出できなくなります。

乱塊法では、変量因子をいくつかのブロックに分けることで変量因子の及ぼす影響を定量的に捉え、誤差分散を精度よく求めます。このときの変量因子は、ブロック分けに用いる因子ということで、ブロック因子といいます。

走行試験の場合は、走行路の性質をブロック因子として、例えば、舗装路、石畳路、登坂路、凍結路、湿潤路などを水準として設定し、それぞれの走行路でタイヤの摩耗量を測定して、タイヤの優劣を考えます。特定の走行路だけで試験をした場合、通常の走行状況を反映していることにはならず、また、ランダムに走行路を決めたのでは誤差が大きくなってしまいます。

ブロック因子の考え方は、肥料の効果を調べるために、農地をいくつかの区画(ブロック)に分けて実験を行ったことに始まります。広い農場では日当たりや土壌の質などを均一にできないため、肥料の効果を適切に把握できません。そのため、各区画の各列に肥料をランダムに割り振ることで、区画による違いと肥料による違いを区別できるようにしました。ここでは、区画がブロック因子となります。この他に、ブロック因子の例としては、被験者、実験日、原料ロットなどがあります。

2. 乱塊法のしくみ

乱塊法とは、実験全体を無作為化するのではなく、局所管理の考えに基づいてブロック因子を導入し、ブロック内で無作為化を行う方法です。開発した3種類のタイヤについて、摩耗量に違いがあるかを調べるために実験を行います。走行路をブロック因子として5水準を設定し、それぞれに走行試験を行って摩耗量を測定しました。その結果を表1に示します。タイヤの種類が母数因子、走行路が変量因子となります。

表1:走行試験のデータ
  舗装 石畳 登板 凍結 湿潤 合計 平均
タイヤ1 10.8 12.2 11.9 8.5 9.2 52.6 10.52
タイヤ2 10.9 12.7 12.2 8.3 9.3 53.4 10.68
タイヤ3 10.1 11.4 11.9 8.1 9.1 50.6 10.12
合計 31.8 36.3 36.0 24.9 27.6 156.6  
平均 10.60 12.10 12.00 8.30 9.20   10.44

これは、タイヤと走行路の2つの因子を取り上げた、繰り返しのない二元配置実験と同じデータです。ここで最適水準を求めるのは、母数因子のタイヤです。もし、変量因子として走行路を考えなければ、1つの因子としてタイヤ(A)を取り上げた繰り返し5回の一元配置実験と見ることができます。その場合、表2の分散分析表が得られます。誤差分散はVE=2.880もあり、タイヤの主効果は有意とはなっていません。すなわち、タイヤによる摩耗量の違いがあるとはいえません。

表2:一元配置実験の分散分析表
要因 平方和 自由度 平均平方 f値 P値 F境界値
A 0.832 2 0.146 0.14 0.867 3.89
E 34.564 12 2.880      
T 35.396 14        

乱塊法では、ブロック因子として走行路の種類(R)を取り上げています。2つの因子を取り上げた繰り返しなしの二元配置法と同じ計算を行い、表3の分散分析表が得られます。

表3:乱塊法実験の分散分析表
要因 平方和 自由度 平均平方 f値 P値 F境界値
A 0.832 2 0.146 5.86 0.027 4.46
R 33.996 4 8.499 119.7 0.000 3.84
E 0.568 8 0.071      
T 35.396 14        

誤差分散はVE=0.071です。一元配置法で誤差と見られていたほとんどは、走行路の違いによるばらつきだったことが分かります。誤差が正しく把握できたことで、タイヤの主効果は有意となり、タイヤによって摩耗量に違いがあることが分かります。

ここまでの計算をExcelで行うには、第4回で用いた分析ツール「分散分析:繰り返しのない二元配置」を使います。全体のデータ数、合計、平均も求めておきます。以上の結果を図1に示します。

図1:Excelによる乱塊法の分散分析

図1:Excelによる乱塊法の分散分析

3. 最適水準における推定と予測

続きは、保管用PDFに掲載中。ぜひ、下記よりダウンロードして、ご覧ください。

4. 水準間の差の推定

続きは、保管用PDFに掲載中。ぜひ、下記よりダウンロードして、ご覧ください。