ATLAS at Anywhere (旧 ATLAS at Osaka)

素粒子実験のデータ解析と大学入試

今日は月に一度の物理学専攻の教室会議でした。大学のなんちゃら委員というのをやるのを非常に嫌っているY教授が,Tさんの根回しにより(?),今年度(と来年度)はなんと物理学専攻長。彼を専攻長に迎えての第1回の教室会議でもありました。

Y教授は専攻長みたいな役職をエラく毛嫌いしているのですが,その実務能力は遥かに常人を超えていて,多くの人は彼を大学の教授にしておくのは勿体ないと考えています。ですから専攻長としての仕事もきっちりとこなすと皆が期待しています。私の場合,何よりも教室会議の時間を短縮してくれるのではないかと期待していました。実際今日の会議で本人も会議を短くしようという意気込みを随所に見せていたのですが,不運なことにとある2つの議論がどつぼに嵌り,3時間を越える長ーい会議となってしまいました。

その議論の一つに大学入試の話題がありました。内容についてはもちろん書けませんが,その議論の最中で私が思っていたのは,大学入試と私たち素粒子実験のデータ解析が非常に似ているということでした。大学入試の目的は,優秀な生徒を選び出すことです。何をもって優秀と定義するかは別次元の問題なので今はそれについては議論しませんが,まあ,とにかくデキのいい学生候補を選びたいわけです。素粒子実験というのは,多かれ少なかれ,莫大な数の事象の中から信号を見つけ出すというのが解析過程での目的です。ヒッグス粒子を探すにはなるべく多くの事象を集め,その中からヒッグス粒子とおぼしき事象を選び出すのが解析でやっていることです。別に探すものがヒッグスでなくてもいいのですが(何をもって優秀な生徒と定義するかの違いと一緒で探す対象は実験によって違う),どういう実験でもやってることというのはなるべく多くの事象の中から特定の信号を選び出すことです。大学入試ならなるべく多くの応募者を募りその中から優秀な生徒を選ぶわけで,こういうざっくりとした点も大学入試と私たちの解析は似ています。

でもってもっと似てるのは,その選定の過程です。大学入試なら,何科目か試験を行い,その得点で合否を決めます。素粒子実験の事象選別も全く同様で,ある特定の変数に対して条件を課していき,すべての条件をクリアした事象を信号(候補)とみなします。大学受験の場合は,試験科目やその配点に違いがあり,最終的には試験全ての得点の合計で合否を決めますが,素粒子実験の事象選別でも使う変数に設ける条件というのを個々の変数ごとに設定して信号とみなす事象を選び出します。本当に全く同様の手法で取捨選択をしてるんですね。どの科目に多くの配点をするかというのは,どういう変数に対してより厳しいあるいは緩い条件を課すか,というのと同じなわけです。

と,この類似性に気付くと次のステップを想像します。上記の説明は実験データの解析の最も単純な場合で,実際には多変数解析なるものが色々な場面で導入されています。大学入試になぞらえると,数学,物理,等々の試験の個々の得点に閾値を設けるのが単純な解析で,多変数解析というのは,全ての試験の結果を総合的に判断するというものです。ただし,ここで言う「総合的判断」というのは単なる点数の合計ではありません。たとえば,私たちが探すヒッグスの信号と偽物事象で,大学入試をやると得点のパターンが非常に似ているという状況を想像してください。大学入試の場合は単純に合計得点の多い人を選ぶわけですが,ヒッグスの信号が必ずしも偽物事象よりも合計得点が高いわけではないのです。ヒッグスは物理の成績はよいけど,化学の成績は非常に悪い,なんていう特徴を持ってると考えてもらえばよいかもしれません。こういう個々の特徴を踏まえて,物理が得意,化学は苦手,球技は得意だが,機械体操が下手,音痴だけどご飯を食べるのが早い人を選ぶような作業がヒッグス探索,あるいは素粒子物理実験の信号探索なのです。で,総合的判断と言った場合は,そういう特徴を選ぶべき変数同士の相関なども含めて(←ここが重要です)多角的に解析,取捨選択するということなのです。これによって,単純に物理が得意だけど化学が苦手な人を選ぶよりも,より高い確度でヒッグスの信号を選び出せます。

これを応用すると,もし,私たちが選びたい生徒が単に試験の合計得点の高い生徒でないとしたら,実は上記のような多変数解析をするのが有効なことになります。ただ,もちろんそれができないのは,実際的な問題もありますが,それ以上に何をもって「私たちが選びたい生徒」と定義するのかがあまりにも難しい議論になります。ですから,大学に入りたい生徒の選定にた私たちが使っている多変数解析を持ち込むのは,まあ限りなく難しい話です。

でも,面接ってのは多変数解析なんですよね。多変数解析の代表例にneural networkというのがありますが,まさにそれをコンピュータを使わずに面接官の脳内のネットワークを使って行っているのが面接です。コンピュータを使ったneural networkの解析では,多数の信号と偽物事象をトレーニングサンプルとして用意し,コンピュータにトレーニングさせます。それによって,信号と偽物を見分けるにはどういう特徴を使うのがいいのか学習させるわけですね。面接の場合は,どういう人が選び出すべき信号で,どういう人が選ぶべきではない偽物事象なのかが明確に定義されているわけではないにもかかわらず,筆記試験をやるよりもより高い精度で選びたい人を選び出せているんですよね,きっと。だって,そうじゃなければ,世の中に面接はなくなります。

ということは,面接をやるという事実から次の2つのことが考えられます。一つには,選ぶべき人とそうでない人という定義が明文化されていなくても,多くの人にとってその定義が共有されている。別の理由は,筆記試験で要求される能力と面接で見極めたい能力が直交している。実際には,この2つの両方が真実で,だからこそ面接をやるのだと思うのですが...。

長くなりましたが何を言いたいかというと,多変数解析の最良の手法である脳内ニューラルネットワーク解析であるところの面接というのは,実際問題としては色々な意味で不可能だけど,大学入試としては最良の方法なんじゃないかということです。すみません,結論はあまりに当たり前(?)でした。ちなみに,大学入試で面接を導入するための最大の壁は,いわゆる公平性なんでしょうね。社会のあらゆるところで面接が人を選んだり,申請された予算の採択のために使われているのに,大学入試では物凄い反対を受けそうです。少数ならばAO入試と流行ですけど,ほとんどの人をそういう手法で選ぼうとしたら,きっと強い反対に遭うんでしょうね。それとも,実は,莫大な志願者を捌けないという大学側の単なる実務上の問題だけで,そういう制度を言い出したら社会には受け入れられる,あるいは歓迎されるんでしょうかね。

大学 | コメント:0 | トラックバック:0 |
<<場所取り,席取り | HOME | 賢い人は賢い>>

この記事のコメント

コメントの投稿















コメント非公開の場合はチェック

この記事のトラックバック

| HOME |