FC2ブログ

ATLAS at Anywhere (旧 ATLAS at Osaka)

コンピュータと将棋

少し前に、コンピュータと女流プロが将棋で対決したことが話題になっていました。あ、いや、私のような将棋(観戦)ファンの間でだけ、かもしれませんが…。結果は順当にコンピュータの勝ち。なにせ実力的には

女流プロ<<トップアマチュア<プロ底辺<<トッププロ

という感じで(平均の話です。分散がありますから実際にはオーバーラップしています)、コンピュータはトップアマチュアかプロ底辺と同じくらい。ですから、今回登場の女流プロは女流の中ではトップクラスですが、実力的にはかなり望み薄。さらに、今回のようなイベントでは人間にはプレッシャーがかかりますが、コンピュータにはそんなものありません。さらにさらに、今回のコンピュータは「あから2010」と名付けられたもので情報処理学会(?)だかが準備した大規模クラスタ。どう考えても人間に勝ち目はなく、勝負としては面白みはあまりありませんでした。もっと言っちゃうと、当初から人間がサンドバッグになるのが目に見えていて、噛ませ犬的な役回りをさせられてる女流プロはよくこのイベント参加を承諾したな、というのが正直な感想でした。

とまあ、それはどうでもいいのですが、私が一番気になるのはコンピュータのアルゴリズム。いえ、トッププロが脳内に持っているアルゴリズムです。単なる読みの速度や正確さでは、もはや人間はトッププロといえどもコンピュータにかないません。それはそうです。指し手を読むというのは、膨大な条件処理をしていくだけなので、演算処理速度の速いコンピュータに勝てるわけがありません。ですので、終盤、お互いの王様が詰むか詰まないか、という状況になると(=特定の局面で、限定された手順を読む場面)、コンピュータ最強です。

それにもかかわらずコンピュータがトッププロに勝てないのは、中盤で差をつけられるからです。というのは、序盤、中盤ではいくらコンピュータといえども、指し手の分岐が10のウン10乗だかウン100乗ある全てを読み切ることはできません。人間同様どこかで読むのをやめて、評価関数に基づいて指し手を比較、決定するのですが、その評価関数がトッププロのニューラルネットに比べてまだまだ負けているからなんですね。評価関数は、ナイーブには駒の損得や王様の安全度、駒がいかに有効利用されているかなどで決まるものですが、実際には固定ではなく、相手と自分の布陣によって変動する関数です。ま、ごちゃごちゃ書きましたが、強い人は局面を一目見てどっちがいいかを正しく判断できるということなんですね。

ちなみに、序盤は過去の例をデータベース化して対応できるので、中盤よりはコンピュータにとって対応しやすいらしいです。ただし、定跡形から離れると厳しいようですが。逆に、コンピュータと戦って勝負重視ならば、定跡形にならないように誘導するのが良いということになります。今回の対戦の場合は、そういう戦いにして負けると悲惨ですから、敢えてそういう戦いにしなかったという面はあったようです。

おっと、脱線しましたが、そういうわけで強い人というのは、脳内に持っている評価関数が弱い人のものよりも高い精度なんですね。でも、その評価関数は極めて複雑、かつ、ぼんやりとしたものだと思うのです。理路整然とこういう理由でこっちの局面の方が有利だ、とは判断してないと思うんですね。子供の頃から培ったいわゆる勘というやつですか。まさにニューラルネットワークによる解析ではないかと。無数の対局によってネットワークをトレーニングしてきた結果、信号と雑音を分離する能力が極めて高くなったのが強い人なのではないかと思うわけです。で、人間の脳の凄いのは、どういう評価関数を使っているのか自分自身で認識してなくても、ちゃーんとネットワークをトレーニングできる点です。

同じような話が私たちの分野にもあって、有名なのは昔のカミオカンデのデータ解析です。彼らはどういう事象が発生したかの識別を人間の目で行っていたんですね。イベントディスプレイを見て。検出器で観測したエネルギーや、それらを組み合わせて粒子の飛来方向なども推測するわけですから、それらをもとに評価関数を作って識別することも原理的には可能なのですが、あるときまでは訓練された人間のほうが精度がよかったのだそうです。もちろんコライダー実験と違って事象数が少ないから、イベントディスプレイを人間の目で全部チェックすることができますし、そもそも訓練をすることができたわけですが、方法としては、頑張って評価関数を作ってコンピュータにやらせるよりも人間の目が勝っていたというのが凄いところです。他にも、幾つかのデータ点から近似的な関数を求める際に(フィットすると言います)、そのフィットの善し悪しを数学的に定義された数値で表現するのですが、KEKのTなかMくんは「フィットの善し悪しを判断するのは俺の目だ」という名言を残しているように、何かを判断するとき、人間の直感というのは実は侮れません。

そういうわけで、実際的には統計量が多過ぎてまずトレーニングをできませんが、原理的には人間がイベントディスプレイを見て事象選別をするのもそんなに悪くない手法なのかな、とか思ってしまう今日この頃です。FermilabにいたYさんという日本人のかたは、D0実験で得られた無数のイベントディスプレイをプリントアウトして分厚いファイルにして持ち歩いていましたが、彼もそう考えていたのかもしれません…。って、実際論的にはトレーニングするためにどんだけのイベントを見なくちゃならないんだ、という話ですけど。

日常 | コメント:5 | トラックバック:0 |
<<商品価値 | HOME | 自転車激突>>

この記事のコメント

クラスタはほぼ機能してなかったようです。
実質、バックアップ用のマシン(6coreのXeon)での合議制だったそうです。
http://blog.livedoor.jp/lunarmodule7/archives/1121781.html

それでも順当勝ちだったので凄いですよね。
2010-10-20 Wed 18:52 | URL | Ray [ 編集]
私の記憶が確かならSKの最初の頃までEye scanは行なわれていたと思います。
やり方は詳しくは忘れましたが、Real Data と MC Data を区別がつかないように混ぜておいて、bias を極力省いた状態で efficiency と background が同時に見積もれるようにしていたんでは無かったでしょうか?
単に目で選ぶと言うと、誤った印象を与える気がしたので、補足しておきました。
あと、目で選ぶと言えば有名なのはエマルションもそうじゃ無いでしょうか。

ちなみにLEP2でEnergyが上がったときは event display をスキャンしてあれこれ考えて楽しんでいました。実際計算機で選ばれた(選ばれなかった)Eventには人の目で見ると明らかに違うとわかるものも含まれるので、Event Selectionを考えるのに役に立ちました。
2010-10-20 Wed 19:16 | URL | 中村@Belle [ 編集]
Rayさん、こんにちは。

> クラスタはほぼ機能してなかったようです。

あ、そうなのですか。
そしたら、負けた時の言い訳しずらくなっちゃいますね。
私の個人的な思い込み・感想ですが、CPUがしょぼくても
女流ではコンピュータに勝てないのではないかと思います。
でも、それだと負けた時のダメージが大きいので、今回の
ような特別仕様(あるいはお祭り)にして、特別仕様だから
仕方ない、という逃げ道を作っていたのではないか、と
思っていました。もちろん穿った見方で、本来は、情報学会が
どれくらいコンピュータがやれるか見てみたかった、という
ところなのかもしれませんが。
2010-10-21 Thu 16:05 | URL | ExtraDimension [ 編集]
中村さん、細かい補足ありがとうございます。
2010-10-21 Thu 16:06 | URL | ExtraDimension [ 編集]
数年以内にコンピュータには敵わなくなると思いますよ。チェスではもう10年くらい前でしたか?
子どもに考える力を養うため、将棋を教える女流棋士に存在価値はあると思いますが、
女性は実用的なことに興味を持つ割合が高くて、棋士になろうとする人が最初から男性の
20分の1しかいないようです。今回の結果で、役に立たないのに偉そうに振舞う男性が増える
なら、早く男性棋士にも挑戦してもらいたいです。既に男性棋士の一部よりは強いのでは?

プロ将棋で誰が勝っても、その趣味を持つ人以外には関係ありません。
どうせ税金を使うなら、その場限りではなく後で応用もできる科学技術、救急・介護法や
技能の競技を奨励してもらいたいです。
「善意は隠れて」と言いますが、もっとおおっぴらに表彰して悪いことはないように思います。
実際、職業として短命な相撲や、一方が必ず負けて関係者が嬉しいだけのスポーツ競技
よりはずっと他人の役に立つのですからそういう人のほうが偉いと思います。
ノーベル賞の人数が少なすぎるから、選に漏れたようなケースが出てしまうのでは。

ブログにも書きましたが、人生の悲喜はいわば素粒子のギネスブックに日々記録していくようなもので、「美しい嘘」よりも真実であることのほうが、基本的には価値があると思います。私の主張も、ボランティアで多くの人にわざわざ嫌われるような書き方をしていますが、進路を誤って自殺したり後悔する羽目になる人を予防できるなら、役に立ったと言えるでしょう。

科学的に正しい主張をする者が報われる社会になりますように!

ところで「人間のほうが精度が良かった」というのは最終的には誰が正誤を決定したのでしょうか?

ニュートリノの種類なんて、厳密には、そのニュートリノから実際に電子なり、τなりができないことには判別しにくいのでは。解釈によっては捏造データなのかも、ということになりそうですが、専門家のブログならばその微妙なところの説明を、疑義がなくなるように詳しくお願いいたします。私は東京大学で6年間も素粒子物理学の理論研究室におりましたが、教授が実験イベントデータを解析しているところは見たことがありません。東大の理論系教授のうち福来正孝先生だけは、実験と近い計算を多くなさっているように思われました。
2010-10-24 Sun 19:22 | URL | nisimiyu [ 編集]

コメントの投稿















コメント非公開の場合はチェック

この記事のトラックバック

| HOME |