将棋における適切なハンディのつけかた


※ 今日は、前回記事で書ききれなかった残り半分について書きます。


【前回記事】
将棋における駒落ちのルールとその考察
http://d.hatena.ne.jp/yaneurao/20140414#p1


「コンピューター将棋 vs 人間」という対局において、どんな手合いが適切なのか。コンピューター将棋の近年の進歩はめざましく、10万円未満で買えるような家庭用PCであっても、互角以上に戦える人間というのは将棋人口のうちの一握りであり、もう最後の砦(プロ棋士、あるいはそのなかでもトップレベルのプロ棋士)しか残されていないのが実状である。


将棋ソフトのほうも、「人間の大局観」をプログラムするのが難しいと言われていた時代はとっくに過ぎ去っており、Bonanzaに代表されるような三駒関係という精度の低い評価関数(※)であっても、PCの演算能力に任せて先を読めば(きちんと探索すれば)、トップレベルの人間の指し手に匹敵することがわかってきた。
※ GPS将棋など丁寧に作りこまれた評価関数に比べて局面評価の精度が低いと言う意味。Bonanzaのfv.binがきちんと学習されていないのが悪いという話ではなく、三駒関係自体の学習能力の問題。


おまけに近年、Bonanzaメソッドより大きなブレイクスルーがあった。(と私は思っている) Bonanzaメソッドでは棋譜にあまり出現しない特徴はゼロになってしまう。(機械学習で言うところのL1/L2正則化の影響) これをうまく式変形して回避する。このアイデア自体は以前から将棋ソフト開発者のなかでは密かに行われていたことなのであるが、それをもう少しきちんとやったのがNDFである。*1 まあ、このへんはいろいろ工夫の余地があるが、ともかく、第二のブレイクスルーにより、Bonanza6からR500以上、上がりそうな気配がある。


こうなってくると、数年後にスマフォで名人を超えるというのは、もはや夢物語でも何でもない。


だからと言って、いくら太刀打ちできないからと言って、コンピューターのスペックを落としてまで戦って欲しくないというのが将棋ファンの気持ちとしてある。


10年もしないうちに、炊飯ジャーに搭載されているマイコンですら名人に勝ち越すことも十分に考えられるが、炊飯ジャーに負ける名人を将棋ファンは見たいだろうか?私は見たくない。


だから、PCスペックに制限を課して、ソフトをわざと弱くしてそれで勝負するのではなく、可能な限り高いスペックのPCによる最高の指し手、人間側も序盤は藤井先生、中盤は羽生先生、終盤は谷川先生のように、バトンタッチするなり合議するなりして、最高の指し手を指せる環境を作り、最高の指し手と最高の指し手がぶつかり合うところを将棋ファンは見たいのではないかと思う。


今回の電王戦で、森下先生は盤駒があればヒューマンエラーが減るので人間の勝率は上がると(今回出場した5ソフトにも勝てるとも)おっしゃった。将棋は最後にミスをしたほうが負けやすいという性質があるので、ヒューマンエラーをなくすのは特に重要である。ただ、森下先生の「盤駒があればヒューマンエラーが減る」に対しては、そこに居合わせた他のプロ棋士の先生ですら懐疑的であったので、おそらく「盤駒を使ってもいいです」と言われても使うのは森下先生だけとなるのではないかと私は思う。


それでも、森下先生の「盤駒を使えば」発言の背景は私にはなんとなく理解できる。森下先生は矢倉の大家である。矢倉は相当深くまで研究できるし、わずかなリードを少しずつ広げていく技術が要求される将棋であるから、ミスさえ出なければコンピューターの下手くそな序盤を早い段階で咎めてそのまま優位を拡大できそうな戦型である。一般論としてはコンピューター将棋はねじり合いは得意なので長い中盤戦にすると人間のほうが不利だと言われているが、森下先生の指す矢倉にはそんな一般論は通用しないのではないかという期待もある。


また、ヒューマンエラーをなくす目的であるならば、「待った」がありでもいいと思う。私があるプロ棋士の先生に聞いたところ「1手だけ戻しても手遅れであることが多い」らしいので、1回の「待った」で10手まで戻してもいいこととし、1局のなかで3回まで「待った」をしてもいいというルールで人間の勝率がどれくらい上がるのかというのは興味深いところである。


まだ、平手の勝負でプロ棋士と将棋ソフトとの格付けが済んでいないのに何故ハンディのことをこんなタイミングで出すのかと言うと、さきほどのNDFのもたらすブレイクスルーが一つ目にある。(今年の年末には上位のソフトは去年よりさらにR100〜150ぐらい上がるかも知れない) 二つ目として、今回の電王戦で五位の習甦ですら、現時点でもうタイトルホルダーぐらいの実力があるという現実がある。


菅井五段の発言から統計的にコンピューター将棋の実力と電王戦を考えてみる。(karonikki らくがき手帖)
http://d.hatena.ne.jp/sanjy/20140320/p1
>「習甦」の実力は全棋士163人のうち、6〜24番目ぐらいに相当するだろうと推測される


だから、「五局の勝敗だけではなんとも言えない」などと悠長なことを言っていると来年か再来年にはトッププロですらトップのソフトに対して勝率2,3割の時代が来かねない。


暗算名人が電卓と真っ向から計算勝負で競っても仕方がないの同様に、コンピューター将棋ともそろそろ適切な手合割を設定しなければならない時期に差し掛かっているのである。


その一つが駒落ちでの勝負である。


私がひとつ前の記事で私が書いた通り、将棋の駒落ちというのは、公式戦で指されないのであまり研究がなされていない。(戦前には公式戦で指されていたようなのだが) 木村義雄十四世名人の『将棋大観』に載っている香落ち戦は上手・下手ともに指し回しがいかにも古臭い。現代の、トッププロ同士が香落ち戦をやるとどうなるのか(もしかして必勝定跡が発見されるのではないか、定跡の整備がさらに進むのではないか)など、将棋ファンとしてはとても興味のあるところだ。


あと、現状、将棋の駒落ちは結構アバウトな手合いしかない。香落ちの次が角落ちなのだが、いくらなんでも差がありすぎだ。また、香落ちより小さいハンディをつける手段がない。そもそも、香落ちがどれくらいのハンディなのか今ひとつ知られていない。


そこで、まず、香落ちがどれくらいのハンディなのであるかをここで説明する。


香落ちは本来は二級差と言われている。レーティングで言うところのR200程度の差だということだ。ところが、アマチュアで2級の差がある級位者同士で対戦した場合、香落ちだとほとんどハンディにならないのが実状である。香落ちを咎めるのは級位者には非常に難しいし、級位者は、振り飛車にすれば相手(居飛車側)から角を成られたときに取れるはずの香がすでにいないので、むしろ上手(うわて)が有利なんじゃないかとぐらいに上手(うわて)も下手(したて)も思っている。


もちろん、プロの間では違う。2009年に『将棋世界』のなかでプロ同士の香落ち戦が実現したことがある。結果として4戦とも下手が勝ったが、必勝手順を見つけるには至らなかった。


プロの香落ち(LogicalInSpace)
http://blog.goo.ne.jp/mathshogi/e/02ef758ceedc62a9dee93c276cb1bf70



私は電王戦第五局の終局後の記者会見のときに、「(ソフト側から見て)勝率8割というのは、もしこの8割がコンスタントに続くのであれば、これは香落ちの手合いではないか」と発言した。これが大変失礼な発言ではないか、「プロを馬鹿にするな」と言うことで、私への批判が絶えないわけであるが、一言だけ言わせてもらうと、例えば、片上理事のブログ(前回記事で紹介した記事)のなかに、次のような記述がある。


駒落ちあれこれ(daichan's opinion)
http://shogi-daichan.seesaa.net/article/43347155.html


片上理事は、香落ちは「(実力互角の)プロ同士で勝率7割前後(と予想する)」のだそうだ。これからすると、平手で勝率7割という差があるもの同士ならば香落ちがちょうどいい手合いということになる。


つまり、私が「本当に勝率8割だとしたらそれは香落ちの手合い」と言ったが、そのとき片上理事は、「なんだと?プロをナメやがって!」と内心思われていたのではなく、「本当に勝率8割なら、それは香落ちなんてもんじゃないな。香落ちは勝率7割のときの手合いだろう。」と内心思われていたのではないだろうか。


まあ、そんな香落ちではあるが、それでもプロが香落ち戦を本気で研究をすれば必勝手順(必勝の局面までの手順)が見つかるかも知れないので、であるなら、平手でやったときに勝率9割ぐらいの実力差でないと上手は勝てないことになる。


そこで、香落ちより小さなハンディをつける手段が必要となるわけだ。この部分が、将棋では従来、あまり新しいルールが提案される機会はなかった。そもそもプロ棋戦は平手のみであるから、いままで新しいルールなど必要なかった。


また、将棋ソフトは、駒落ちに対してすこぶる弱い。これは駒落ち棋譜が少ないので駒落ち棋譜から評価関数のパラメーターの学習をさせていないことも理由にある。あのPonanzaですら、二枚落ちの上手(うわて)をもって穴熊に囲い、自滅してしまう。


なので、ソフト開発者としては出来ることなら駒落ち以外の方法で香落ちより小さなハンディをつけたい。


そこで私が提案するのは、チェスの「後手1手待ち」ルールである。これは、先手が初期局面で二手指し、そのあと後手が一手指す(あとは、先手、後手、普通に一手ずつ指す)というルールである。「後手1手待ち」はお手軽に導入でき、ソフトの評価関数が暴発しないギリギリのところではないかと思う。


ちなみに、森下先生に「後手1手待ち」ルールでの先手の最善手が何だと思うかを尋ねてみたら「26歩〜25歩ではないですか」とのことだった。


また、後手1手待ちルールは、もう少し大きなハンディにするために後手n手待ちルールに拡張することが出来る。この場合、76歩〜33角成で相手の玉を取れてしまうとおかしいので、この後手が待っている間は先手は駒を1〜5段目には進めない、などの条件が必要となる。


森下先生に1〜5段目に駒が進めない「後手1手待ち」ルールでの先手の最善手について尋ねてみたところ「76歩,26歩ではないですか」とのことだった。
また、「後手1手待ち」がどれくらいのハンディかを尋ねてみたら、「香落ちよりは小さいハンディでしょうね」とのことだった。


しかし「後手1手待ちルール」のような特殊な(従来の将棋にはない)ルールが採用されるためには、このルールが周知されている必要がある。そこで、HEROZの林社長に「後手n手待ち」でのハンディ、将棋ウォーズに採用しませんか(いまならタダです!)と提案したところ、興味は持ってもらえたようだ。(「将棋ウォーズ」に採用されるかどうかはわかりませんが、100万人以上が遊んでいる将棋アプリに採用されたらインパクトは絶大。)


また、序盤の1手の価値がどれくらいなのかというのはあまりデータがないが、Ponanzaで初手で長考させると先手+70点ぐらいという話があったので、1手の価値はそれくらいだと思う。序盤の3手の価値が210点(※歩=100点、一歩得=200点なので、序盤の3手の価値≒1歩得)というのはだいたい感覚的なものに合致すると思う。(2手得する代わりに横歩を取らせるような戦法がやや損ながらギリギリ成り立つので)


あと、GPS将棋によると香落ちは+100〜+200点だそうな。(読みが深くなってくるともっと点差が開くのかも知れない)



https://twitter.com/shogi_pineapple/status/456466001094131713/photo/1


とりあえず、私が提示できるデータはすべて示したし、言いたいことはすべて書いた。これでこのブログでの将棋関連の記事はいったん終わりとしたい。
読んでくださっている将棋ファンの方々、関係者の方々、いままでありがとうございました。


明日からこのブログはボカロブログになります。(←本気)


[2014/4/22 5:30] 追記。



https://twitter.com/itumon/status/457536790811787264


うおー!!itumon先生にそんなことを言ってもらえるだなんて!!
将棋の記事も定期的に書きますので、今後ともよろしくお願い致します。