将棋倶楽部24にいるやねうら王によくある質問


■ 将棋倶楽部24のやねうら王について


Q) やねうら王はいつまで将棋倶楽部24にいますか?
A) 電王戦での対局(3月22日両国国技館)が終わるまでは毎日21時〜24時ごろに参戦するつもりです。
→ 場合によっては電王戦が終わるまで続けるかも知れません。


Q) やねうら王はいつ開始して、いつ終了するの?
A) 開始/終了のアナウンス自体は、やねうら王公式サイトの画面一番下の領域を使うことにします。ここをご確認ください。


やねうら王公式サイト
http://yaneuraou.yaneu.com/


Q) 満員でログインできないんだけど!
A) 公式サイトの画面下部に対局中の盤面が表示されるようにしました。上記の公式サイトからご覧ください。
→ クラウド盤面ジェネレーターというのを使っていたのですが、そこの利用制限を超えたようなのであとで自作します。[2014/3/13 23:00]
→ 自作しました。また数手前の局面やそこでの読み筋なんかも確認できるように変更しました。[2014/3/14 3:10]


Q) PCからも挑戦できるようにして!
A) そのへんは久米さんに…。スマフォから、一日一回の無料対局でも挑戦できるはずです。(早指し、平手であれば)


Q) 挑戦できないんだけど!
A) いまR400以内の人からの挑戦しか受け付けなくしてあります。いずれ様子を見て、このへんの条件を緩和したいと思います。しばらくお待ちください。
→ 稼働時間を伸ばし、21時〜24時 = R400以内だけの挑戦を受ける。1手15秒、負けたことのある人には1手29秒。夕方(開始時間不定)〜21時 = フリー対局室で誰の挑戦でも受ける。1手3秒。という設定で運用を実験的にやってみます。[2014/3/13 19:40]
→ ゴールデンタイムに強い人との対局が見れないのは残念だとの声が強かったので、挑戦待ち後、3秒以内R200差以内、6秒以内R400差以内、9秒以内R700差以内、12秒以内R1200以内、それ以降、誰でもという設定に変更しました。[2014/3/15 1:00]


R400差超えの人からの挑戦を受けないのは負けてRが大きく下がるのを回避するためではないです。私も先日まで知らなかったのですが、「ただし特例として、レーティング2600点以上の者と400点以上の点差がある者との対局では、レーティングは上下しない。」*1のだそうで、もともとレーティングは下がりようがありません。


■ やねうら王の強さについて


Q) いま将棋倶楽部24にいるやねうら王、ponanzaより全然弱いよね?
A) ponanzaとやねうら王とは同PC比較で、頭ひとつかふたつ分ぐらいの差はあるのだと思います。(直接対戦させたことはないので、正確なデータはないです)


Q) それにしても弱いよね?
A) 参戦させているPCが5万円台で組み立てられるPC(Core i7 4771 , 4コア)なので、6コアのCPUとはR50、8コアとはR100、16コアとはR200程度の差があると思います。


Q) いまのやねうら王では、将棋倶楽部24でR3000ぐらいが限度では?
A) いま、やねうら王は思考時間15秒で動かしています。30秒ですと、倍の強さ(R150程度up)します。あとponder(相手の手番でも考える)有りであれば、1/3ぐらいはponderhit(予想手にhit)して、思考時間の節約ができますので、さらにR50程度上がります。つまり、この5万円PCでもまだ+R200ぐらいの余力を残しています。


Q) じゃあ、そうすれば?
A) やねうら王のレーティングがまだ安定していないので、安定するまではこの思考時間設定でやるつもりです。


Q) R3000ぐらいではプロ棋士に勝てないっしょ。
A) 本番は5時間の持ち時間なので序盤では1手に3分〜5分考えることが出来ます。仮に4分考えるとしたら、15秒の16倍。16 = 2の4乗で、2倍になるごとにR150upするので、R150×4up = R600程度upします。電王戦のPCは6コアなのでR50up。そしてponder有りなのでさらにR50up。


Q) いまの将棋倶楽部24の条件でR3000ならば、電王戦本番では、R3000 + R600 + R50 + R50 = R3700相当(将棋倶楽部24の早指し時の棋力に換算すると)になっているってこと?
A) そうなります。しかし、人間側も思考時間が伸びるので、そのとき人間側がR3500相当になっているか、R4500相当になっているだとか、そのへんは未知数ですが。


Q) やねうら王は、対角交換型振り飛車(レグスペとか)、苦手だよね?
A) これは激指やBonanzaなどに一般的に存在している傾向のようです。学習に使っている棋譜が古いとそういう将棋が少ないからなのだという説があります。やねうら王は局後学習があるので同じ指し手は回避すると思いますが、人間側が少し手順を変えますと依然として通用するというのはあるでしょうね。


Q) じゃあ、やねうら王、駄目じゃん。
A) R3700相当になったやねうら王+局後学習でも回避不可能かどうかは…見てのお楽しみというところではないでしょうか。


Q) やねうら王、入玉弱いよね?
A) 入玉対策はほとんど何もしていないのでかなり弱いです。コンピューター将棋で入玉がうまい将棋ソフトはほとんどないので、このへんは大同小異です。
例) 入玉のうまいソフト = 入玉時棋力アマ二段ぐらい , 入玉の下手なソフト = 入玉時棋力アマ三級ぐらい。
→ このあと入玉関係、少し改良してみました。(2014/3/12 4:00)


Q) 入玉将棋の何がそんなに難しいの?
A) ponanzaの山本君やBonanzaの保木さんを含め、開発者の見解としては「入玉は別のゲームになる」「指し将棋というゲームと入玉というゲームの2つのゲームを同時にこなすのは、いまのコンピューター将棋では無理」みたいなことで、私もそのへんは同様の認識です。何らかのブレイクスルーが必要でしょう。


Q) じゃあ事前貸し出しでの研究で入玉を一直線に狙われたらどうしようもないのでは。
A) 最初から入玉を狙うのは結構難しく、入玉将棋が弱いと言っても入玉するまでは頓死などが結構あるので、R3700相当の相手にやって100%成功するならそれはそれで凄いことだと思いますよ。


■ やねうら王新手と局後学習について


Q) やねうら王は序盤でプロも盲点になっていたような新手を発見したようですが、これはどういった類のものですか?
A) やねうら王では局後学習で32億局面調べていて、そのときに発見したようです。


Q) 32億局面とは凄い数ですが、どれくらいの価値があるの?
A) やねうら王は4コアPCで秒間300万局面程度読めます。しかし複数コアなので1コアで読むより効率が悪く、実際には150万局面相当だと思います。秒間32億/150万 = 2133.3秒ですので30分ほど考えた指し手と等しいということです。ただ、やねうら王の局後学習では、候補手を3つ考えさせるためにMultiPVというモードで思考させているので、実質的には15分〜20分程度の思考に相当するように思います。


Q) 1手15分程度であればたいしたことないね。
A) そうかも知れません。ただ、1手30秒で指すような対局において15分相当の時間考えてあるということは、30秒の30倍の時間を費やしているわけですから、おおよそ2の5乗、5×R150 = R750up相当の指し手になりますね。将棋倶楽部24でやねうら王の素の棋力がR3200付近にあるなら、局後学習させた手はR4000相当の指し手ということですね。捨てたものでもないと思いますよ。


Q) 激指などの検討モードを用いて、一つの局面で30分ぐらい考えさせると、そのように新手を見つける可能性があるということ?
A) 見つけるでしょうね。ただ、序盤の10手ぐらいでも相当の変化はありますから、新手を発見するまでにトータルで何千時間かかることか…。あと、新手を発見しても本当にそれが指し手かどうかという判断がアマチュアの将棋指しには難しいですね。


Q) やねうら王が局後学習で見つけた新手は他にある?
A) 新手ではないのですが、後手の初手6二銀を発見しました。これも面白い手ですね。かまいたちで有名なアマ強豪の鈴木英春さんが愛用されています。この手はかつて羽生さんも谷川さんとの対局において使われて、谷川さんは飛車先の歩の交換を保留し、後手が飛車先以外のどこかの筋の歩をついたときにその横歩まで取ってしまおうという構想が秀逸で、プロの間では駄目だろうという結論が出ていてプロの対局で登場することはほぼないと思うのですが、しかし、その「駄目さ」が、それほど大きな「駄目さ」ではないのでしょうね。


■ 一直線に斬り合いに来るのはコンピューター将棋の強さであり弱さである


Q) 飛車先の交換という言葉がでましたが、コンピューター将棋は飛車先の交換を軽視しやすくありませんか?
A) 飛車先を交換するのが5手一組で、この5手というのがいまのコンピューター将棋的にも比較的長い手数で、そして、その交換した一歩が生きるのはずっとずっと後なので、そこまで読みきれないというのはありますね。それよりは、もっと中央から動いて乱戦にしたほうが、評価値の変動が大きくなり、そっちの局面のほうがよさげに見えるというのはあります。


Q) 評価値の変動が大きくなると何故よさげに見えるのですか?
A) 評価値が一元的な尺度だからです。例えば、自分が歩3枚、相手が歩2枚もっている局面を考えてみます。(歩損はしていないとして) この局面、自分は歩を3枚持っていて自分からの攻撃手段も豊富ですが、相手にも2枚持たれているので相手からの反撃手段も相当怖いです。これに対して、自分が歩1枚、相手が歩0枚だとどうでしょうか。自分だけ攻撃手段があって、相手の反撃手段に乏しいことが期待されます。ということは、前者のほうが後者より「激しい」局面と言えます。このような「激しい」局面は出来ることなら回避したほうが、安全勝ちしやすいです。しかし、いまのコンピューター将棋には、あまり、そういう尺度で局面を捉えておらず、激しい局面のほうが評価値の変動が大きくなりやすく、そっちを選んでしまう傾向があります。


Q) それは手駒をたくさんもっていても、ある程度以上はあまり価値がないというような抑えこみをすれば良くありませんか?
A) 評価関数で手駒の価値を足し合わせるときにシグモイド関数にするなどやればそれらしいことは出来るように私も思うのですが、それを実際やっているのは習甦だけで、習甦も、それによって本当に強くなっているのかどうかは、客観的に判断できるデータがなくてよくわかりません。


Q) やねうらおさんから見て、いまのコンピューター将棋全般は強いと言えるのですか?弱いのですか?
A) 弱いと思っています。さきほどの評価値が一元的な尺度だからというのもあります。コンピューターは自分が勝てると思ったとき(いい評価値が終端の局面で見えたとき)は、一直線に踏み込んでくる傾向があります。私はこれが弱さの原因だと考えています。もっと安全勝ちを狙えばもっと勝率が上がるのに、と思います。


Q) 一直線に踏み込んでこれるのはコンピューターの強さではありませんか?
A) 強さであり同時に弱さでしょう。この一直線に踏み込んでくるという性質により、勝ったときは鬼神のごとき強さに見えるかも知れませんが、負けたときは、結局、読み負けているように見え、すごく弱く見えます。両方の側面がありますが、トータルでは弱いと私は考えます。


Q) やねうらおさん自身の棋力は?
A) 居飛車穴熊が流行ったころにその定跡ばかり研究して、将棋倶楽部24でR2000近くまでいきました。しかし、藤井システム以降、そう簡単ではなくなって勝てなくなり、数年ぶりにやると(将棋を忘れていることや、対策を知らないような戦法が流行っていることもあり)結局R1600ぐらいまで落ちまして凹みました。すっかりドロップアウト組です。


Q) R1600や2000程度の棋力ではコンピューターの指し手の良し悪しは判断できないのでは?
A) それがそうでもないのです。序盤で自分がこの指し手は悪いと思った指し手をコンピューターが指した場合、高い確率でそのあと本当に形勢が悪くなります。(評価値として実際にマイナスの値になっていきます) 私ですら序盤の形勢判断に関しては、コンピューターより優っている部分があるのですから、プロ棋士の先生ならば、こんなレベルではないと思いますよ。


■ 知性を持つコンピューターとしてのコンピューター将棋


Q) やねうら王に思い入れはありますか?他の開発者の方は、自分が開発したソフトは自分の息子に可愛いとおっしゃっていますが。
A) 私は「娘のように思っている」部分はあるにはあるのですが(他の悪いおじさんに嬲られていないかだとか心配だという意味で)、しかし、なるべくそういう思い入れを意識的に持たないようにしています。


Q) それは何故ですか?
A) 例えば1時間でできた改良と100時間かけた改良とがあるとしますね。変に思い入れや愛着があると、100時間かけたほうを大切にしようとしてしまいます。改良にかけた時間とその効果はそれほど相関関係があるものではありませんから、100時間かけようと駄目な改良は駄目な改良です。この部分を冷静に判断する力を保っておきたいので、なるべく意識して思い入れを持たないように心がけています。


Q) じゃあ、やねうら王をXXX万円で売ってください、みたいなことを言われたら売りますか?
A) その後の開発が出来なくなるのは嫌ですね。コンピューター将棋の開発は面白いですから。


Q) コンピューター将棋開発のどういった点が面白いですか?
A) 人工知能の分野の課題として、人間が当たり前にできることを機械にやらせるということがあります。二足歩行で歩くための制御だとか、画像を見せてそれが猫かどうか判定するだとか。こういう、人間が当たり前にできることこそ、機械にとってはとても難しく、難しいゆえに、これらが本当に自動化できるなら莫大なお金につながります。ところが、そういうのは、私はワクワクしないのです。人間が当たり前にできない、トップレベルの人間の頭脳を最大限に振り絞って初めて到達できるようなこと、例えばチェスのグランドマスターや将棋のプロ棋士なんかそうですね。そういう人類のトップ集団の知性を超える知的な振る舞いをするプログラムを作るってワクワクしませんか?


Q) コンピューター将棋は人間の知性には近づいたと思いますか?
A) 全然駄目ですね。今回の電王戦マシンでやねうら王は秒間400万局面ぐらいを読むのですが、人間はトッププロですら秒間50局面も読んでないですよね。これで仮に互角だとしても、400万と50が同等というのは、大幅に質において負けてますよね。その潤沢な計算力でかろうじて互角を保てているとしても。こういうのが知的な振る舞いだとは私は思わないです。コンピューター将棋はその計算力からすれば本来、もっとケタ違いに強くないとおかしいのです。


Q) やねうらおさんから見て人間は何がそんなに優れているのでしょうか?
A) ひとことで言うと「経験」です。しかし「経験」というととても陳腐に聞こえるので私はこの言葉を使いたくないのですが、例えば、コンピューター将棋はその与えられた局面からしか考えていません。しかし人間は違います。いままで経験した類似の局面を脳の引き出しから引っ張り出してきて、その局面で成功した手順、失敗した手順などを想起し、それが現在の局面に適用できるかどうかを考えます。コンピューターにはこれが出来ません。


Q) ほかには?
A) 羽生さんの自戦記によく出てくるのですが、羽生さんはタイトル戦では記録された棋譜をしはしば確認するんですよね。初手から現在の局面にいたるまでの手順を確認して、ここでこれだけの損をして、ここでこれだけの得をしているから、現在の局面はトータルではプラスのはずだ、みたいな確認をされているようです。現在の局面がトータルでプラスの局面であるなら、勝つための手順がどこかに存在すると仮定することが出来ますし、逆にマイナスの局面であれば、辛抱するための手順を探さなくてはなりません。こういう、一種のメタ思考、メタモニタリングのようなことがいまのコンピューター将棋にはできないですね。


Q) メタモニタリング?
A) 哲学者デカルトの「我思う故に我あり」みたいな、思考している自分さえもその思考の対象とするというような行為のことを指して私はそう呼んでいます。これ自体はプログラム次第で出来るのですが。


Q) できるんですか?
A) ちょっと専門的な話になってしまいますが、LISPという記号処理言語では、自身のプログラム自体もその操作の対象とすることが出来ます。プログラマー向けに言うと、LISPではプログラム自体もfirst class object(第一級オブジェクト(として操作対象となっている))なんですね。このように、メタ思考というのは何も人間特有のものではなく、プログラムであっても、いくつかの条件を満たしさえすればメタ思考できるわけです。コンピューター将棋も、例えば「詰み探索だけ別のPCでやらせる」みたいな手法がありますが、これもメタ思考に近い状態ですよね。


Q) 指し将棋と入玉将棋は別のゲームだとしたら、入玉将棋もメタ思考でなんとかなりませんか?
A) 入玉用の探索だけ別で考えるというのはアリだと思うのですが、入玉が成立しなかったときは結局評価関数を呼び出す必要がありますので(通常の評価で詰みの局面まで至らなければ終端局面で評価関数を呼び出さなければならないのと同じ)、いろいろ特有の問題がありますね。


■ 10年後は人間のほうが強い(かも知れない)


Q) やねうらおさんは、10年後にはコンピューター将棋が人間を凌駕しているとお考えですか?
A) コンピューター将棋の指す手筋を勉強することで人間はまだまだ強くなります。また、コンピューター将棋の序盤は10年やそこらでは、どうしようもならないでしょうから、10年後であっても人間側が序盤でリードを保つことは長い持ち時間であれば十分に可能でしょうね。


Q) もしかして菅井竜也五段のように10年後は人間のほうが強いとお考えですか?コンピューターチェスの世界はそうならなかったですよね?
A) コンピューターチェスがグランドマスターと初めて勝負したのは1988年だったと思いますが、あそこから10数年はCPUの年間の成長率が特に顕著で、コンピューターにとって特別な時期でした。それにくらべて近年はCPUのクロック率の上昇は極めて鈍化しており、PCの向上によるコンピューター将棋の棋力アップというのはほとんど望めません。そういう意味では、コンピューターチェスの歴史を、コンピューター将棋の歴史はなぞらない可能性が十分にあると思うのです。


Q) でもコンピューター将棋ソフトは年々改良され、強くなっていってますよね。
A) 年間R50〜100、伸びるか伸びないかぐらいですね。それも、もう伸び代はかなり使いきっていて、そろそろ新たなブレイクスルーなしでは限界に近い状況だと私は思います。今後10年間、ソフトの改良で線形にレーティングがあがっていくとはとても思えないですね。


Q) 10年後も人間はコンピューターと互角以上に戦えると?
A) その可能性も十分にあると思っています。10年後には子供のころからコンピューター将棋に学び、プロ棋士となる新しい世代によって、将棋界が変わるかも知れませんね。


■ 電王戦関連記事


「第3回将棋電王戦」【ソフト編】開催までに読んでおきたい電王戦ガイド- 人間が心血を注いだ努力の結晶
http://news.mynavi.jp/articles/2014/03/11/denou/

デンソー、「第3回将棋電王戦」にロボットアーム「電王手くん」を提供
http://news.mynavi.jp/news/2014/03/12/150/