やねうら王が将棋倶楽部24にきました


やねうら王が将棋倶楽部24に参戦中です。


USIプロトコル(コンピューター将棋の思考エンジンの標準的なプロトコル)対応の思考エンジンを将棋倶楽部24に対応させるブリッジを書きました。実質的に8時間ほどでオートパイロットの対応ができました。(詳しいことは書けませんが、ボンクラーズ将棋倶楽部24に来ていたときと違って、かなりやりやすくなっています。)


ちなみに将棋倶楽部24に、オートパイロットのテスト用のサーバーがあるわけではないのでぶっつけ本番です。バグって落ちたときはご容赦を。


・2014/3/10 0:00


いま、動作テストのため一手5秒でやっています。負けが込むようでしたら、思考時間を増やします。


スマフォからしか挑戦が出来ないのは、久米さんの意向っぽいです。PCからの挑戦を受け付けると、再開局の処理とかがあって大変だからという配慮なのかも知れません。(よく知りません)


・2014/3/10 0:20


やねうら王はR2800スタートです。ここから落ちたら格好悪いので自ずとプレッシャーがかかります。


ちなみに初手から定跡は使ってません。局後学習させた定跡のみです。もうコンピューター将棋はそろそろ初手から自分の力で切り拓くべきだという考えのもとにそうしてます。(まだ時代が2,3年早過ぎるかも…)


・2014/3/10 0:35


いま1手5秒設定のままR3009の人に勝てたようです。やねうら王は序盤が独自の定跡のために、あまり見慣れない形になります。(というか、たいてい序盤で悪くするのですが) いまの将棋も序盤早々に横歩を取られたのに、ごりごりやっているうちに逆転したようです。


開発者的には、もっと普通に指して欲しいんですけど、初手から定跡がないとまあこんなもんなんでしょうね。それにしてもR3000台の人とやって勝てているのが凄いですね。


ちなみに、やねうら王はレーティング対局室に移動したあと誰の挑戦でも受ける設定になっています。(早指し設定での平手挑戦であれば)


・2014/3/10 1:05


穴熊でR2968の人に負けました。(たぶん) さすがに1手5秒きついようですね。次から1手8秒に変更してみます。ちなみにponder(相手の手番で考える)は使っていません。(実装が大変そうだったので…) そして、投了の処理まわりがバグっていたので落ちました><
追記 → 間違えて、1手8秒+秒読み8秒の設定にしてたので16秒考えてました。うわー…。


あと、やねうら王、思考中の評価値が出たほうがいいという声が強いので、いまから対応します。10分ほどお待ちを..。


それからやねうら王は中断再開待ちに対応していません。(中断局スタートには対応しているはずなのですが…) 途中でやねうら王が落ちたような場合にはなんであれ判定勝ちにしてもらって構いません。ご迷惑おかけします。


・2014/3/10 1:30


評価値表示に対応させたのですが、対局中は全体チャットにはならないので対局相手にだけ見えるチャットになるようです。全体チャットのAPIはないようなので、これは駄目ですね…。他の仕組みを何か考えます。


・2014/3/10 1:40


1手8 16秒設定でもR2900は超えそうな感じです。思考時間を倍にするとR150ぐらいあがるのでR3200にギリギリ到達可能なのかなと思います。人間側は相手番で考えることが出来る&将棋倶楽部24でR3000付近の人は数少ないので、そう単純な話でもないですが。


・2014/3/10 1:50


人間側が手待ちして千日手っぽい局面に。この手の局面は打開するのにかなり先まで読まないといけないので8 16秒では打開不可能かと思っていたところ、やねうら王が無理やり打開。そして凄い損を…。おまけに人間側、そのまま入玉狙い。いきなりアンチコンピューター戦略で来る人がいるとは思いませんでした。将棋倶楽部24は一昔前とは全然事情が異なるようですね。


入玉対策は一朝一夕に出来るものでもないので、開発者的には大変です。やねうら王は入玉対策はほとんどやってないです。


ちなみにfloodgateでも入玉が比較的上手い組と下手な組と分かれていて、入玉対策を真面目にやらないと数局に1局ぐらい入玉絡みの将棋で負けてしまい勝率がぐんと落ちます。


・2014/3/10 2:15


今日の対戦はここまで。一晩また局後学習させておきます。
対戦していただいた皆様、観戦いただきました皆様、本当にありがとうございました。


明日も22時ごろから参加します。明日、また続きをここに書きます。


明日は評価値のリアルタイム更新がやねうら王公式サイトのほうから確認できるようになってると思います。


Dropboxのpublicフォルダに評価値と読み筋を書いたhtmlファイルを突っ込んで、それを上記サイトのiframeのなかで表示しているだけという驚くべき手抜き実装です。


・2014/3/10 9:00 去年とは周囲の反応が違うという話


去年ponanzaが将棋倶楽部24に来たときは席主である久米さん公認でやっているのに、チャットでは「ソフト使って将棋倶楽部24で指していいの?久米さんに通報しなきゃ!」みたいなことを言い出す人が多かったので、やねうら王もそういうことを言われるんだろうなぁと思って覚悟して臨んだのですが、蓋を開けてみればそんなことはなく、「待ってました!」と多くの人に声をかけていただけたことは、開発者冥利に尽きると思います。


電王戦のおかげで、コンピューター将棋開発者にスポットが当たるようになりました。時代は着実に移り変わろうとしています。


・2014/3/10 21:00


設定間違えて1秒指しのままやってました。この対局終わったら修正します。
→ 1手15秒に修正しました。1手1秒のままR3000ぐらいの人に2局勝っていた模様…。

将棋倶楽部24では高段の人(でかつスマフォユーザー)は限られているため、同じ人との連戦になりやすく、そういう意味では、局後学習がかなり有効であるようです。(相手は同じオープニングをやってくる可能性が高いため)


・2014/3/10 21:35 R2914


昨日、相穴熊で負けた人との対戦。やねうら王は勝ちを拾って現在R2914。やねうら王は、私が思っていたより強いのかも知れません。


・2014/3/10 22:30 R2932


なんかnps(探索速度)が出ないなーと思って調べていたら思考エンジンと通信するスレッドの負荷率が100%になってました。実質3コアで頑張っていたようですね。この対局終わったら修正します。ついでに評価値の表示まわりも少し調整します。
→ 修正する予定が速攻で次の対局に突入してました。これ以上挑戦を受けない的な、停止予約の機能が要りますね…。
[22:45] 諸々修正しますので、この対局終了後、2,3分ほどお待ちを..。
[23:00] →修正しました。


・2014/3/10 23:03 R2944


人間側、入玉作戦を採る模様。R2937の人なのでこれは成功するのではないですかね…。まったく、将棋倶楽部24はハラハラしますね。


・2014/3/11 0:40 R2985


棒銀でやられました。いまのコンピューター将棋、レグスペとかでよくやられるんですよね…。最後は超熱戦でした。しばらく毎日21時ごろから将棋倶楽部24に参戦するようにします。



遠山先生といつもん先生からはやねうら王の独自定跡(!?)について、お褒めの言葉を頂戴しております。ありがとうございます。

https://twitter.com/funnytoyama/status/443014123098370048

https://twitter.com/itumon/status/443041355602739200


・2014/3/12 0:30 やねうら王R3000突破


やねうら王、将棋俱楽部24のレーティングが3000突破(2ch名人)
http://i2chmeijin.blog.fc2.com/blog-entry-364.html


かろうじて突破しましたが、入玉対策しないと同じ将棋で負け続けることはありえそうです。実に頭の痛い問題です。あと、R400以上離れている場合、挑戦を受けないように変更します。もう少し動作が安定してきたら、もう少し長い時間参戦させて、夜の21:00-24:00以外はこの制限なしに挑戦できるようにしようかとも思っています。


・2014/3/12 4:00 入玉対策


さきほどの将棋で入玉があまりにもひどかったので、ちょっと修正しました。今日の対局をお楽しみに!


人間の高段者の方と対戦する機会に恵まれるのは、ありがたいですね。普段はコンピューター将棋同士を対戦させているので気づかないような欠点が見つかって、開発者としては嬉しい限りです。(そして観戦しているときにすごく心臓に悪いです。)


あと、入玉判定のとき、将棋倶楽部24では本来は「中断」→「引き分け提案」みたいな手順を踏むようなのですが、サーバー側での判定勝ちみたいな処理がないようですので、やねうら王が27/28点法の入玉宣言勝ちの条件を満たしたとき*1に引き分け提案のメッセージを強制的に送るようになっています。(まだこの状態になったことがないので、この処理が正しく書けているかどうかはわかりません。)


入玉されて負けだと思ったら、適当なところで投了していただければと思います。256手を超したところで無条件に引き分け提案を送るほうがいいかは検討中です。


・2014/3/13 2:00 中断局の自動再開を実装


公式サイトで表示されている読み筋で、局後学習DBに登録されていたときは「定跡の指し手」と表示されるように変更しました。


対局中に相手が落ちたときにやねうら王が自動的に待合室に移動して、5分間再開待ちを行うコードを追加しました。このへん、テスト用のサーバーもないので、ぶっつけ本番ですが、たぶん動くかと思います。


一度でも負けた対戦相手とやるときは、思考時間29秒まで考えるようにしました。
いまのところ対戦相手に負けたかどうかの管理は手動ですが、気が向いたら自動化します。
(スマフォの高段は特定のユーザーしかいないようで…)


対局中の将棋盤面を公式サイトの画面下部に表示するようにしました。これまた実テストできていないのですが、たぶん動くかと思います。


・2014/3/25 20:45 やねうら王R3100突破


知らない間にR3112になってました。スマフォユーザーとしか対戦できないので相手が偏っているので本当のレーティングはよくわかりません…。


・2014/3/26 21:00 再開待ちの修正しました。


相手側ダウンのときの再開待ちの処理がおかしいときがあったので修正しました。
現在R3131です。同じぐらいの相手が少ないのでRが上がりにくいですが、おそらく最終的にはR3200〜R3300ぐらいに落ち着くのではないかと言われています。入玉絡みで負けることが多いのでその改良は4月になったらやろうかと思います。
あと、ponder(相手番で考える)をするように修正することでR50ぐらいの伸び代があるはずなので、もう少し頑張れば、5万円PCでもR3300はギリギリ到達可能なのかも知れません。