PonaXの出来がひどすぎてamazonのレビューが大荒れの件


昨年の電王トーナメントで優勝したPonanzaがPonaXとして商品化された。定価13,824円と比較的高めの設定だったが、「高すぎやろw」という棚瀬さん(東大将棋の作者)のツッコミに対して「それだけの価値はありますよ」と自信満々の山本君(Ponanza作者)。



https://twitter.com/issei_y/status/453474099461758977


ところが、発売後、PonaXがあまりにも出来がひどいのでアマゾンでのレビューは将棋ソフトとしてかつてないほど荒れ放題となっている。
http://www.amazon.co.jp/exec/obidos/ASIN/B00JH47X2S/aaaaab0c-22/ref=nosim
※ PonaXがどうひどいのかについて、ここには書かない。具体的な内容はアマゾンのレビューを見ていただきたい。


ここでは長文になるのを避けて
・何故、作者が直接批判されるのか
・PonaXがどれくらい強いのか
の2つに絞って書く。


■ 何故、作者が直接批判されるのか


まず、PonaXが将棋ソフトとして機能面で不足している感は否めないが、バグまわりに関しては、修正パッチでなおるレベルだと私は思う。修正パッチがリリースされる前から大騒ぎするほどのことではないと私は思う。


あと、思考エンジン部以外は山本君が書いているわけではないのに、バグなどについてエンジンの作者(山本君)にtwitterで問い合わせるのはどうなのかという気はする。


こうなってしまった経緯を考えるに、販促用のPVで山本君が自ら「神の一手を体感せよ!」とか言っていたが、こういう販促のために作者(思考エンジン開発者)が前に出て宣伝をするような宣伝の仕方をするから、何かあったときに、それが作者由来の問題ではなくとも、すべて作者のほうにtwitterなどでクレームが来るなど、矢面に立たされるのではないかという気がする。


D


山本君は思考エンジンを提供しただけで、また思考エンジン側に不都合はないことは明らかなのに、このような批判のされかたは全くもって理不尽だと私は思う。


マスターアップ前に商品のクオリティを思考エンジンの作者としてチェックすべきだったなどという意見もあるが、この手の製作物ではスケジュール上、そういう機会が作者に与えられるとは限らないわけである。また、山本君は製品のクオリティコントロールをする立場ではないし(そのへんはディレクター/プロデューサーとかの仕事)、例えば、機能面で不足していることがわかっていたとしても、それをディレクターに進言できる立場でもなかったんだろうなぁと思う。


あと、電王トーナメント/電王戦以降、将棋ソフト開発者がプロ棋士と同系列に扱われることが多くなったが、将棋ソフト開発者なんてただのプログラマであって、本来テレビやメディアに露出することのほうがおかしいわけである。しかしソフト名だけを出して、将棋ソフトの開発者のほうにスポットライトを当てないのでは興業的に成り立たないためか、変に脚光を浴びるようになり、今回のPonaXの一件のように作者としてそれ相応のリスク(何かあったときの反動のきつさ)を背負うようになった。


芸能人やタレント業ならいざしらず、一介のプログラマがこのようなリスクを背負うのは何か状況的におかしいのではないかと思うのだが、いまさら嘆いたところでどうにもならない。


■ PonaXがどれくらい強いのか


PonaXをインストール後、将棋所からエンジン設定をすれば、将棋所で使えるらしい。


PonaX 非公式マニュアル
http://www.ne.jp/asahi/to/yuuhi/ponax_00.html


じゃあ、もう、PonaXの将棋所以下の糞みたいなGUIは要らないじゃんということで、「PonaX、最高です!値段は高いですが、それだけの価値はありますね!!」といきなりPonaX信者に豹変するのが私である。


知らない人のために言っておくが、PonaXは2013年の電王トーナメント版Ponanzaと同等である。つまり、駒落ちは確かにひどく、2枚落ちだとPonaXが穴熊に囲いやすく、これではアマ10級ぐらいでも勝ててしまうだろう。(ニコ生で今年の3月に芸人の小籔千豊さん(アマ1級)が、Ponanzaに2枚落ちで勝っている。) この意味においては、10年以上前に発売された東大将棋であれ、これよりはマシだという意味はある。


私は駒落ちなんかどうでもいいので話を先に進める。


まず、思考エンジンであるが、32bitモードで動作している。64bitモードではないので、おそらく64bit版にコンパイルされたPonanzaと比べると10%ぐらい遅いと思う。おまけにx86用しかなく、SSEも使ってないのではないかと思う。普通は、64bit版のバイナリやSSE2/4が使える環境用なども用意して、64bit環境ならば64bit版が起動するようにするのだが、「そんな小細工しなくともPonanzaは最強!」みたいなことなのか64bit版などは用意されていない。まあ、実際最強なんだからいいじゃん。


次に、置換表(ハッシュ)設定は、小さめ(512MBぐらい)にすること。32bitモードだからあまり大きくすると確保に失敗する。確保に失敗していても停止するわけではない。このとき、そこはかとなく弱くなっているのだが、それでもBonanzaよりは強いようだ。置換表が確保できていない(?)のにBonanzaより強いというのが驚異的で、ちょっとしたミラクルであるのだが。(もしかしてFPGAでコンピュータ将棋、評価関数さえ軽量化すればBonanza以上の強さのものが作れるんじゃまいか…。)


それからHT(HyperThreading)、これは有効にしておいたほうが良い。有効にしているとタスクマネージャーで見るとCPU負荷率は50%になるが、この状態で正常。すべてのコアはきちんと動いているし、将棋所上のレスポンスも良くなるので(HTの余っているスレッドがGUIを受け持つので)、お勧め。


電王トーナメントのときにやねうら王が秒読み時に9秒のところで指し手を送っているのにタイムアウトになっていて、これ何とかしないと…みたいな話を当時このブログに書いたが、あのあとaki.さんから「(別スレッドでタイマーを監視しているのであれば)HTをonにしているとそれは防げませんか?」と言われて、なるほどと思った。


ともかく、HTは有効にして、CPU負荷率50%。これが正常動作&お勧め設定。


さて、気になる勝率のほうであるが、Bonanza6にはほぼ負けなし。負けがなさすぎて、相当の試合数をやらないと正常なサンプルがとれない。100局しか試してないので具体的な数字を書くのは控える。もちろん勝率9割は優に超えている。


GPSfishに対しては勝率7割強。


いま開発版の最新のやねうら王は、先月の世界コンピュータ将棋選手権で優勝したAperyとやっても同等以上であると思うが(Aperyの3月度版には現バージョンは6割弱勝ち越し。Aperyは3月から5月の間でさほど改良はされてないと思う)、このやねうら王が勝率3割強。200局しかやっていないのであまり正確でもないと思うが、R150前後の差はあるのだろう。


この開発版のやねうら王は将棋倶楽部24で自作の5万円PC(CPU = Core i7 4771)にてR3200を突破し、おそらくはR3300〜3350はあると思われるソフトである。これよりまだR150強いのだから、5万円PCであれ将棋倶楽部24にてR3450〜R3500クラスであるのは確実。個人的には、これだけ見ても値段ぐらいの価値はあると思うが、「R3000もR3500も棋力がR2000にも満たない人には変わらないジャン」みたいな人にはこの価値はわかってもらえないのかも。


ともかく、PonaX、5万円PCでR3500という価値のわかる人は買えばいいと思うよ。


■ 2014/6/13 22:00 追記


マイナビ、PonaXの回収・返金を発表
http://i2chmeijin.blog.fc2.com/blog-entry-771.html


amazonマーケットプレイスでは一転してプレミア価格に!