Qhapaq2018 vs dolphin - 将棋のブログ

Qhapaq2018 vs dolphin

8 Comments
「将棋神やねうら王」に入っている5つのプログラムの中では最強されている「Qhapaq2018」と、現在最強プログラムと言われている「dolphin1/orqha」を手動で対局させてみました。


下がその対戦結果。(※AVX2命令対応CPU使用)
dolphin対Qhapaq 勝敗表

■設定など
Qhapaq2018 →初期設定のまま、1手10秒(NPS →約250万~360万)
dolphin1/orqha →スレッド数「8」、他は初期設定のまま、1手10秒(NPS →約400万)

▲dolphin△Qhapaq2018 → dolphinの6勝2敗
▲Qhapaq2018△dolphin → 4勝4敗1分

dolphinの10勝6敗1分

千日手はどう処理してよいのかわからないので、手番を入れ替えずにやり直しとしました。

どうでもいいことですが、dolphinの方は手番の時に思考時間が5秒くらいを経過するとPCがグオングオン唸ってました。(PCがぶち壊れはしないかと恐ろしかった)

この結果を見てどう思うかは人それぞれだと思いますが、市販のソフトが、ネット上に出回っている開発用の最強プログラムと100点しか差がないというのは、すごいと思いました。

昔から、市販ソフトは開発用に比べると弱いというのは常識で、その常識を打ち破るものではありませんが、昨今のコンピュータ将棋は年に400点近くを強くなっている状況で、そんな中で開発用の最強と100点しか差がないというのは単純にすごいことだと思います。


■dolphinとは?

そもそも「dolphin」とはなんだ?という人も多いでしょう。

現時点で、日本の開発者が作った将棋ソフトの中では最強の噂が絶えないプログラムです。

まだ、世界コンピュータ将棋選手権に登場していませんので、「優勝ソフト」とか、そういうハクは付いてません。

昨年の7月頃から話題になっていて、最近の最強ソフトの類例にもれず、やねうらチルドレンのようです。(プログラム名がYaneuraOu 2018T.N.K(dolphin)と表示される)





※棋譜を見るにはFlashが動作する環境が必要です。


■AlphaZeroについて思うこと

ところで、最強ソフトは「AlphaZero」では?という人も少なくないでしょう。

しかしそのソフト、全く得体が知れません。本当に強いのかどうかを確認しようがないのです。

棋譜は論文発表後、1年も経ってから出てきましたが、人間よりも遥かに強い者同士の棋譜を見て、その強さの程度を判別することはとても難しいこと。

例えば、アマ有段者が自分よりも1000点以上強いトッププロの棋譜を見た時、自分よりも強いことは理解できるはずですが、自分よりもどのくらい強いのかを正確に把握することができるでしょうか?

AlphaZeroは、モンスターマシンを使えばそれなりに強く、1台の一般的なPCで動かすと大したことないのではの声も出ているようです。

情報量が少なすぎて、何が正しくて、何が正しくないのかを確認しようがないのです。

「AlphaZero」は「碁」でその優秀性を示しているので、将棋に関する情報も全くのデタラメとは思いません。しかし、その強さを知るための情報があまりにも不足しているのです。


■驚かされた中飛車の考え方
「Qhapaq2018」vs「dolphin1/orqha」で、驚きの対局がありました。

その前に、「将棋神やねうら王」に入っているプログラムは、初期設定が全て「標準定跡」になっていて、これが振り飛車を選ぶようになっています。

初手から10手かせいぜい10数手くらいなのですが、とにかく半分弱くらいの確率で振り飛車を選ぶようになっています。

さて、驚きの対局ですが、最初は初手▲78飛からのノーマル三間飛車で始まりました。

そのうち中飛車に振り直すと、なんと78金と上がり、ツノ銀中飛車に!

Qhapaqの78金

もともと、やねうらシリーズはそのツノ銀の形を好んではいるのですが(現在の雁木ブームの発端がそこ)、それにしても大内流の78金が最強コンピュータの最善だなんて、嬉しかった・・。


そして、後手のdolphinも先手の大内流のツノ銀を見て、持久戦に構えているのがさらにすごい!(15年以上前、将棋倶楽部24では、ツノ銀中飛車を見ると誰もかれもが一目散に穴熊に囲っていた)

dolphinの持久戦模様

しかも!今度は大内流に構えたQhapaqの方が、銀冠に組み替えているではないですか!

Qhapaqの銀冠

なんと、プロ棋士の中飛車に対する考え方と、コンピュータの中飛車における最善手が、一致していました。たまげました。そして感動しました。



ところで、やねうら王の大規模アップデートはどうなったのでしょう?


関連記事

Comments 8

There are no comments yet.
棋譜解析オタク  
コンピュータ将棋レーティング

コンピュータ将棋レーティングはこちらをご参考に。
https: //www.qhapaq.org/shogi/

まだ先の表には反映されていませんが、先日 dolphin1/NNUEkaiX がリリースされ、これまでトップだった dolphin1/NNUEkai7のR4351を抜いて、レーティングは4381とのことです。
https: //twitter.com/Rota_JP/status/1094370822339194881

2019/02/12 (Tue) 23:19 | EDIT | REPLY |   
棋譜解析オタク  
No title

先のURLはhttps: のあとの半角スペースを削除してください。

蛇足ですが、ソフトの対戦をさせて優劣を決めるには、最低でも100局くらい対戦させることが必要かと思います。

2019/02/12 (Tue) 23:22 | EDIT | REPLY |   
阪田大吉
阪田  
Re:

手動で1局30~40分掛かるものを100局。

100局やれば、100局では少ないという声が出てきそうです。

そもそも、動かす環境によって、結果は変わってきますね。

だから、大まかで良いと思っています。

ところで、おっしゃられるサイトの資料とズレはありましたか?

2019/02/13 (Wed) 01:46 | EDIT | REPLY |   
棋譜解析オタク  
Re:

私はShogiGUIというソフトを使用、対戦条件は持ち時間0、秒読み2秒、256手で引き分け、先後入れ替えです。1局はだいたい2~3分で終わりますので、基本的に100局の対戦です。
CPUの性能が高くないので、この条件での対戦中のノード数は100万前後、ピークでも200万強といった低ノードでの対戦です。

レーティング計算はできませんので、総当たりの勝率で順位だけをつけていましたが、レーティング4200以上はサイトの順位に一致、レーティング4000~4200のものでは、YO4.82/Apery_WCSC28 R4178よりもYO4.82/elmo_WCSC28 R4138の方が強いと出ただけでほぼ一致していました。

今のメインの使用目的はソフトの対戦ではなく棋譜解析ですので、常に最強のエンジンを使用し、新しいエンジンがリリースされるとそれと対戦させ、強い方を採用するということにしています。
おおざっぱな評価値の推移グラフをつくる際には1手5秒で、1手を詳細に検討する場合は時間を30秒(ノード数にして約5000万)とか、ノード数指定(1億)で検討しています。

2019/02/13 (Wed) 02:43 | EDIT | REPLY |   
棋譜解析オタク  
Re:Re:

ご存知かと思いますが、やねうら王さんのツイートです

https: //twitter.com/yaneuraou/status/1089046869349609472

2019/02/13 (Wed) 02:51 | EDIT | REPLY |   
ryousuke  

棋譜解析オタク様のコメント、個人的には大変興味深く読ませて頂きました
AlphaZeroの(論文時点での)強さはelmoとの対戦結果からレーティング上の推定ができますが、
それも本年中には超えていくAIの世界の将棋に驚嘆の思いしかありません

2019/02/13 (Wed) 17:29 | EDIT | REPLY |   
棋譜解析オタク  
No title

私には将棋ソフトの解析なしで将棋を語る棋力はありませんので、こちらのサイトの棋戦の感想は大変勉強になり、ときどきツイッターの方で紹介させていただいています。
今後も感想の記事を楽しみにしておりますので、よろしくお願いします。

2019/02/13 (Wed) 21:44 | EDIT | REPLY |   
名無し名人  
dolphinの別候補

【YaneuraOu 2018T.N.K(dolphin)】=【dolphin/illqha1.1】

2019/02/24 (Sun) 10:12 | EDIT | REPLY |   

コメントを書く