タグ

ブックマーク / yaneuraou.yaneu.com (18)

  • WCSC34、技術的まとめ | やねうら王 公式サイト

    去る5月3日~5日に開催された第34回世界コンピュータ将棋選手権(以下WCSC34と略す)について、私の視点で書きたいことをいくつか書いておきたい。 今回、優勝したのは「お前、CSA会員にならねーか?」(以下、たぬきと記す)である。この作者は、たぬきシリーズの作者の野田さん(nodchip)だ。 関連記事 : その名は「お前、CSA会員にならねーか?」2024年・世界コンピュータ将棋選手権、チャンピオン決定!(Yahooニュース) : https://news.yahoo.co.jp/expert/articles/3490be9ce374b0afe114ca3d6e5a422d0db85923 今回のたぬきは、Deep Learning型の将棋AIではなく、従来型(NNUE系と言われている)の将棋AIである。 nnue-pytorchについて 今年に入ってから、NNUE系はいくつかの大き

    Nyoho
    Nyoho 2024/05/07
  • 角換りは終わったのかについて1万文字程度で | やねうら王 公式サイト

    先月のゴールデンウィークに行われた第33回世界コンピュータ将棋選手権(WCSC33)で弊やねうら王チームが準優勝したあと(この準優勝は当に準優勝であって、ビールにおつまみで乾杯するという意味ではない)、角換りという戦型について以下のツイートをした。 角交換と言う戦型が終わった。 1886局面の指し手を覚えるだけで先手側は公開されてる水匠(探索局面数は1億までの任意)に対して評価値+300に出来ることが証明された。 大会で上位のソフトは+300から逆転は97%ぐらいありえないので(手数で引分はある)つまりは将棋AIの世界では角交換の後手は必敗。 — やねうら王 (@yaneuraou) May 8, 2023 この前者のツイートにはインプレッションが172万もあり、Yahooニュースや朝日新聞デジタルなど多くのメディアで取り上げられた。 AIで角換わりが終わった? 藤井聡太竜王「こちらの立

    Nyoho
    Nyoho 2023/06/03
  • クラウド最安のGPUについて | やねうら王 公式サイト

    渡辺名人が購入した130万円のパソコン、クラウドでそれと同じ性能のもの、1時間50円で使えるよとツイートしたらえらくバズった。 上のツイートは、決して渡辺名人の研究を揶揄するものではなく、書き方次第で最低にも最高にも聞こえるという、そういう物事の二面性みたいなのって面白いよねという意味でツイートしたわけである。 しかし「クラウドの料金そんなに安くねーだろ」「それってGPUだけの値段ですよね?」「値段一桁間違えてない?」「クラウド使ったことない奴の妄想乙」みたいなツッコミをたくさん頂戴している。

    Nyoho
    Nyoho 2022/08/31
    https://vast.ai/ Rent GPUs on Vast.ai 「ご覧の通り、3090は$0.40/hrは割っている。2022年7月1日現在の相場は$0.30~$0.35/hr程度のようである。」
  • 誰もdlshogiには敵わなくなって将棋AIの世界が終わってしまった件 | やねうら王 公式サイト

    いま大会上位に位置するDeep Learning系の将棋AIは、評価関数として画像認識などでよく使われているResNetを用いている。ResNetについては機械学習を齧っている人ならば誰でも知ってるぐらい有名だと思うので、詳しい説明は割愛する。(ググれば詳しい説明がいくらでも出てくる) 囲碁AIの世界では、このResNetのブロック数を大きくしていくのが一つの潮流としてある。ブロック数が多いと言うことは、より層の数が増え(よりdeepになり)、1局面の評価に、より時間を要するようになるということである。それと引き換えに評価精度がアップするから、トータルでは得をしていて、棋力が向上するというわけである。 ところが大きいブロック数になればなるほど学習に要する教師局面の数が増える。学習もブロック数に応じた時間を要するようになるから、そう簡単に大きくはできない。しかし囲碁AIの方は、中国テンセント

  • 何故、将棋の機械学習で天国と地獄メソッドが必要なのか? | やねうら王 公式サイト

    今回、私はWCSC31ではみざうら王チームとして参加する。やねうら王に、水匠開発者のたややんさん、やねうら王のメンテナーのMizar(ミザー)さんが加わった形なので、水匠の「水」とMizarさんの「ざー」から、「みざうら王」という名前になった。 みざうら王チームでは、天国と地獄メソッドを使って学習させている。 // みざうら王 with お多福ラボ PR 文書(draft) : https://www.apply.computer-shogi.org/wcsc31/appeal/YaneuraOu/mizaura_PR_draft.pdf 早い話、これはABテストに他ならない。私の手元にRTX 3090のPCが3台あるので、2台でABテストを行い、3台目のPCで強くなったかの計測を行っている。 3台目のPCにはJenkinsがインストールされていて、Jenkins上で自己対局のJobを管理

  • 第31回世界コンピュータ将棋選手権は前年の優勝ソフトに9割勝つソフトがスタートライン | やねうら王 公式サイト

    来る5月のゴールデンウィークに第31回世界コンピュータ将棋選手権が開催されます。COVID-19の感染拡大状況を考慮し、オンライン開催であることが決定しています。 // WCSC31 : http://www2.computer-shogi.org/wcsc31/ さて、今年は前年に比べてどれくらい強くなっているのでしょうか? 昨年の大会は開催されず、代わりにオンラインで親善試合のようなものが開催され、その優勝ソフトは水匠でした。 // WCSC30 : http://www2.computer-shogi.org/wcsc30/ そして同年の11月には第一回電竜戦というオンライン大会が開催され、GCTという将棋ソフトが優勝しました。 // 電竜戦 : https://denryu-sen.jp/ GCTは、Deep Learningを採用した将棋ソフトであるdlshogiを思考エンジンと

    Nyoho
    Nyoho 2021/03/31
  • 俺氏、将棋が二人零和有限確定完全情報ゲームでないことに気づいてしまうwww | やねうら王 公式サイト

    このブログをご覧の方は将棋が二人零和有限確定完全情報ゲームであることはご存知でしょう。これは、ゲーム理論や探索アルゴリズムの教科書にでも載っています。「二人零和有限確定完全情報ゲームって何?」って方は、Wikipediaでも見ていただくことにして話を先に進めます。 零和とは? この「零和」というのは、和が零。英語で言うとゼロサムです。 零和(「ゼロ和」と読むのが一般的だが「レイワ」とも読む):プレイヤー間の利害が完全に対立し、一方のプレイヤーが利得を得ると、それと同量の損害が他方のプレイヤーに降りかかる https://ja.wikipedia.org/wiki/二人零和有限確定完全情報ゲーム つまり、自分が勝ちなら、相手は負け。相手が勝ちなら自分は負け。勝ちを+1点、負けを-1点、引き分けを0のように定めるなら、(ゲーム終局後に)自分と相手の点数を足すと0になる。なので、ゼロサムゲーム

    Nyoho
    Nyoho 2021/02/20
    千日手の扱いはややこしいんだなあ
  • 渡辺明名人と東大教授で日本の脳研究の第一人者である池谷裕二先生との対談記事が間違いだらけである件 | やねうら王 公式サイト

    ここまでひどい記事は久しぶりだ。 渡辺明名人の疑問「将棋の初手でこれを指したら負けという“必敗”の手はありませんか?」 脳研究者の答えは… https://number.bunshun.jp/articles/-/846635 この手の対談は、編集側が元の発言とは異なる意図で解釈して、誤った書き方にしてしまうことが多々あるので、誰が悪いのかということはここでは問題としないことにする。ただ、内容が間違いだらけではあるので、ここではそれを指摘するに留める。 14年前のAIは「奨励会1級とか初段ぐらいだった」 池谷 渡辺さんのすごいところは、転換期を迎えた時に「じゃあAIに学んでみるのも面白いかもしれない」と思ったことですね。柔軟な適応力で発想の着火点をスムーズに転換されています。渡辺さんはかなり早い時期からAIと対戦されていましたよね? 渡辺 あれは2007年ぐらいでしたが、まだAIが全然強く

    Nyoho
    Nyoho 2021/01/19
  • 2020年、将棋ソフト界隈のまとめ | やねうら王 公式サイト

    年末なので、2020年の将棋ソフト界隈のことを自分目線でまとめておきたい。自分目線なので全然まとめになってないとは思うけども、その点は御容赦願いたい。 今年は、コロナ禍のために毎年5月のゴールデンウィークに開催されていたWCSC(世界コンピュータ将棋選手権)が開催されなかった。 WCSCは、その代わりに「世界コンピュータ将棋オンライン大会」となり、オンラインで開催され、たややんさんの『水匠』が優勝した。 私(やねうら王チーム)は、このオンライン大会には参加しなかった。賞金もでないことだし(この時点でやる気9割ぐらいダウン)、単純に面倒くさかったからである。 将棋ソフトは何のために作っているのか?とよく尋ねられるのだけど、私の場合、それ自体が楽しいからであって、盆栽いじりにも似たものがあると思う。これは、Aperyの平岡さんも全く同じことを言っている。 最近ちょくちょくapery_rust

    Nyoho
    Nyoho 2021/01/01
  • Deep Learning将棋は従来の将棋ソフトとここが違うぞ | やねうら王 公式サイト

    ふかうら王の製作のためにdlshogiのソースコードをくまなく読んだので、Deep Learning型の将棋についてつらつらと書いてみる。 dlshogiとは dlshogiは先月に開催された将棋ソフトの大会「電竜戦」で優勝したGCTのエンジン部分(探索部)でもある。つまりは、dlshogiは現在、世界最強の将棋ソフトと言っても過言ではないだろう。従来の将棋ソフトとはどこが異なるのだろうか。今後、Deep Learning系の将棋ソフトの導入を検討している人向けにざっと書いていく。 ※ 今回書くのは、現在のdlshogiの話である。将来的に改良される可能性は大いにあるが、2020年の電竜戦では、この仕様であったということである。 CPUを使うソフトとGPUを使うソフト、どちらがコスパがいいの? 今回、電竜戦で優勝したGCTをGeForce RTX 2080で動かすとfloodgateでR3

  • 【連載】評価関数を作ってみよう!その1 | やねうら王 公式サイト

    将棋AIと言えば、探索と評価関数で構成されています。探索と評価関数が車輪の両輪のようなもので、その2つがうまく合わさって初めて強い将棋AIが完成します。 ところが、やねうら王系の最新の評価関数であるNNUEは浅い層からなるニューラルネットを採用しているので、新たに将棋ソフトを作ろうと始めた人がいきなりNNUEの実装をやろうとすると普通、挫折します。 そもそも評価関数が完成してもパラメーターが多すぎるので機械学習によってチューニングせねばなりません。機械学習を行うには、教師データが必要で、将棋AIの場合、自己対局により教師データを生成してそれを用いるのですが、そのためには大量の計算資源が必要になります。あと強化学習をするためのコードを書かないといけません。機械学習の理論を学ばなければなりません。 そのように、ちょっと中高校生ぐらいの人がご家庭のPC趣味将棋ソフトを作ろうと思った時に、いき

    Nyoho
    Nyoho 2020/11/25
  • WCSC29、やねうら王優勝しました! | やねうら王 公式サイト

    第29回世界コンピュータ将棋選手権(WCSC29)で、『やねうら王 with お多福ラボ2019』は優勝しました。応援してくださった皆様、ありがとうございます。 手短にいくつか印象に残った試合と簡単な感想を書いておきます。 Qhapaq戦 Qhapaqはこちらが指し手を思考している最中に相手の指し手を別のPCで予測して、それに対するponderの指し手を探索する『Pre-ponder』という隠し球を実装しているそうでした。 QDMのクラスタはmultiponderベースだったのですが独自実装のpreponderを加えることで相手の持ち時間の120%を使えるという謎の効率化に成功しました。 — Ryoto_Sawada☀Qhapaq (@Qhapaq_49) May 5, 2019 そこで、Qhapaq戦については、SlowMover(序盤重視率)=67にして、序盤の思考時間を減らして終盤に

    Nyoho
    Nyoho 2019/05/06
    狙って白ビールにこと48さんのKristallweizenに千日手をしかけて勝つという、まさに勝負師でしたね。おめでとうございます㊗️
  • 最新の将棋ソフトが2手目34歩を悪手だと言い始めた件 | やねうら王 公式サイト

    近年の将棋ソフトは2倍の思考時間を使えばR200程度強くなる。ということは、家庭用PCで15分切れ負けの対局でR4300程度だと言われている最新ソフトを自己対局させるとして、片方のソフトだけ持ち時間をその倍である30分を与えるとどうなるだろう? そのソフトは、見かけ上、R4300 + R200 = R4500ぐらいの強さを発揮するわけであるな。 では、もっと桁違いの時間を与えるとどうだろう? 15分切れ負けのとき、序盤の1手には10秒ぐらいしか使わないが、その序盤の特定の局面に対して、1,000倍の時間(10,000秒)を与えれば、そのときの棋力はどれだけになるだろう? log(2)1024 = 10なので、10×R200 = +R2000ぐらい強くなり、R4300 + R2000 = R6300のソフト相当になるのではなかろうか。 R6300のインパクトが強すぎてどれくらいの強さなのか想

    Nyoho
    Nyoho 2019/04/16
  • 【決定版】コンピュータ将棋のHASHの概念について詳しく | やねうら王 公式サイト

    いまどきの将棋ソフトを使っていると、「HASH 50%」などと表示されている。これはHASH利用率と呼ばれる。この数字が大きくなってくると探索の効率が悪くなる。要するに潤沢にメモリがある場合に比べると弱くなる。これは、どれくらいの値までであるなら適切なのか?HASH利用率が99%にならない限りHASHには余裕があるものなのか?HASHはどういう仕組みになっているのか?HASH利用率が50%の状況で、ハッシュ衝突はしているのか?など、わりとソフトを長年使っていても知らない人が多いのでここに原理から詳しく説明した決定版的な記事を書く。 ShogiGUI将棋神やねうら王に表示されている「HASH」とは何ですか? 一度探索した局面を保存しておく表です。 この表に登録するときにハッシュ(hash)という値を使って登録するため、ハッシュテーブル(hash table)と呼ばれます。これを略して(値と

  • さくらインターネットの機械学習ナイトで発表してきました | やねうら王 公式サイト

    私のほう、発表資料の準備があまり出来てなくて、そして、こういう発表に不慣れで聞きづらかったと思う。聞きに来てくれた人たちには申し訳ない。 私としては、もっと経験を積みたいので、今後もこういう機会を大切にしていきたい。今回、会場を提供してくださった、さくらインターネット様、そして、発表の機会を与えてくれた有山さんに感謝いたします。 あと、おまけとして、以下に発表内容の一部を文章として丁寧に書き残しておく。(注 : 発表予定になかったことをその場の思いつきで延々と話したので、当日はこんなにうまくしゃべれてませんでした。) >>> 書き起こしここから やね「DeepMindがAlphaZeroと囲碁と将棋、チェスの3つのソフトを作ったよ、という論文を発表しました。3日前のことです。ご存知の方、挙手願いします。」 (場内の7割ぐらいの人が挙手) やね「DeepMindはAlphaGoという囲碁ソフ

    Nyoho
    Nyoho 2017/12/10
    48さん出てきた
  • 近年のコンピュータ将棋の急速な伸びの理由は? | やねうら王 公式サイト

    表題の件を当事者視点で。 「近年のコンピュータ将棋の急速な伸びの理由は?」という問いの模範解答が分からない。(1年で200ほど伸びるようになった理由。) そこそこ聞かれる質問なので、答えを用意しておきたいのだが・・・ — Shota Chida (@mizumon_) July 14, 2016 理由をたったひとつ挙げるとしたら、2016年時点での最新の回答は「誰でも機械学習が出来るようになった」ではないかと思います。 従来、将棋ソフトの機械学習というのはBonanzaメソッド(通称ボナメソ)一択でした。激指はオンライン学習風の何かをやっていたのですけど、Bonanzaの3駒関係ほどパラメーターの数が多いと(数百万パラメーター)、オンライン学習ではうまくいかないと信じられていたので、誰もやっていませんでした。 ボナメソについて書かれた保木さんの論文自体、当時の将棋ソフト開発者には難解で(見

    Nyoho
    Nyoho 2016/12/15
  • コンピューター将棋による次の一手問題集 | やねうら王 公式サイト

    コンピューター将棋同士で自己対戦させていると長手数の勝ち手順や鮮やかな寄せが見られることがあります。 「捨て駒連発」とか「そっぽに行く手」とか「それ以外では悪くなる」とか、何らかの尺度でもって、そういう指し手を自動的に抽出することは可能だと思います。詰将棋の自動生成(人間的に見て、意味のある詰将棋)なんかは、昔から色々研究がありますね。まあ、人間的に見て美しい詰将棋の自動生成というのはなかなか難しいようで研究は停滞気味のようですが、このへんは「美しい」というのを機械学習か何かで学習させればある程度打破できるように思います。 また、詰将棋の自動生成のうち、特に研究が進んでいるのは裸玉で、これは盤上に駒が存在しないので無駄な駒はないという意味で人間的に見ても大変美しいものです。 裸玉全検の可能性については「詰将棋おもちゃ箱」のTETSUさんが取り組んでおられます。私もdf-pnルーチンを書いた

    Nyoho
    Nyoho 2015/10/31
  • トップコーダーはいまこそ将棋ソフトの開発に参加すべき | やねうら王 公式サイト

    最強最速アルゴリズマー養成講座 プログラミングコンテストTopCoder攻略ガイドの著者として名高い高橋 直大さんがコンピューター将棋の開発に興味を持っておられるようです。 コンピュータ将棋選手権に今から出ない理由は単純に勝てないからです>< ワンアイデアでぽんと勝てる時代じゃないし、これまでの研究調べて追従してそこでやっとスタートラインだと思うのだけど、そこから伸ばすのが出来る自信があんまりない — 高橋 直大(chokudai) (@chokudai) January 6, 2015 高橋 直大さんほどの世界的なトップコーダーがコンピューター将棋ソフトの開発に参加すれば、コンピューター将棋ソフトの進歩は飛躍的に加速すると思うんですが…。 「stockfish風探索」がすっげー前々から気になっているのだけど、オープンソースのコード読む時間とか取れるわけがない状態なので、誰か同じく気になっ

  • 1