タグ

将棋に関するsh19910711のブックマーク (9)

  • 【論文】In deep reinforcement learning, a pruned network is a good networkを読む - TadaoYamaokaの開発日記

    DeepMindがarXiv上で発表した、深層強化学習のモデルを段階的な枝刈りすることでモデルサイズのスケーリングが可能になることを示した「In deep reinforcement learning, a pruned network is a good network」を読んだ際のメモ。 概要 深層強化学習はモデルサイズをスケーリングことは困難だった 段階的に枝刈りすることでスケーリングが可能であることを実証した 枝刈りすることでパフォーマンスも向上する 導入 深層強化学習では訓練中に多数のパラメータが休止状態になる 最近の研究でResNetバックボーンのDQNで段階的な枝刈りで元のパラメータの10%で50%パフォーマンスが向上ことが発見された この論文では、段階的な枝刈りによって、ネットワークのサイズに比例してパフォーマンスが向上することを示す 関連研究 深層強化学習でネットワークを

    【論文】In deep reinforcement learning, a pruned network is a good networkを読む - TadaoYamaokaの開発日記
    sh19910711
    sh19910711 2024/03/14
    "訓練中に多数のパラメータが休止状態 / ResNetバックボーンのDQNで段階的な枝刈りで元のパラメータの10%で50%パフォーマンスが向上 / 段階的な枝刈りを使用すると、パラメータ効率が向上することを示唆" arXiv:2402.12479
  • ChatGPTとBingに将棋をさせてみた ルール無用の対局が実現!

    ChatGPTとBingに将棋をさせてみた ルール無用の対局が実現!:AI相談だ!(1/2 ページ) どんな質問にも“それらしい答え”を返してくれるAIチャットbot「ChatGPT」。2023年には米Microsoftの「新しいBing」も登場した。では、人間には答えにくい質問や、答えのない問い、ひっかけ問題を尋ねてみたらどんな反応を見せるのか。 連載では、ChatGPTや新しいBingにさまざまな問題を投げかけて、どんな答えを返すか試してみる。その反応からAIの可能性、テクノロジーの奥深さ、AIが人間に与える“示唆”を感じ取ってほしい。 「将棋をしましょう」 先手側への指示 将棋をしましょう。先手を打ってください。棋譜の記法で記述してください。 後手側への指示 将棋をしましょう。○○(先手の1手目)

    ChatGPTとBingに将棋をさせてみた ルール無用の対局が実現!
    sh19910711
    sh19910711 2023/03/12
    "ChatGPTがどこからともなく飛車を持ち出してきて、自陣の歩を取る / BingがChatGPTの謎の手に気付いて指摘 / Bingも2回目までは指摘していたが、3回目には諦め"
  • ぷよぷよAIを作りやすくしてみた - Qiita

    ぷよぷよAIを作ることは中々面倒であるという話 私はとあるぷよぷよ好きなプログラマです。 以前はコンピュータ将棋に力を入れて開発していたのですが、最近はぷよぷよAIにハマっています。 こっそり自分で作って、動いているところを見て一人で楽しんでいましたが、やはり他の方が作ったプログラムと対戦させてみたい欲がでてきました。 ただこれが、現状だと難しいのです。 というのも、ぷよぷよAI界は、コンピュータ将棋界ほどインフラが整備されていないからです。 何が足りないのか 1. GUIを作らずに済む仕組みがない まず、ぷよぷよAIを作るうえで面倒なのは、GUIを作らないといけないという点でしょうか。 探索や評価のアルゴリズムだけを追求したい開発者にとって、絵を書いたり、音声を探したり、はたまたそれらを動かしたりするプログラムを書くのは苦痛です。(コンソールだけでも作れなくはないですが……) 将棋には、

    ぷよぷよAIを作りやすくしてみた - Qiita
    sh19910711
    sh19910711 2022/08/25
    2019 / "アルゴリズムだけを追求したい開発者にとって絵を書いたり音声を探したり、はたまたそれらを動かしたりするプログラムを書くのは苦痛 / 将棋にはこの問題を解決するための仕組みとしてUSIプロトコルがあります"
  • 流行りの機械学習をフル活用して棋力スカウター開発してみた話(前編) - コンピュータ将棋 Qhapaq

    歴代の名人と今の名人はどちらが強いのか。将棋が強くなる上で必要な力は何であるか。女流棋士は此処数年でどのぐらい強くなったのか。アマチュアトップとプロの実力差はどのぐらいなのか。 こうした問題の答えを得ることは、将棋AIに期待されている大きな仕事の1つです。人間であれば手の評価にブレが出てしまったり、そもそも巨大な棋譜のデータを読み切る事自体が困難であるという問題があります。しかし、コンピュータであれば大量のデータを均一な品質で評価することが可能です。しかも、幾つもの技術的な幸運により昨今の将棋AIは1秒未満の計算でもかなり正確な(ほぼ全ての人間に余裕で勝ち越せるレベルの)盤面評価を行うことが出来ます。 シリーズでは令和時代の機械学習技術(?)を総動員してできるだけ少ない棋譜で正確に棋力を推定できるエンジンの開発を目指していきます。前編では先行研究の検証を通じてデータの可視化の重要さをお見

    流行りの機械学習をフル活用して棋力スカウター開発してみた話(前編) - コンピュータ将棋 Qhapaq
    sh19910711
    sh19910711 2022/03/13
    "将棋ソフトの評価値と勝率の関係はシグモイド関数に似ていることが実験的に知られている / 後編ではKaggleでおなじみの手法を駆使してレートの分布をより美しくしていきます"
  • 将棋盤を画像認識する - LIVESENSE Data Analytics Blog

    Analytics チームで転職会議のレコメンドを開発している @na_o_ys です。今回は業務のことは忘れて、趣味将棋の話をしたいと思います。 この数年で将棋の学習環境はずいぶんリッチになりました。通勤電車では将棋アプリのネット対局をして、自宅ではオープンソースの強豪 AI を使って棋譜検討し、日々将棋を楽しんでいます。 一方で、顔を突き合わせて盤と駒を使って指す対局が一番楽しいのは変わりがありません。 リアルの対局を AI で検討するために、盤面を手軽にコンピュータに入力したい というのが今回のテーマの発端です。 TL;DR 盤上の駒を高い精度で推定することができました。 処理は大きく 2 つのステップからなります。 盤面の正規化 盤面の四隅の座標を特定し、元画像から正規化画像への射影変換を得る マス目毎の内容を推定する マス目毎に画像を切り出し、駒の有無・種類を推定する ちなみに

    将棋盤を画像認識する - LIVESENSE Data Analytics Blog
    sh19910711
    sh19910711 2021/09/25
    "15 万文字の手書き漢字・ひらがなからなる 手書教育漢字データベース ETL8 を利用 / 非常にノイズが少ないクリアな画像データ > 畳み込み層がノイズに対応できず将棋駒をうまく識別できませんでした"
  • AIの台頭で将棋研究が本当に加速しているのかデータから検証してみた - コンピュータ将棋 Qhapaq

    将棋AIを使って研究する」 2000年頃にはありえないとさえ言われたAIによる人間超えは2010年代にかけて達成され、今となってはプロアマ問わずAIを使った将棋研究が当たり前になりつつあります。 AI以前の将棋研究は一つ一つの局面/変化を人間が時間をかけて検討しなければならなかったのに、今となってはAIを使えば数分で検討が出来てしまいます。その結果、丹精込めて作られた戦略も一度棋譜に残してしまえば一晩で対策されてしまうようになりました。 ポストAI時代の将棋研究については若手からベテランまで多くの記事を残しています。そして、多くのケースにおいて「AIにより将棋研究は加速した」と考えられています。 しかし、当にAIの台頭で将棋研究は加速したのでしょうか。稿ではデータからポストAI時代の将棋研究がどの程度早くなったのかを測定してみたいと思います。 【局面のユニークさから見る将棋の戦略の

    AIの台頭で将棋研究が本当に加速しているのかデータから検証してみた - コンピュータ将棋 Qhapaq
  • レート測定エンジン ELQを使って君も棋力解析をしよう! - コンピュータ将棋 Qhapaq

    藤井四段と羽生三冠のどちらが強いか、流行の人工知能に聞いてみました - qhapaq’s diaryで用いたレート解析機をやっとの思いでリリースいたしましたので、此処に報告いたします。ソフト自体はかなり前にできていたのですが、皆様の利用に耐える形になるのに凄く時間がかかりました...... DLはこちらから(ソースコード付き) Release レート測定器ELQ · qhapaq-49/qhapaq-bin · GitHub レート測定器ELQの使い方 0.ELQの動作環境 ELQはC#で開発されています。windows上での動作を確認していますが、他OSでの動作は確認しておりません。 1.将棋guiを用いた棋譜解析 まず最初に、ELQのkif_exampleのように、解析したいプレイヤー(プロ棋士、ソフト、etc)の棋譜を先手、後手別に分別して保存してください。ELQには棋譜コメントから

    レート測定エンジン ELQを使って君も棋力解析をしよう! - コンピュータ将棋 Qhapaq
    sh19910711
    sh19910711 2020/07/25
    2017 / "改めて数値化すると、藤井四段は自分が有利なときはミスをせず、相手が有利なときにミスを誘うような手を指すのがとても上手であると言えます"
  • サーバーレス将棋 AI ☖ - Qiita

    いま将棋界では、良くも悪くも AI の話題が事欠きません。AI は日進月歩で強くなっており、トップレベルの AI は既にプロ棋士と互角以上に戦えるという見方が強いようです。 今回はオープンソースで公開されている将棋 AI 「技巧」 を、API Gateway + Lambda で Web API 化しました。 技巧は 2016 年の世界コンピュータ将棋選手権で準優勝した将棋ソフトで、GPL ライセンスで公開されています。 API GET https://17xn1ovxga.execute-api.ap-northeast-1.amazonaws.com/production/gikou?byoyomi={探索時間 (ms)}&position={局面の SFEN 表記}

    サーバーレス将棋 AI ☖ - Qiita
  • 電王・Ponanza開発者が語る、理由がわからないけどスゴイ“怠惰な並列化”

    皆さんこんにちは。 私は将棋プログラム「Ponanza」の作者、山一成と申します。Ponanzaは初めてプロ棋士を破った将棋プログラムで、近年最も強い将棋プログラムと言えると思われます。また、2017年もトッププロ棋士の方と対局することが予定されています。Ponazaの改良のための機械学習に現在ジサトライッペイさんのPC「大紅蓮丸」の計算リソースを借りているのですが、その関係で原稿を書いてとお願いされたので、3回に渡って将棋プログラムの今について、書いていきたいと思います。 フリーランチの終焉、並列化の効率問題 アスキー読者の方々には言うまでもないのですが、まずは近年のCPU事情について解説していきたいと思います。ちょっと昔まではCPUはシングルコアが当たり前で18ヶ月経過すればCPUのトランジスター数は倍になり、性能が向上するという流れが続いていました。ソフトウェアはその性能向上に伴い

    電王・Ponanza開発者が語る、理由がわからないけどスゴイ“怠惰な並列化”
  • 1