タグ

関連タグで絞り込む (1)

タグの絞り込みを解除

機械学習とバンディットに関するskypenguinsのブックマーク (1)

  • バンディットアルゴリズムことはじめ - Qiita

    巷で話題のバンディットアルゴリズムを、 ネット上の素晴らしい資料を参考にしたり引用したりしながら、 おおまかなイメージがつかめるようにまとめていきます。 導入:タカシ君のお年玉 20XX年、元旦。 タカシ君は、この冬休みずっと、コインに念を送って表を出す練習に励んできました。 というのも、 コインが5種類(A,B,C,D,E)あるが、どうやらそれぞれ形が違うようで、表が出る確率が違う(が変化はしない) 「1回ごとにコインを1つ選んで、50回コイン投げていいよ」と両親に言われている 表が出た回数×1000円をお年玉としてもらえる ので、なんとかして表が出る回数を最大にしたいのです。 冗談はさておき、タカシ君は、どういう方針でコインを選ぶのがいいのでしょうか。 同じコインを投げ続ける?「コインB、君に決めた!」 全てのコインを均等に投げる?「平等にコインAを10回、Bを10回、...」 これま

    バンディットアルゴリズムことはじめ - Qiita
  • 1