TOP

【機械学習】モンテカルロ法（Monte Carlo method）について。

公開日： 2018/05/14 : 機械学習 igo, コンピュータ囲碁, モンテカルロ法

モンテカルロ法（Monte Carlo method）とは、シュミレーションや数値計算を乱数を用いて行う手法のことです。

中性子が物質中を動き回る様子を探るために、ジョン・フォン・ノイマンという人により考案されました。

また、モンテカルロ法という名前は、カジノの都市国家であるモナコ公国の４つの地区の一つであるモンテ・カルロから名づけられました。

Contents

ゲーム用モンテカルロ法のアルゴリズム

モンテカルロ法は、ほんとうにシンプルなアルゴリズムで実装することができます。原始的なゲーム用モンテカルロ法は、以下の手順になります。

ある初手aについて、以降の手を全ての合法手からランダムに選び終局まで進める（シュミレーションやプレイアウトと呼ぶ）。
終局時の勝ち・負けをカウントする。これを\(N_a\)回繰り返し、勝ち数\(W_a\)をカウントする。
１、２を全ての初手について行い、勝率\(\frac{W_a}{N_a}\)が最大の手を実際に打つ。

「ランダムに手を選んでシュミレーションしていき、勝率の良かった手を選ぶ」ということです。

モンテカルロ法とコンピュータ囲碁

２０００年代後半に、コンピュータ囲碁においてモンテカルロ法を適応し、活躍しました（５年間でアマチュア初段レベルから六段レベルにまでなった）。コンピュータ囲碁においてモンテカルロ法が活躍した原因としては、

ランダムに手を選ぶため、評価関数が必要ない（囲碁では評価関数を作成するのが難しい）。
一見、人間の考え方とは全く異なるが、自然な手を打たれることが多い。

が挙げられます。

ただし、以下のような欠点もあります。

十分な回数のシュミレーションが必要であるため、リアルタイムゲームや終わるまで長いゲームが苦手。
シュミレーションを無限回やっても最適性はなく、当然の一手がある局面でもランダムに手を選択し、間違った勝率推定を行う可能性がある。

モンテカルロ法の改良

単純にランダムにシュミレーションするのではなく、以下のような自然な拡張をしてモンテカルロ法の改良が行われています。

指し手を純粋なランダムではなく、ありそうな手を選びやすくする（行動評価関数を使う）。

収束しにくいゲームでは、適当な深さまでランダムに進めて、評価関数を呼び判定する（深さ限定モンテカルロ法）。

もう調べる価値がなさそうな手を調べない（全ての手を同じだけプレイアウトするのではなく、良さそうな手に偏って資源配分する）。

一見良さそうな手を重点的に調べる（progressive widening）。

MINMAX探索との融合により、希望的観測に基づく手を防ぐ。相手の少ない良い手をちゃんと発見して尊重する（モンテカルロ木探索：Monte Carlo Tree Search）。

参考ページリンク

http://www.yss-aya.com/monte.html

Tweet

【探索】ダイクストラ法・最良優先探索・Aアルゴリズムの比較。

縦型探索や横型探索では、機械的に順序を付け、最小ステップでゴールを目指します。つまり、

記事を読む

【機械学習・手法比較】決定木とナイーブベイズを比較してみた。

同じデータを使って、教師有り機械学習手法の決定木（Decision Tree）とナイーブベイズ（N

記事を読む

機械学習の手法のまとめ。

機械学習は、「与えられた入出力事例をモデル化する行為」のことで、ディープラーニングなどで注目を集めて

記事を読む

【転移学習】学習済みVGG16 による転移学習を行う方法【PyTorch】

今回は、PyTorch を使って、学習済みのモデル VGG16 を用いて転移学習をしてみました。

記事を読む

【PyTorch】畳込みニューラルネットワークを構築する方法【CNN】

今回は、PyTorch を使って畳込みニューラルネットワーク（CNN）を構築する方法について紹介しま

記事を読む

【TensorFlow】GPUを認識しない時の対処方法【Python】

TensorFlow で GPU を認識させようとしたときにハマってしまったので、その対処方法のメモ

記事を読む

【機械学習】決定木（decision tree）について。

教師あり学習の一つである決定木（desicion tree）について勉強したことを書いていきます。

記事を読む

【画像認識】 Google画像検索結果を取得する方法【google image download】

今回は、深層学習（DeepLearning）で画像認識をするための画像データの収集を、Google画

記事を読む

【深層学習】 TensorFlow と Keras をインストールする【Python】

今回は、Google Colaboratory 上で、深層学習（DeepLearning）フレームワ

記事を読む

【探索】縦型・横型・反復深化法の探索手法の比較。

探索とは、チェスや将棋や囲碁などのゲームをコンピュータがプレイするときに、どの手を指すかを決定するの

記事を読む

Message コメントをキャンセル

PREV: 【機械学習】決定木（decision tree）について。
NEXT: 【探索】縦型・横型・反復深化法の探索手法の比較。

NEW ENTRY

: 無料動画編集ソフト AviUtl で mp4 形式の動画を読み込み・出力する方法【Windows】
今回は、無料動画編集ソフト AviUtl で mp4 形式の動画を読み

: 【Cubase】イヤホンから音がでないときの対処方法。
Cubase でイヤホンから音がでなくなったときの対処方法のメモです。

: 【Cubase】特定のトラックを無効にする方法。
今回は、Cubaseで特定のトラックのみを無効にする方法について紹介し

: 【転移学習】学習済みVGG16 による転移学習を行う方法【PyTorch】
今回は、PyTorch を使って、学習済みのモデル VGG16 を用い

: 【PyTorch】畳込みニューラルネットワークを構築する方法【CNN】
今回は、PyTorch を使って畳込みニューラルネットワーク（CNN）

→もっと見る

カテゴリー
- Webサイト運営 (8)
- お金 (49)
  - FX・外貨預金 (27)
    - MT4 (18)
  - 仮想通貨 (18)
  - 株・投資信託・ETF (3)
- カメラ (4)
- テキストマイニング (4)
- パソコン (30)
  - Mac (2)
- ファッション (2)
- プログラミング (77)
  - Excel（VBA） (1)
  - LaTeX (8)
  - Linux (13)
  - MySQL (7)
  - Perl (1)
  - Python (33)
  - R言語 (5)
  - Scilab (2)
  - SQLite (2)
- ボードゲーム (13)
  - 将棋 (3)
- 文字 (1)
- 機械学習 (23)
- 生活 (5)
- 税理士 (12)
- 競馬 (9)
- 配信者 (1)
- 音楽 (41)
  - DTM (7)
    - Cubase (6)
  - エイベックス (2)
  - ビーイング (24)
- 食事 (2)

PAGE TOP ↑

Tweet

【機械学習】モンテカルロ法（Monte Carlo method）について。

ゲーム用モンテカルロ法のアルゴリズム

モンテカルロ法とコンピュータ囲碁

モンテカルロ法の改良

参考ページリンク

関連記事

【探索】ダイクストラ法・最良優先探索・Aアルゴリズムの比較。

【機械学習・手法比較】決定木とナイーブベイズを比較してみた。

機械学習の手法のまとめ。

【転移学習】学習済みVGG16 による転移学習を行う方法【PyTorch】

【PyTorch】畳込みニューラルネットワークを構築する方法【CNN】

【TensorFlow】GPUを認識しない時の対処方法【Python】

【機械学習】決定木（decision tree）について。

【画像認識】 Google画像検索結果を取得する方法【google image download】

【深層学習】 TensorFlow と Keras をインストールする【Python】

【探索】縦型・横型・反復深化法の探索手法の比較。

Message コメントをキャンセル

NEW ENTRY

カテゴリー

【機械学習】モンテカルロ法（Monte Carlo method）について。

日々調べたこと思ったことをメモがわりに記録していきます。