確率ロボティクス第5回: 試行回数と信頼性

千葉工業大学 上田 隆一


This work is licensed under a Creative Commons Attribution-ShareAlike 4.0 International License. Creative Commons License

確率ロボティクス第5回

今回の内容

  • 実験結果の信頼性
  • ベイズの定理
  • 補足
確率ロボティクス第5回

実験結果の信頼性

確率ロボティクス第5回

質問: この実験について議論してみましょう

  • C君がロボットをある地点からある地点まで自動で走らせるソフトウェアを改良して、評価するために実験
  • 実験内容: 改良前後のソフトウェアで5回ずつロボットを走行させる
  • 実験結果:
    • 改良前: 完走失敗失敗完走完走
    • 改良後: すべて完走
  • C君の結論: 改良後のソフトウェアの方が優れている
ほんと?
確率ロボティクス第5回

実験が足りないような気がするが・・・

  • このあと試行を重ねると結果が逆転するかもしれない
    • 今回はこの問題について扱う
  • 問題へのアプローチ: 完走率の確率分布を推定する
    • つまり確率(完走率)自体を確率変数として扱う
    • 背景となる考え: 無限回の試行をしないと完走率はそもそも不確か
      完走率は確率的
確率ロボティクス第5回

完走率の確率分布(の予想)

  • 完走率(確率変数)をとすると、はたぶん下図のようになる
    • (a) 試行前: 一様分布に(なにも情報がない)
    • (b) 何回か試行: 「完走回数/試行回数」のところにピークが来るが、まだ曖昧
    • (c) たくさん試行: 完走率がはっきりして、分布が鋭く

この分布で改良前後の結果を比較してみましょう
(どうこの分布を計算するかはさておき)
確率ロボティクス第5回

完走率の確率分布を考えると比較ができる

  • たくさん試行すると(c)のように改良前後の完走率の分布が(ほぼ)重ならない
    • どちらが優れているか(ほぼ)分かる
  • 試行が5回ずつ程度だと(b)のように分布が重なっていそう
    • 改良前後の完走率が逆転している可能性が無視できないほどある

どうやって計算するの?
確率ロボティクス第5回

完走率の確率分布の導出

  • を定義
    • 試行結果から推定される分布
  • について、乗法定理から次の2つの式を考える
    • ---(a)
    • ---(b)
      • がわかればの情報は不要
  • 上の2式の右辺から
確率ロボティクス第5回

さらに計算

  • 教科書は離散化していますが、そのまま計算してみます
  • の各要素を見ていきましょう
    • : 完走率がのときに、となる確率
      • が完走:
      • が失敗:
      • 上記をまとめると

      • 前ページの(b)から
      • で考えたときの、の起こりやすさの値
      • 上の式では定数扱い(は積分で消える)
確率ロボティクス第5回

完走率の分布の導出(完了)

  • したがって次が成立
    • 意味: が成功だと、失敗だとをかけて
      正規化すると
  • これまでに回成功、回失敗したとすると
  • が一様分布だとすると
    • が、回試行したあとの完走率の分布
確率ロボティクス第5回

完走率の分布の描画

  • 改良前のソフトウェアの試行での分布の推移を描いてみましょう
    • 完走失敗失敗完走完走
    • こうなる
確率ロボティクス第5回

分布の比較

  • 5回ずつ試行が終わった時点での改良前後での分布の比較
    • これも余裕があれば描いてみましょう
    • こうなる
      • 改良前の完走率のほうが高い可能性はある
確率ロボティクス第5回

改良前の完走率のほうが高い確率








  • 9%の確率で改良前のほうが完走率が高い
確率ロボティクス第5回

もし改良後の試行で1回失敗があったら

  • 同様に計算すると
  • (試行回数は実験前に決めないといけないので)試行回数は全然足りない
確率ロボティクス第5回

どれくらいの試行回数が必要か?

  • 右のグラフ: の値
    • 改良が無意味な確率
    • 条件
      • 改良前の完走率: (固定)
      • 改良後の完走率: のいずれか
  • 無意味な確率が5%以下になる試行回数
    • だと30回程度
    • だと100回以上
      • 100回で10%は下回る
  • (学科の学生の感覚よりも)かなり試行回数が必要
確率ロボティクス第5回

ここまでのまとめ

  • 試行での比較については、その信頼性が確率の計算で求められる
    • 完走率等の確率に対して、さらに確率分布を考える
  • どれだけ試行しても、結果が偶然ひっくり返る可能性は0にはならない
    • 実験の評価項目、方法を工夫して少ない試行回数で済むように or たくさん試行回数を確保
    • 論文指導では「言い切れ」と言われるが、個人的にはかなり疑問
      • 他の人に追試してもらうことを前提に、できるだけ有意義な結果や付帯情報の提示を
    • 基本、論文の実験結果を鵜呑みにしてはならない
      • 自分自身に対しても常に疑いを
確率ロボティクス第5回

ベイズの定理

確率ロボティクス第5回

さっき使ったこの式変形は実はとても重要


    • (乗法定理の変形であることはさておき)ベイズの定理と呼ばれる
  • ベイズの定理の様々な表記
      • が連続、離散どちらでも成立
確率ロボティクス第5回

ベイズの定理の意味

の意味は?

  • 新たな情報を分布に反映する式
    • に新たな情報を加えると、分布がに変化
      • 例: 試行の結果を観測すると、に変化
  • この文脈での用語
    • : 事前分布
    • : 事後分布
確率ロボティクス第5回

尤度・尤度関数

  • 尤度: の値のこと
    • 実例:
      • 確率変数を条件にしたとき(=固定したとき)に、
        実際に観測されたがどれくらい起こりやすいかを数値化
  • 尤度関数: のほうを変数として考えた関数
    • 観測された情報に対し、がどれだけあり得るかを数値化したもの
    • 実例:
      • だとが変数だが、実際にはのほうが変数では固定値
    • は確率分布にはならない
      • ベイズの定理には正規化定数があるので、分布でなくても成立
確率ロボティクス第5回

周辺尤度

  • の値のこと
  • 意味: 事前分布を信じる時に、観測された情報がどれだけ妥当かを表す数値
    • 変形すると(少し)分かる
        • が起こりやすい時にが大きいと周辺尤度は大きく
        • (別の情報があれば必ずしもを使う必要はない)
    • 実例(条件付きの分布の場合)
  • 生物的な意味: がとても小さいと、経験を裏切られてとてもびっくりする
    • : シャノンサプライズ
    • e.g. 自由エネルギー原理
確率ロボティクス第5回

その他補足

確率ロボティクス第5回

ベータ分布

  • 実験の話で求めた事後分布の形
    • だと一様分布
  • 一般的な表記

      • (ベータ関数)

図: パブリックドメイン

確率ロボティクス第5回

ベルヌーイ試行とベータ分布、共役性

  • ベルヌーイ試行: 2値の確率変数で結果が表せる試行
    • 完走/失敗、(コインの)表/裏、・・・
    • 確率分布は第2回で出てきた「ベルヌーイ分布」
  • ベルヌーイ試行の場合(尤度関数がベルヌーイ分布から導出される場合)、
    事前分布がベータ分布だと事後分布もベータ分布に
    • こういう関係を共役性という
    • ベルヌーイ分布に対するベータ分布: 共役事前分布と呼ばれる
  • 共役性は他の分布のペアにも現れる
    • 出てきたときに触れます
    • ベイズの定理の計算がパラメータ更新だけで済むのでとても便利
      • の場合: を足すだけで事後分布に
確率ロボティクス第5回

まとめ

  • 「必要な実験回数」について考察
    • ベイズの定理が自然に出てきた
  • ベイズの定理
    • ある情報を確率分布に反映するための定理
    • (次回以降扱いますが)ロボット工学において重要
  • 共役性
    • ベイズの定理を解いたり実装したりするときに便利な性質
    • なんらかの法則が背景に
確率ロボティクス第5回