機械学習

第2回: 確率と期待値による判断や決定

千葉工業大学 上田 隆一


This work is licensed under a Creative Commons Attribution-ShareAlike 4.0 International License.

機械学習(と統計)第2回

今日やること

  • 確率の使い方
  • 期待値の使い方
  • 期待値の利用
機械学習(と統計)第2回

確率の使い方

機械学習(と統計)第2回

確率ってなに?結局なんなのか?

  • よくある例
    • コインを投げて表が出る確率は1/2
    • サイコロを振って1の目が出る確率は1/6
  • こう考えましょう
    • 確率: 全通りの未来に対して、ある未来が選ばれる割合
      • あるいはどうなったか知らない過去のことについて、選ばれた割合
機械学習(と統計)第2回

確率の表記

  • 確率は事象という記号を使って表記
    • 事象: 起きる(た)こと
    • いろいろ書き方があるがこの講義ではこう表記
      • 後日という表記も出てくるけど別物
  • 例: コインの裏表
    • 表が出る
    • 裏が出る
    • 裏か裏が出る表が出る裏が出る
    • 注意: 別にすべてのコインがこうなるわけでないので、実は「こういうコインのモデルを考えましょう」という話でコレ自体に根拠はない
      • なんでこのモデルをつかうのかまで考えると奥が深い
機械学習(と統計)第2回

確率の計算

  • 実は足し算と掛け算しかない
  • 足し算(加法定理
    • AあるいはBが起きるAが起きるBが起きる
      • ただしAとBは同時に起きないように定義する必要がある
  • 掛け算(乗法定理
    • AとBが起きるAが起きる|Bが起きるBが起きる
      • Aが起きる|Bが起きる: Bが起きることが分かっているときに
        Aが起きる確率(条件付き確率
        • の右側は「条件
よく分からんのでサイコロで考えましょう
機械学習(と統計)第2回

確率の計算の問題(その1)

  • 1または2が出ている
      • 1と2は同時には出ないから足せる
  • 1つめのサイコロが1で、2つめのサイコロが6
    と表記しましょう)


    • (↑2つのサイコロの目は無関係なので条件を消せる)
機械学習(と統計)第2回

確率の計算のポイント

  • 計算自体は全然難しくない
  • 大変なこと
    • 加法定理での、ある事象とある事象が同時に起こるかどうかの判断
      • 事象が同時に起こらないことを排反と呼ぶ
    • 乗法定理での、条件を消せるかどうかの判断
      • ある事象がある事象の条件として影響を与えないことを独立と呼ぶ
  • 練習問題
機械学習(と統計)第2回

確率による判断

  • 引き続き、代表値で誰を代表にするか議論しましょう
    • 前回提示したデータ
      • Aさん: 134, 93, 123, 110, 98
      • Bさん: 84, 78, 92, 210
      • Cさん: 42, 138, 134, 99, 145
    • 前回: 代表値で誰を代表にするか議論した理屈では決まらなかった
  • 追加情報
    • 代表者が参加する大会は、200点をとればほぼ優勝で、
      130点をとればほぼ入賞
      • A, B, Cさんの優勝の確率、入賞の確率を計算してみましょう
        (Aさんがは134点を取る確率が1/5、などと単純に考えてみましょう)
機械学習(と統計)第2回

計算結果

  • 単純に考えるとこうなる
    • Aさん: ほぼ1/5の確率で入賞
    • Bさん: ほぼ1/4の確率で優勝
    • Cさん: ほぼ3/5の確率で入賞
  • 前回よりは話し合う材料が増えたけど・・・
    • 点数の確率をこんなふうに計算していいのか?(特にBさん)
      • この確率自体も確率的にばらつくけど、その話は第3回以降にあとまわし
  • 後半考えたいこと
    • 優勝と入賞ってどれくらい価値があるの?
機械学習(と統計)第2回

期待値ってなに

機械学習(と統計)第2回

期待値

  • (雑な)定義: なにかばらつく値の平均値を推定、予想した値
    • 問題: 3700円を払い、サイコロの出目に1000をかけただけお金がかえってくるギャンブルがありますが、1回の試行で儲かるお金の期待値は?
機械学習(と統計)第2回

答え


機械学習(と統計)第2回

意思決定における期待値の意義

  • 何かを決めたらどれだけ見返りが戻ってくるかを数値(特にお金)で考えられる
    • ケース1: 優勝賞金10万円、2位以下で入賞の場合5万円
    • ケース2: 優勝賞金10万円、2位以下で入賞の場合1万円
  • 再掲
    • Aさん: 134, 93, 123, 110, 98
    • Bさん: 84, 78, 92, 210
    • Cさん: 42, 138, 134, 99, 145
機械学習(と統計)第2回

計算

  • 期待値の計算
    • ケース1: 優勝賞金10万円、2位以下で入賞の場合5万円
    • ケース2: 優勝賞金10万円、2位以下で入賞の場合1万円
確率 ケース1 ケース2
Aさん: ほぼ1/5の確率で入賞
Bさん: ほぼ1/4の確率で優勝
Cさん: ほぼ3/5の確率で入賞
(当然ながら)賞金で選考基準が変化
機械学習(と統計)第2回

これまでのまとめ

  • 結局、なにか見返りを考えないと判断はできない
    • 期待値はその基本
    • ただし万能ではないし、ボーリングの話が完全に解決したわけではない
      • 宝くじの例
      • ボーリングの話はしつこくなるのでこれで終わり
機械学習(と統計)第2回

期待値の計算

  • 基本
    • 事象A, B, C, ..., Eが互いに排反で、A〜Eでない事象の起こる確率が0とすると
    • 期待値 =
      • が、なにか事象にたいしてお金などを決める関数
    • 数式で書くとややこしいけど、さっきのお金の計算を思い出しましょう
      • 問題(「上の問題」というのはp.12の問題)
  • 平均値も期待値
    • を何にするとよいでしょうか?
  • 他、計算上の様々な性質、テクニックがありますがそれはまた今度
機械学習(と統計)第2回

時間が余ったときの問題

機械学習(と統計)第2回

まとめ

  • 確率と期待値を勉強
  • 期待値があると意思決定ができる(すべての意思決定ができるわけではない)
機械学習(と統計)第2回