DEVELOPER’s BLOG

技術ブログ

ベイジアンネットワーク入門

2020.02.14 小池 壮
統計学
ベイジアンネットワーク入門

最近扱われるデータ量は膨大です。それに伴いデータの見方を変え、かつては重要度が低かった点からも関係性を見出す必要があります。
そのために確率推論は多くの命題の生起する可能性を確率として記述することから始められ、条件付き確率と結合確率を1つずつ繋ぎ合わせ段階的に構成されています。


ベイジアンネットワーク(Bayesian network)

人工知能(AI)における確率推論の一つのモデルです。
イギリスの確率論研究家トーマス・ベイズが発案したベイズの定理に基づき、因果関係を確率により記述するグラフィカルモデルの1つであり、「原因」と「結果」の関係を複数組み合わせることにより、「原因」「結果」がお互いに影響を及ぼしながら発生する現象をネットワーク図と確率で可視化したものです。これは「原因」から発生する「結果」を、確率をもって予測する推論手法とも表せます。

ベイジアンネットワークの特徴

  • 単純な二方向の計算ではないこと
  • 確率(乗算)で表現できること
  • 視覚的に操作できること
  • チューニングが容易であること
  • 人間の意志決定のプロセスと非常に似ていること
  • AIでは扱いにくい凡例の少ない事象もベイジアンネットワークでは扱える
  • 予測において説明変数の入力に欠損があってもよい
    欠損値に適切な確率分布が割り当てられ、必ずしも予測時に全ての観測値を揃える必要はない。
  • モデルの利用用途が限定されない
    ベイジアンネットワークは矢印の順方向だけでなく、逆方向にも推論が行える。観測を入力する変数と予測対象となる変数がモデルで限定されることなく自由に選択できる。


逆方向の推論?

鍵となるのは、条件付き確率と結合確率の定義です。

結合確率とは事象A、事象Bが同時に起こる確率で、条件付き確率とはどちらかの事象が先に起きた上で他の事象が起こる確率です。
では、以下がそれぞれの定義と逆方向への推論が可能であるかを示したものです。

スクリーンショット 2020-02-14 12.22.33.png

Aが先に起こる確率がわからない場合もBが先に起こる条件付き確率がわかれば推論できます。

Unknown.png


利用シーン

ベイジアンネットワークは様々な事象間の因果関係(厳密には確率的な依存関係)をグラフ構造で表現するモデリング手法の一つで、故障診断、気象予測、医療的意思決定支援、マーケティング、推薦システムなど様々な分野で利用されています。また消費者行動のモデル構築にも応用されています。
今後、ベイジアンネットワークは個人の特徴(行動、性格など)の因果関係を確率として数値化することで、個人の行動パターンや特徴を組み合わせて考えることで新たな可能性を見いだせるはずです。


Twitter・Facebookで定期的に情報発信しています!

関連記事

統計検定1級 合格記

2019年11月24日に行われた統計検定1級で、統計数理と統計応用(理工学)の両分野で合格をいただけました。このブログには僕がその合格までに行ったこととその振り返りを書き連ねておこうと思います。 もくじ 統計検定1級を受けようと思った理由 申し込む前の学習状況 申し込み 本番までに行った学習 試験本番 試験までを振り返って 統計検定1級を受けようと思った理由 僕がこの統計検定1級を受けようと思った理由は僕の興味対象となる研究分野が確

記事詳細
統計検定1級 合格記
統計学
文系のための統計学の勉強方法

今回は初めて統計学を勉強しよう、統計検定を受けようという 文系の大学生 文系出身のビジネスマン このような方に向けて、勉強方法やおすすめの本について紹介していきます。 今回紹介する本の内容をマスターすると、統計検定2級の合格や機械学習の本を理解できるようになります。 目次 自己紹介 なぜ統計学の勉強が大変なのか 本の紹介 自己紹介 僕は現在、大学3年生で文系の学部に所属しています。 統計学を勉強したきっかけは以下の2つです。 データを分析するのに必要なた

記事詳細
文系のための統計学の勉強方法
統計学
自然言語処理( NLP )とは  -統計的手法を用いて-

※本記事の対象:自然言語処理という言葉は聞いたことはあるが、どういうアプローチで処理がされているかイメージが湧かない方(大学レベルの数学の知識は必要) ※内容はオーム社『ゼロから学ぶDeep Learning2』を参考にしている 目次 1. はじめに:自然言語処理(NLP)とは 2. シソーラスによる手法 3. カウントベースの手法( 統計的手法 ) 4. カウントベースの手法の改善点 5. 【次回】word2vec( ←これがメイン ) 6. まとめ

記事詳細
自然言語処理( NLP )とは -統計的手法を用いて-
統計学 自然言語処理
統計検定 数理 2019 問2 解答

問1に続いて問2です。 同じくご指摘があればコメントをお願いします。 [1]\(U\)の期待値\(E[U]\)を求めよ。 \begin{equation} E[U] = E[X_1+X_2] = E[X_1]+E[X_2] \ (\because X_1, X_2は互いに独立) \end{equation} 今、\(X_i\)(\(i=1, 2\))について、 \begin{eqnarray*} E[X_i] &=& \int_0^\infty x

記事詳細
統計検定 数理 2019 問2 解答
統計学

お問い合わせはこちらから