DEVELOPER’s BLOG

技術ブログ

統計検定 数理 2019 問1 解答

2019.11.28 入江 佳輝
統計学
統計検定 数理 2019 問1 解答

2019年11月24日に実施された統計検定1級を受験しました! 略解は既に公開されているのですが、改めて勉強したい人(僕もその1人ですが...。)のために解答を共有します。 少しでも役に立つと嬉しいです。。。
本記事では統計数理の問1、次記事で問2を解説していきます。


[1]
確率母関数の1階および2階微分はそれぞれ \[ \frac{d}{dt}G_{X}(t) = \sum_{k} kt^{k-1}P(X=k) \] \[ \frac{d^{2}}{dt^{2}}G_{X}(t) = \sum_{k} k(k-1)t^{k-2}P(X=k) \] である。 ここで\(t=1\)を代入して \[ \frac{d}{dt}G_{X}(1) = \sum_{k} kP(X=k) = E[X] \] \[ \frac{d^{2}}{dt^{2}}G_{X}(1) = \sum_{k} k(k-1)P(X=k) = E[X(X-1)] \] したがって期待値、分散を求める式はそれぞれ \[ E[X] = \frac{d}{dt}G_{X}(1) \] \begin{eqnarray*} V[X] &=& E[X(X-1)] + E[X] - (E[X])^2 \\ &=& \frac{d^{2}}{dt^{2}}G_{X}(1) + \frac{d}{dt}G_{X}(1) - \left(\frac{d}{dt}G_{X}(1)\right)^{2} \end{eqnarray*} となる。

[2]
\(X\)~\(B(n,p)\)のとき、\(P(X=k)=\left( \begin{array}{c} n \\ k \end{array} \right) p^{k}(1-p)^{n-k}\)より、確率母関数は \begin{eqnarray*} G_{X}(t) &=& \sum_{k=0}^{n}t^{k}\left( \begin{array}{c} n \\ k \end{array} \right) p^{k}(1-p)^{n-k} \\ \\ &=& \sum_{k=0}^{n}\left( \begin{array}{c} n \\ k \end{array} \right) (tp)^{k}(1-p)^{n-k} \\ \\ &=& (tp+1-p)^n \end{eqnarray*} となる。最後の行では二項定理を用いた。また、この結果から \[ \frac{d}{dt}G_{X}(1) = np(tp+1-p)^{n-1}|_{t=1} = np \] \begin{eqnarray*} \frac{d^{2}}{dt^{2}}G_{X}(1) &=& n(n-1)p^{2}(tp+1-p)^{n-2}|_{t=1} \\ &=& n(n-1)p^{2} \end{eqnarray*} と求められるので、\(B(n,p)\)の期待値と分散は[1]の式を用いて \[ E[X] = np \] \[ V[X] = n(n-1)p^{2} + np - (np)^{2} = np(1-p) \]

[3]
確率母関数の定義式から、正の実数\(r\)について、 \begin{eqnarray*} G_{X}(t) &=& \sum_{k} t^{k}P(X=k) \\ &=& \sum_{k\leq r} t^{k}P(X=k) + \sum_{k> r} t^{k}P(X=k) \\ &\geq& \sum_{k\leq r} t^{k}P(X=k) \end{eqnarray*} となる。ここで\(k\leq r\)ならば\(t^{k-r}\geq 1\)が成り立つので \begin{eqnarray*} t^{-r}G_{X}(t) &\geq& t^{-r}\sum_{k\leq r} t^{k}P(X=k) \\ &=& \sum_{k\leq r} t^{k-r}P(X=k) \\ &\geq& \sum_{k\leq r} P(X=k) \\ &=& P(X\leq r) \end{eqnarray*} よって示された。

[4]
[2]、[3]の結果から\(X\)~\(B(n,p)\)と実数\(a\)について \[ P(X\leq an) \leq t^{-an}(tp+1-p)^n \] ここで、不等式の右辺において最小値を与える\(t\)を求める。右辺の値の自然対数をとった関数\(f(t)=n\{\log(tp+1-p)-a\log t\}\)を\(t \)で微分してその値を0とおくと \begin{eqnarray*} && \frac{d}{dt}f(t) = n\left(\frac{p}{tp+1-p} - \frac{a}{t}\right) = 0 \\ \\ &\Leftrightarrow& t = \frac{(1-p)a}{p(1-a)} \end{eqnarray*} この\(t\)を不等式の右辺の式に代入して \begin{eqnarray*} && \left\{\frac{(1-p)a}{p(1-a)}\right\}^{-an}\left\{\left\{\frac{(1-p)a}{p(1-a)}\right\}p+1-p\right\}^n \\ \\ &=& \left(\frac{a}{p}\right)^{-an}\left(\frac{1-p}{1-a}\right)^{-an}\left(\frac{1-p}{1-a}\right)^{n} \\ \\ &=& \left(\frac{p}{a}\right)^{an}\left(\frac{1-p}{1-a}\right)^{(1-a)n} \end{eqnarray*} よって \[ P(X\leq an) \leq \left(\frac{p}{a}\right)^{an}\left(\frac{1-p}{1-a}\right)^{(1-a)n} \]


以上が問1です。 ご指摘があればコメント頂けると嬉しいです。


普段はアクセルユニバース株式会社でデータサイエンティストとしてインターンをしています。
kaggleコンペに挑戦したり、pythonで機械学習を実装したりしています。ゼロから学ぶ!機械学習とプロセス
コンペの結果、解法や実装した成果物等を今後も公開していくので、ぜひご覧頂きたいです!

関連記事

ベイジアンネットワーク入門

最近扱われるデータ量は膨大です。それに伴いデータの見方を変え、かつては重要度が低かった点からも関係性を見出す必要があります。 そのために確率推論は多くの命題の生起する可能性を確率として記述することから始められ、条件付き確率と結合確率を1つずつ繋ぎ合わせ段階的に構成されています。 ベイジアンネットワーク(Bayesian network) 人工知能(AI)における確率推論の一つのモデルです。 イギリスの確率論研究家トーマス・ベイズが発案したベイズの定理に基づ

記事詳細
ベイジアンネットワーク入門
統計学
統計検定1級 合格記

2019年11月24日に行われた統計検定1級で、統計数理と統計応用(理工学)の両分野で合格をいただけました。このブログには僕がその合格までに行ったこととその振り返りを書き連ねておこうと思います。 もくじ 統計検定1級を受けようと思った理由 申し込む前の学習状況 申し込み 本番までに行った学習 試験本番 試験までを振り返って 統計検定1級を受けようと思った理由 僕がこの統計検定1級を受けようと思った理由は僕の興味対象となる研究分野が確

記事詳細
統計検定1級 合格記
統計学
文系のための統計学の勉強方法

今回は初めて統計学を勉強しよう、統計検定を受けようという 文系の大学生 文系出身のビジネスマン このような方に向けて、勉強方法やおすすめの本について紹介していきます。 今回紹介する本の内容をマスターすると、統計検定2級の合格や機械学習の本を理解できるようになります。 目次 自己紹介 なぜ統計学の勉強が大変なのか 本の紹介 自己紹介 僕は現在、大学3年生で文系の学部に所属しています。 統計学を勉強したきっかけは以下の2つです。 データを分析するのに必要なた

記事詳細
文系のための統計学の勉強方法
統計学
自然言語処理( NLP )とは  -統計的手法を用いて-

※本記事の対象:自然言語処理という言葉は聞いたことはあるが、どういうアプローチで処理がされているかイメージが湧かない方(大学レベルの数学の知識は必要) ※内容はオーム社『ゼロから学ぶDeep Learning2』を参考にしている 目次 1. はじめに:自然言語処理(NLP)とは 2. シソーラスによる手法 3. カウントベースの手法( 統計的手法 ) 4. カウントベースの手法の改善点 5. 【次回】word2vec( ←これがメイン ) 6. まとめ

記事詳細
自然言語処理( NLP )とは -統計的手法を用いて-
統計学 自然言語処理

お問い合わせはこちらから