中野智文のブログ

データ・マエショリスト(※データ・マエストロではない)のメモ

29戦中29連勝の勝率の信頼区間を求める

背景

仕事でどうしても必要になった(嘘)

Wilson score interval で計算する。

早速だけど、下記の式を使ってみよう。

nakano-tomofumi.hatenablog.com

今回は、p = 0.05 で求める。標準正規分布の分位数はZ=1.96となる。

よって、

UCB: (29+1.96*1.96/2+1.96*sqrt(29*(29-29)/29+1.96*1.96/4))/(29+1.96*1.96)
LCB: (29+1.96*1.96/2-1.96*sqrt(29*(29-29)/29+1.96*1.96/4))/(29+1.96*1.96)

これを python でそれぞれ求める。

$ python
>>> import math
>>> (29+1.96*1.96/2+1.96*math.sqrt(29*(29-29)/29+1.96*1.96/4))/(29+1.96*1.96)
1.0
>>> (29+1.96*1.96/2-1.96*math.sqrt(29*(29-29)/29+1.96*1.96/4))/(29+1.96*1.96)
0.8830264055344441
>>>

勝率は 88.3%から100%(p=0.05)となった。

結論

勝率は 88.3%から100%(p=0.05)

信頼上限より大きくないから、片側の信頼区間は両側の信頼区間と同じである。

勝率は 88.3%以上(p=0.025)

でもいいかもしれない。