中野智文のブログ

データ・マエショリストのメモ

PACモデルで十分な事例数とその使い方

PACモデルで十分な事例数

 \displaystyle{ m \leq \frac{\ln(1/\delta)+\ln|H|}{\epsilon} }

ここで、 mは学習事例数、 H は仮説空間、エラー率 \epsilon以内の概念モデル C \in H 1-\delta の確率で学習すること(Tom Mitchell 著 Machine Learning 7章より)。

使い方

次の様な質問に即答できる。

  • データが倍になったら何がうれしいか?
    • エラー率が半分になる
    • あるいはエラー率が目標に未達の場合、その目標の達成確率がかなり上がる。

参考