機械学習の手法⑨

機械学習のモデルの精度評価の方法について。

目次

AI・ディープラーニングの全体像

  • 人工知能
  • 機械学習
  • ディープラーニングの基本・応用
  • ディープラーニングの研究
  • AIプロジェクト
  • AI社会実装に伴う法律・倫理

機械学習モデルの精度への評価②

精度指標の詳細

精度指標(スコア)

  1. Accuracy(正解率)
    →正しく分類できたデータの割合
  2. Precision(適合率)
    →陽性判定されたデータのうち、実際に陽性だったデータの割合
    偽陽性を避けたいときに注目する)
  3. Recall(再現率)
    →実際の陽性データのうち、陽性として検出されたデータの割合
    陽性を見落とするとリスクが高いときに注目する)
  4. F-measure(F値)
    適合率と再現率の調和平均として使う

「Accuracy(正解率)」「Precision(適合率)」「Recall(再現率)」の関係性

Accuracy(正解率)・最も一般的な評価指標
推定値と真値の一致割合を示す
・FP(False Positive)とFN(False Negative)の重要度を差別化する必要なし
Accuracyだけを見ても、モデルの良し悪しを判断できない場合あり
(FPとFNの重要度が異なる場合、カテゴリごとの出現割合が極端に異なる場合など)
Precision(適合率)陽性判断の正確性を示す
曖昧なものは陰性と判断されがちFN(False Negative=偽陰性)が発生しやすくなるRecall指標が下がる
FNを避けたい場合、Precisionを重視すべきでない(病気診断など)
Recall(再現率)陽性データのうち、モデルが陽性を検出できた割合を示す
陽性判断の網羅性を示す
曖昧なものは陽性と判断されがちFP(False Positive=偽陽性)が発生しやすくなるPrecision指標が下がる
・FPは再検査で対応すればよく、FNほど深刻ではない(病気診断など)

”曖昧なものは陰性と判断されがち”と”曖昧なものは陽性と判断されがち”という意味において、「Precision(適合率)」と「Recall(再現率)」とは、トレードオフの関係にある(一方がよければ他方が犠牲になる)。

この記事が気に入ったら
いいね または フォローしてね!

  • URLをコピーしました!
目次