2022-3/논문 아이디어

[POI] 성능평가 지표 개념(정밀도, 재현율, 정확도)

이망고_ 2022. 10. 31. 21:10

https://sumniya.tistory.com/26

 

분류성능평가지표 - Precision(정밀도), Recall(재현율) and Accuracy(정확도)

기계학습에서 모델이나 패턴의 분류 성능 평가에 사용되는 지표들을 다루겠습니다. 어느 모델이든 간에 발전을 위한 feedback은 현재 모델의 performance를 올바르게 평가하는 것에서부터 시작합니

sumniya.tistory.com

데이터 분석 성능 지표로 자주 사용되는

정밀도와 재현율 개념

영어로, precision 과 recall 이라 부르는데 오늘 프로젝트 세미나에서 언급이 되어 찾아보던 중에 잘 정리되어 있는 블로그가 있어 링크를 달아놓았다.

 

정밀도가 얼마나 잘 예측했는지

재현율 예측한 것이 얼마나 잘 맞아떨어졌는지

로 주로 분석 쪽에서 사용되며, 두 개의 지표의 관계는 trade-off 관계이다

 

여기서 정확도의 개념도 알아보자면, 정확도는 accuracy 로 위의 두개의 개념이 정답과 관련이 있다면, 오답까지 예측하는 개념이 정확도라고 생각하면 될 것이다.

 

그리고 정밀도와 재현율이 trade-off 관계를 가진다고 하였는데 이러한 점을 보완하고자 나온 지표가 F1-value 라고 생각하면 된다. F밸루의 식에 2를 곱해주는 것이 있는데 데이터 분석 책에는 이 2가 정밀도와 재현율 모두에 곱해주는 것이 아니라 재현율에 2를 곱해주는 것이라고 한다. 

식으로 볼 때에는 두 지표를 더한 값에 2를 곱한 것이라고 착각할 것 같고, 계산할 때에도 두 지표 먼저 계산을 하였는데 개념이 그렇다고 하니 알아두면 좋을 것 같다~

 

논문 언제 써~

내일 발표할 걸 그랬나 ㅎㅎ된다~ 어쩐지 할 거 없이 바로 발표를 하고 싶더라니!

매일 따라 상황은 다르고,! 준비도도 다르니 나 원참~ 이 논문도 미리 읽고 있고 해서 ~ 이미 목요일에 한다고 했으니 .. 발표연습 몇 번하고 해야지~ 어쩐지~ 간에 일찍이 하고 싶더라니~~~~