리프트 곡선 편집하기 (부분)

== 리프트 ==
'''Lift'''

모델의 예측이 무작위 예측과 비교하여 얼마나 더 나은지를 표현하는 수치이다. 무작위 예측이 1이라고 가정했을 때 리프트는 배수 값으로 표현된다. 리프트가 1.5라면 무작위 예측보다는 50%의 향상된 성능을 발휘하는 것이다. 정확히 말하면 무작위보다 50% 더 많은 양성 반응을 포함한다.

* '''주요 용도'''는 마케팅 분야로, 고객이나 잠재적인 사용자 반응 예측에 주로 사용된다.
* '''특징''': 리프트는 낮은 반응률([[기저율]]이 낮은 데이터)인 데이터셋에서 모델의 성능을 측정하는 데 유리하다. 
** 예를 들어, 낮은 클릭률의 예측이나 특정 상품 구매 예측에 적합하다.
* '''n%의 리프트''': 상위 n%에 속하는 예측값을 기준으로 모델의 성능을 측정하는 한다는 의미이다. 
** 모델이 평가한 확률이 가장 높은 n%의 대상으로 평가 했을 때 무작위에 비해 어느 정도 상향을 보이냐는 것이다.
** 당연히 모델이 평가한 상위 10%는 모델이 가장 확신 있게 판단한 데이터들이므로 양성률이 높을 것이다.
** 반면 모델이 평가한 상위 50%의 데이터는 무작위 보다는 낫겠지만 상위 10%보단, 무작위 데이터와의 양성률 차이가 작을 것이다.
** 그리고 100% 리프트 지점에서는 양성률이 전체 데이터와 동일해진다.
*** 아래 그래프를 보면 알 수 있듯이, 100% 지점에서 항상 Random 기준선과 만나게 된다.
*** 예를 들어, 양성 20개와 음성 80개인 데이터(총 100개)가 주어지고, 모델에게 "가장 확신 있는 상위 100개의 양성 데이터를 찾아라"라고 하면, 100개는 전체 데이터와 동일하므로 양성률은 20%로, 무작위 추출 시 양성률과 일치하게 된다.