익명 사용자
로그인하지 않음
토론
기여
계정 만들기
로그인
IT 위키
검색
K-최근접 이웃
편집하기 (부분)
IT 위키
이름공간
문서
토론
더 보기
더 보기
문서 행위
읽기
편집
원본 편집
역사
경고:
로그인하지 않았습니다. 편집을 하면 IP 주소가 공개되게 됩니다.
로그인
하거나
계정을 생성하면
편집자가 사용자 이름으로 기록되고, 다른 장점도 있습니다.
스팸 방지 검사입니다. 이것을 입력하지
마세요
!
==장단점== kNN은 일반적으로 성능이 낮고 속도도 느리다. 사실상 간단한 사칙연산(+로그)으로 계산이 되기 때문에 머신러닝 알고리즘이라고 할 수 없다. 엑셀로도 충분히 구현이 가능할 정도이다. 그럼에도 불구하고 사용되는 것은 직관적이고 편하기 때문이다. 정확한 예측이 필요한 것이 아니고, 정확한 예측을 하기엔 데이터도 부족하거나 부정확한 상황이라면, 대략적인 예측을 빠르게 해서 누군가에게 직관적으로 설명하기엔 kNN이 매우 유용할 수 있다. ===kNN의 단점=== #'''많은 저장 공간 필요''': kNN은 모든 학습 데이터를 저장해야 하기 때문에 큰 데이터셋을 다룰 경우 상당한 저장 공간이 필요하다. #'''예측 시간 지연''': 새로운 데이터를 분류할 때, 모든 데이터를 참고해야 하므로 시간이 많이 걸릴 수 있다. 이는 사전에 훈련된 모델로 빠르게 예측을 수행할 수 있는 알고리즘에 비해 불리하다. #'''거리 함수 설계의 중요성''': 적절한 거리 함수나 유사도 함수를 설정해야 하고, 이를 위해 '''도메인 지식'''이 필요할 수 있다. 거리 측정 방식이 데이터의 실제 관계를 잘 반영하지 못하면, 예측 성능이 크게 저하될 수 있다. #'''최상의 모델이 아님''': kNN은 보통 성능 면에서 다른 고성능 알고리즘보다 뒤처질 수 있다. 따라서 항상 최고의 예측 성능을 제공하지는 않는다. #'''변수 크기 조정 문제''': 입력 변수의 크기가 서로 다르면 거리 계산에 큰 영향을 줄 수 있다. 이를 해결하기 위해 '''정규화(normalization)''' 또는 '''표준화(standardization)''' 작업이 필요하다. ===kNN의 장점=== #'''간단한 구현과 사용''': 알고리즘이 직관적이고 코드 구현이 쉬워서 초보자도 사용하기 용이하다. #'''다양한 클래스 지원''': 결과값으로 여러 개의 클래스를 가질 수 있어, 이진 분류뿐만 아니라 다중 클래스 분류도 가능하다. #'''유연한 점수 계산 방식''': 클래스 간 비율이나 가중치를 임의로 조정할 수 있어 다양한 예측 방법을 시도할 수 있다. #'''설명 가능한 예측 방식''': 가까운 이웃에 기반해 예측하기 때문에, 결과를 이해하고 설명하기가 쉽다. 이는 예측의 투명성과 해석력을 높인다. #'''도메인 지식 반영 가능''': 거리 함수를 도메인 지식에 맞게 조정할 수 있어, 특정 분야의 데이터에 맞게 커스터마이징이 가능하다. #'''쉽게 업데이트 가능''': 새로운 데이터가 추가되면 기존 데이터를 변경하지 않고 추가할 수 있어 실시간 학습이나 지속적인 데이터 업데이트에 유리하다. #'''범용 함수로 사용 가능''': 다양한 함수 형태를 취할 수 있어, 특정 문제에 맞게 유연하게 설정하여 사용할 수 있다.
요약:
IT 위키에서의 모든 기여는 크리에이티브 커먼즈 저작자표시-비영리-동일조건변경허락 라이선스로 배포된다는 점을 유의해 주세요(자세한 내용에 대해서는
IT 위키:저작권
문서를 읽어주세요). 만약 여기에 동의하지 않는다면 문서를 저장하지 말아 주세요.
또한, 직접 작성했거나 퍼블릭 도메인과 같은 자유 문서에서 가져왔다는 것을 보증해야 합니다.
저작권이 있는 내용을 허가 없이 저장하지 마세요!
취소
편집 도움말
(새 창에서 열림)
둘러보기
둘러보기
대문
최근 바뀜
광고
위키 도구
위키 도구
특수 문서 목록
문서 도구
문서 도구
사용자 문서 도구
더 보기
여기를 가리키는 문서
가리키는 글의 최근 바뀜
문서 정보
문서 기록