
백신 휴가로 평일임에도 시간이 붕뜨게 되어 오랜만에 R과 관련된 글을 올려보려고 한다. 오늘은 KNN 알고리즘과 예제 문제를 하나 풀어보자. K-최근접이웃(K-Nearest Neighbors) 알고리즘은 범주형 결과를 위한 분류 문제나 수치형 결과를 위한 예측 문제에 사용될 수 있다. KNN의 아이디어는 학습 데이터세트로 부터 분류하고자 하는 새로운 레코드와 유사한 k개의 레코드를 식별하는 것으로부터 시작된다. 또한, 소속된 클래스(y)와 예측 변수들 x1, x2, x3,... 간의 관계에 대한 가정을 만들지 않는 분류 기법이다. KNN은 비모수적인 방법으로서, 미리 가정된 함수에 대한 모수 추정을 포함하지 않으며, 데이터세트간의 유사성으로 정보를 얻는다. 여기서의 이슈는 예측변수 값들에 기반하여 어떻게..
공부방
2022. 1. 14. 17:55