Architecturas | r knn 예제

r knn 예제

이 자습서에서는 Iris 데이터 집합을 예측 모델링의 예인 분류에 사용합니다. 데이터 집합의 마지막 특성인 종은 이 예제에서 예측하려는 대상 변수 또는 변수가 됩니다. 그럼에도 불구하고, 특히 기계 학습을 접하는 경우 정규화및 그 효과를 연구하는 것이 좋습니다. 예를 들어 먼저 사용자 고유의 정규화() 함수를 만들어 기능 정규화를 수행할 수 있습니다. 이것은 중대하다 – 당신은 범주형 변수와 예를 게시 할 수 있습니까? 레이블이 지정된 샘플 그룹이 여러 개 있다고 가정해 보겠습니다. 그룹에 있는 항목은 본질적으로 균일합니다. 이제 레이블이 지정되지 않은 여러 그룹 중 하나로 분류해야 하는 레이블이 지정되지 않은 예제가 있다고 가정합니다. 어떻게 해야 할까요? kNN 알고리즘을 사용하여 주저하지 않고. 예를 들어 데이터 집합에 X와 Y라는 두 개의 속성만 있고 X에 1에서 1000까지의 값이 있는 반면 Y에는 1에서 100까지만 이동하는 값이 있는 경우 거리 함수에 대한 Y의 영향은 일반적으로 X의 영향에 의해 압도됩니다. 예를 들어, 미스터리 소설을 좋아하는 고객 A가 왕좌의 게임과 반지의 제왕 책 시리즈를 구입했다고 가정해 봅시다.

이제 몇 주 후, 같은 장르의 책을 읽는 또 다른 고객 B는 반지의 제왕을 구입합니다. 그는 왕좌의 게임 책 시리즈를 구입하지 않습니다, 하지만 아마존은 고객 B를 추천하기 때문에 그의 쇼핑 행동과 책에서 자신의 선택은 고객 A. 2- 다른 변수는 다른 크기 조정 단위를 가지고, kg의 무게와 cm의 높이와 같은 다른 크기 조정 단위. 그렇다면 유클리드 공식에서 어떻게 사용해야 할까요? 음, 아래 예제에서도 볼 수 있는 수식(x-min(x))/(min(x) – max(x)))를 사용하여 각 변수를 정규화합니다. 이제 200kg의 변수가 하나 있고 다른 변수가 50kg인 경우 정규화 후 둘 다 0과 1 사이의 값으로 표시됩니다. 0과 1 의 범위만 보유 할 수있는 상자를 만들었다고 가정하지만 정규화 수식을 사용하여 모든 것을 0과 1 사이의 값으로 변환했으므로 해당 상자를 사용하는 것이 좋습니다. 참고: 해당 상자는 플롯입니다. knn() 다음 데이터 프레임 prc_test_pred에 할당 되는 테스트 데이터 집합에서 각 예제에 대 한 예측 된 레이블의 요인 값을 반환 합니다.이 문서에서, 흥미로운 예제와 사례 연구를 사용 하 여 kNN 알고리즘을 설명 했습니다. 모델을 빌드할 때 kNN 알고리즘을 적용합니다. 기계 학습은 학습할 수 있는 알고리즘의 설계를 연구하는 컴퓨터 과학분야입니다. 일반적인 기계 학습 작업은 개념 학습, 기능 학습 또는 « 예측 모델링 », 클러스터링 및 예측 패턴 찾기입니다.

이러한 작업은 예를 들어 경험이나 지침을 통해 관찰된 사용 가능한 데이터를 통해 학습됩니다. 기계 학습은 경험을 작업에 포함하면 결국 학습이 향상되기를 희망합니다. 궁극적인 목표는 자신과 같은 인간이 더 이상 간섭할 필요가 없도록 자동적인 방식으로 학습을 개선하는 것입니다. 예를 들어 ggvis 패키지로 산점도를 만들 수 있습니다. 이러한 변수 중 일부는 신청자의 대출을 예측하는 데 필수적이지 않습니다(예: 전화, 동시 와 같은 변수). 크레딧, 기간.in.Current.주소, 아파트유형 등 이러한 변수는 기계 학습 모델의 복잡성만 증가하므로 제거해야 합니다. 간단한 예제로 KNN 알고리즘을 이해해 보겠습니다.