본문 바로가기

728x90

머신러닝/지도학습

(16)
[Machine Learning] KNN 알고리즘 실습사례_wine 분류2_solution 서론 지난 글에서 필자가 KNN 알고리즘의 낮은 점수(accuracy_score)로 인해 문제점이 있다고 밝힌 바 있습니다. 스케일링에 대한 부분이 비어있었기 때문인데요. 이번 게시글에서는 Standard Scaler 대신 MinMax Scaler(최소-최대 스케일링)을 통해서 낮은 점수를 해결하도록 노력하겠습니다!💪 지난 시간 링크 : https://astart.tistory.com/34 [Machine Learning] KNN 알고리즘 실습사례_wine 분류 KNN Algorithm 간단하게 시작하자면 K개의 이웃(Neighbors)한 점들을 인접한(Nearest) 영역에서 포집시키는 방법입니다. KNN 알고리즘은 비교적 합리적이고 유용한 방식은 아니지만, 빠르고 쉬우며 분류나 astart.tisto..
[Machine Learning] KNN 알고리즘 실습사례_wine 분류 KNN Algorithm 간단하게 시작하자면 K개의 이웃(Neighbors)한 점들을 인접한(Nearest) 영역에서 포집시키는 방법입니다. KNN 알고리즘은 비교적 합리적이고 유용한 방식은 아니지만, 빠르고 쉬우며 분류나 회귀, 두 분석에서 모두 사용되지만 분류에서 자주 사용됩니다. 단 아웃라이어(outlier)에 매우 취약하다는 약점도 있습니다. 원본 csv파일은 데이터분석 공모전 사이트 kaggle.com에서 받아왔다는 점을 알립니다. 원본 : Wine_data | Kaggle Wine_data UCI Wine Dataset for Classification www.kaggle.com 본 게시글에서는 데이터 분석의 지도용 파일이 아닌 실습 파일로 구성되어 있습니다. 오류나 오독이 존재할 수 있으니,..
선형회귀 ep2. 결정계수에 관하여 지난 글에서와 같이, 선형회귀에서는 예측값과 실제값 사이의 차이, 즉 오차들을 보고 모델의 성능을 결정한다고 언급했습니다. 이번에는 이 오차들에 대한 부분입니다. SSR과 SST에 대한 용어는 공식이 들어있지 않는한, 용어 자체에 대한 정의가 쟁점인 것 같습니다. 용어에 대해서 탐구하는 것이 머신러닝이나 회귀분석에서 없어선 안될 요소는 아니기 때문에, 이런 것이 존재한다는 것만 이해하고 넘어가겠습니다. 필자는 아래 티스토리(씩씩한 IT 블로그)님의 글을 참고했습니다. https://sosoeasy.tistory.com/371 R² 의 공식에 대하여 먼저 SSE부터 볼까요 천천히 설명해보겠습니다. SSE는 Sum of Squares estimate of Error 입니다. 일반적으로 설명이 안되는 변동이라..
Machine Learning ep.1 선형회귀 기초개념 & 마을의 보험료 예측 선형회귀란? 우리의 일상에서는 많은 지표와 숫자들이 있습니다. 지표와 숫자, 개체와 갯수, 데이터와 데이터 등의 관계에서 관계를 찾을 수도 있는데요. 이것이 저것을 불러오고, 어떤 것이 저런 것을 가져오는, 일종의 인과관계 를 상상할 수도 있습니다. 선형회귀는 여러가지 데이터들을 활용하여 연속형 변수인 목표 변수를 예측하는 것이 목적입니다. 즉, 연속된 변수를 우리가 예측하는 최적의 직선 그것을 찾는 알고리즘이 바로 선형 회귀 (Linear Regression) 입니다. 선형 회귀는 머신러닝의 기초적인 알고리즘 입니다. 복잡한 알고리즘에 비해 예측력이 떨어지지만 데이터의 특성이 복잡하지 않을 땐 더 쉽고 빠른 예측이 가능하기 때문에 자주 사용됩니다. 선형 회귀는 다른 모델과의 성능을 비교하는 기준 모델로..

728x90