본문 바로가기

728x90

sklearn

(4)
[Machine Learning] 결정트리_회귀(Regression) 실습 사례- 보험비 서론 보험료는 우리 삶에 큰 영향을 끼치는 중요한 수치 중 하나입니다. 어떤 요소가 보험료에 영향을 미치고, 어떤 것이 보험료를 낮추는지 알아맞춘다면 여러분이 더 윤택한 삶을 사는데 도움을 주겠죠? 질병의 있고 없음이 보험료에 영향을 미칠까요? 성별이 영향을 미칠까요. 혹은 흡연 여부가 영향을 미칠까요? 이름이 영향을 미치진 않을까요? 이번 시간에는 지난번에 했던 Decision Tree를 이용하여, 범주형 데이터가 아닌 연속형 데이터를 사용하여 회귀 문제로 해외 건강보험에 대한 실제 사례를 분석해보겠습니다. 원본 csv 데이터는 캐글의 insuarance 데이터로, 짧은 크기에 feature를 갖고 있는 데이터 프레임 입니다. 아래 원본 링크에서 보실 수 있습니다. https://www.kaggle.c..
[Machine Learning] 결정트리 알고리즘 분류 실습사례_wine 서론 얼마 있으면 이쁜 트리가 거리에서 많이 보이는 크리스마스가 시작되네요! 이번 시간에는 지난번 실시했던 똑같은 wine csv 파일을 통해 결정트리 문제를 진행해보겠습니다. 원본은 동일한 csv파일이고, 분류하는 알고리즘만 변형시킨 것입니다. 목표는 각 feature별로 조건이 분기되는 트리를 만드는 것입니다. 분류문제의 평가 점수를 계산한 후에, plot_tree를 통해 시각화가 어떻게 구현되는지 보게될 것입니다. 마찬가지로, 실습을 서술한 글이기 때문에, 오류와 오판이 있을 수 있음에 양해 드립니다 먼저 결정트리(Decision Tree)란 무엇인지 간단하게 보겠습니다. Decision Tree 개념 기본적으로 분류 문제와 회귀 문제를 해결하는 툴로 나뉩니다. 분류문제를 DecisIon Tree ..
[Machine Learning] KNN 알고리즘 실습사례_wine 분류2_solution 서론 지난 글에서 필자가 KNN 알고리즘의 낮은 점수(accuracy_score)로 인해 문제점이 있다고 밝힌 바 있습니다. 스케일링에 대한 부분이 비어있었기 때문인데요. 이번 게시글에서는 Standard Scaler 대신 MinMax Scaler(최소-최대 스케일링)을 통해서 낮은 점수를 해결하도록 노력하겠습니다!💪 지난 시간 링크 : https://astart.tistory.com/34 [Machine Learning] KNN 알고리즘 실습사례_wine 분류 KNN Algorithm 간단하게 시작하자면 K개의 이웃(Neighbors)한 점들을 인접한(Nearest) 영역에서 포집시키는 방법입니다. KNN 알고리즘은 비교적 합리적이고 유용한 방식은 아니지만, 빠르고 쉬우며 분류나 astart.tisto..
[Machine Learning] KNN 알고리즘 실습사례_wine 분류 KNN Algorithm 간단하게 시작하자면 K개의 이웃(Neighbors)한 점들을 인접한(Nearest) 영역에서 포집시키는 방법입니다. KNN 알고리즘은 비교적 합리적이고 유용한 방식은 아니지만, 빠르고 쉬우며 분류나 회귀, 두 분석에서 모두 사용되지만 분류에서 자주 사용됩니다. 단 아웃라이어(outlier)에 매우 취약하다는 약점도 있습니다. 원본 csv파일은 데이터분석 공모전 사이트 kaggle.com에서 받아왔다는 점을 알립니다. 원본 : Wine_data | Kaggle Wine_data UCI Wine Dataset for Classification www.kaggle.com 본 게시글에서는 데이터 분석의 지도용 파일이 아닌 실습 파일로 구성되어 있습니다. 오류나 오독이 존재할 수 있으니,..

728x90