본문 바로가기

728x90

머신러닝/비지도학습

(2)
[Machine Learning] 해외 IT직종 근무자 Layoff 분석_KMeans Kaggle 데이터셋 중 Technology Company Layoffs(2022-2023) 을 분석한 자료입니다. 이번 시간에는 캐글 데이터를 확인하던 중, 최근에 올라온 흥미로운 데이터셋이 있어 몇가지 확인해보고, 비지도학습을 넣어볼 예정입니다. 미래의 우리와 관련이 있을 수도 있는 Technology company의 근무자 중 layoff 상태가 된 인원의 분석입니다. layoffs는 기업측의 사정으로 인해 일시적 해고를 의미합니다. 여기서는 '정리해고'나 '구조조정' 정도의 의미로 통할 수 있습니다. 안타깝게도 한국의 사례는 없고 미국과 캐나다, 일부 유럽의 사례를 조사한 데이터입니다. 현재 기준, 제출된지 하루 밖에 되지않은 따끈따끈한 통계자료입니다. 잦은 구조조정은 우리나라만의 문제는 아니었군..
[Machine Learning] PCA + Dimension 축소 학습 서론 이전까지 머신러닝의 모델에서는 어느정도 column들이 정제된, 즉 피쳐가 보기좋게 들어가있는 모델들을 확인해보았습니다. 하지만 현실에서 마주하는 여러가지 상황에서, 우리는 column들이 항상 잘 정제되어 있는 데이터만을 보긴 어렵습니다. 종종 변수가 연관관계를 지닐지, 지니지 않을지 정말 구분하기도 어려운 데이터프레임을 볼 때도 있습니다. 이러한 상황에서, 우리는 규칙성이 없던 것에 규칙성을 만들어보려고 하는 여러가지 시도들을 해보게 됩니다. 그러한 시도들 중의 하나가 바로 PCA 입니다. Principal Component Analysis 본 글은 공돌이의 수학정리노트 에서 영감을 받았습니다. ▼링크 https://angeloyeo.github.io/2019/07/27/PCA.html 주성분 ..

728x90