본문 바로가기

728x90

pandas

(3)
파이썬_활용단계 ep.2 pandas를 써서 표 안의 원하는 것만 골라뽑기 인덱싱과 슬라이싱은 원하는 것만 골라 뽑는 인형뽑기 게임이라고 생각하는 건 어떨까요? 불필요한 것은 버리고 필요한 것만 싹 골라가는 능력은 중요합니다. 서론 ※ 주의 다소 반복적인 내용이 소개될 수 있습니다😂 다만 추후에 데이터 전처리나 다듬는 단계에서 기본기처럼 사용될 수 있으니 확실하게 알고 넘어가는 것이 중요할 것입니다! 🤷‍♀️ 다시 시리즈부터 확인해보겠습니다. Series 지난번에 시리즈는 인덱스 vs 값들의 리스트이 붙은 것임을 확인했었죠? 다시 한번 예시를 만들어보겠습니다. world_cup = pd.Series([1, 2, 3, 4], index=["프랑스", "아르헨티나", "크로아티아", "우루과이"]) world_cup 프랑스 1 아르헨티나 2 크로아티아 3 우루과이 4 dtype: ..
파이썬_활용단계 ep.1 Let's go pandas 월드 서론 pandas는 왜 쓰일까요? numpy와 pandas를 배운 순간 실질적으로 데이터 분석 작업에 한 걸음 가까워지게 됩니다. 마치 판다들이 대나무를 이용하는 것처럼 자유롭게 사용하는 것이 중요합니다. 자, numpy는 여러분이 다차원 배열 데이터를 다루는 라이브러리로 각종 행렬과 계산에 특성화했었죠? 이는 수학, 분석, 모델링 등에서 다양하게 활용됩니다. 우리가 다르는 데이터는 시계열(Series)와 표(Table)가 대부분으로, pandas에서는 이 series와 행, 인덱스, 열로 구분되어 있는 DataFrame을 다룹니다. 실제로 데이터를 다룬다는 느낌이 강할 것입니다. 준비 기본적으로 jupyter notebook을 쓰시는 경우 아래 명령어로 설치합니다. pip install pandas 그..
파이썬_응용단계 ep.2 Numpy 튜토리얼 서론 추후 Pandas를 원활하게 쓰기 위해, numpy는 중간단계로서 거쳐갑니다. 왜 numpy가 필요하다고 했죠? 강력한 행렬 조작, 연산을 시작할 수 있기 때문에 필요하다고 했습니다. 즉, 목적지가 아닙니다. 위로 올라가기 위한 단계이기 때문에 기능과 계산식들을 눈에 익히고 올라가는 것만으로도 충 분🔥 합니다. 들어가기 전에 100원짜리 동전을 넣고 돌릴 수 있는 오락실 게임이 유행한 적이 있습니다. 2000년대~ 2010년대쯤, 초등학교 앞에서는 분식집과 함께 조이스틱으로 되어있는 게임기들이 우리들의 시선을 강타했죠. 심지어 100원짜리 콩알 캔디가 게임기 안에 들어있어서, 게임을 하다가 허기질 때는 먹을것도 충족시켜주었죠? 우리의 시각적 쾌락과 미각적 쾌락을 동시에 충족시켜주는 멋진 도구임에는 ..

728x90