본문 바로가기

728x90

dataframe

(2)
파이썬_활용단계 ep.2 pandas를 써서 표 안의 원하는 것만 골라뽑기 인덱싱과 슬라이싱은 원하는 것만 골라 뽑는 인형뽑기 게임이라고 생각하는 건 어떨까요? 불필요한 것은 버리고 필요한 것만 싹 골라가는 능력은 중요합니다. 서론 ※ 주의 다소 반복적인 내용이 소개될 수 있습니다😂 다만 추후에 데이터 전처리나 다듬는 단계에서 기본기처럼 사용될 수 있으니 확실하게 알고 넘어가는 것이 중요할 것입니다! 🤷‍♀️ 다시 시리즈부터 확인해보겠습니다. Series 지난번에 시리즈는 인덱스 vs 값들의 리스트이 붙은 것임을 확인했었죠? 다시 한번 예시를 만들어보겠습니다. world_cup = pd.Series([1, 2, 3, 4], index=["프랑스", "아르헨티나", "크로아티아", "우루과이"]) world_cup 프랑스 1 아르헨티나 2 크로아티아 3 우루과이 4 dtype: ..
파이썬_활용단계 ep.1 Let's go pandas 월드 서론 pandas는 왜 쓰일까요? numpy와 pandas를 배운 순간 실질적으로 데이터 분석 작업에 한 걸음 가까워지게 됩니다. 마치 판다들이 대나무를 이용하는 것처럼 자유롭게 사용하는 것이 중요합니다. 자, numpy는 여러분이 다차원 배열 데이터를 다루는 라이브러리로 각종 행렬과 계산에 특성화했었죠? 이는 수학, 분석, 모델링 등에서 다양하게 활용됩니다. 우리가 다르는 데이터는 시계열(Series)와 표(Table)가 대부분으로, pandas에서는 이 series와 행, 인덱스, 열로 구분되어 있는 DataFrame을 다룹니다. 실제로 데이터를 다룬다는 느낌이 강할 것입니다. 준비 기본적으로 jupyter notebook을 쓰시는 경우 아래 명령어로 설치합니다. pip install pandas 그..

728x90