본문 바로가기

728x90

numpy

(9)
파이썬_활용단계 ep.1 Let's go pandas 월드 서론 pandas는 왜 쓰일까요? numpy와 pandas를 배운 순간 실질적으로 데이터 분석 작업에 한 걸음 가까워지게 됩니다. 마치 판다들이 대나무를 이용하는 것처럼 자유롭게 사용하는 것이 중요합니다. 자, numpy는 여러분이 다차원 배열 데이터를 다루는 라이브러리로 각종 행렬과 계산에 특성화했었죠? 이는 수학, 분석, 모델링 등에서 다양하게 활용됩니다. 우리가 다르는 데이터는 시계열(Series)와 표(Table)가 대부분으로, pandas에서는 이 series와 행, 인덱스, 열로 구분되어 있는 DataFrame을 다룹니다. 실제로 데이터를 다룬다는 느낌이 강할 것입니다. 준비 기본적으로 jupyter notebook을 쓰시는 경우 아래 명령어로 설치합니다. pip install pandas 그..
파이썬_응용단계 ep.8 난수와 샘플링, 데이터 카운팅! 서론 난수? 임의의 수? 우리가 일반적으로 난수를 발생시킬 때, 정말 무작위로 컴퓨터 내에서 아무거나 뽑아내는 것이라고 생각하는 경향이 있습니다. 무작위란 무엇일까요? 랜덤이란 굉장히 인간적인 개념일지도 모릅니다. 수학이나 통계에서 의도가 들어가지 않은 것이나, 말그대로 규칙성을 아예 갖지 않는 것은 우리가 포착하기 어렵습니다. 컴퓨터 프로그램에서 발생하는 무작위의 수는 사실 엄격한 의미의 무작위가 아닙니다. 우리가 난수를 뽑을 때면 컴퓨터는 일련의 작업을 거칩니다. 어떠한 특정한 시작 숫자를 정해주면 컴퓨터가 정해진 알고리즘에 의해 마치 난수처럼 보이는 수열을 생성할 수 있는데요. 이를 시드(seed)라고 합니다. 이번 시간에는 numpy에서 난수와 샘플링에 대해서 알아봅니다. 난수 발생과 카운트 np..
파이썬_응용단계 ep.7 정렬과 통계 서론 우리는 어지러이 던져져있는 서류 뭉치들을 보다가 누군가에 의해 잘 정리된 서류철을 볼때면 어딘지 모르게 마음이 편안 해질 때가 있습니다. 마찬가지로 잘 정렬된 마린 한 부대는 마음이 편하게 합니다. 전술적으로도 유용하구요! 🙈 이번 일곱번째 시간에는 numpy에서 배열의 정렬과 기술통계를 확인하고 통계에서 쓰이는 공식에 대해서 짧게 설명하겠습니다. 개념적인 내용이 나오지만 수학에 대해서 깊게 알고갈 필요는 없기 때문에, 이러한 기능이 있다는 사실만 알고 있다면 충분합니다. sort. 정렬 행렬 안에 있는 수를 일관되게 정리하는 함수입니다! 2차원 이상인 경우에는 행 혹은 열을 따로따로 정렬합니다. 구조 sort(x, axis) axis의 값에 따라 구분됩니다. axis = 0 (세로) 위에서 아래로..
파이썬_응용단계 ep.6 배열의 연산 2차원 그리드 포인트 생성 지난 시간에 대한 추가부분입니다. 변수가 2개인 2차원 함수를 그래프를 그리거나, 표를 작성할 때 사용하는 2개의 좌표값 쌍을 그리드 포인트라고 합니다. (x,y) = (0,0), (0,1), (0,3), (0,4), (1,0), (2,0) .... (2,4) numpy의 meshgrid는 사각형 영역을 구성하는 가로축의 점들과 세로축의 점들을 나타내는 두 벡터를 인수로 받아서 사각형 영역을 이루는 조합을 출력 합니다. x = np.arange(3) y = np.arange(5) x,y (array([0, 1, 2]), array([0, 1, 2, 3, 4])) X, Y = np.meshgrid(x,y) X array([[0, 1, 2], [0, 1, 2], [0, 1, 2],..
파이썬_응용단계 ep.5 배열의 연결과 분할 서론 배열을 연결하는 부분에서는 다량의 실습용 코드들이 등장하게 됩니다. 사실 이전부터 원래도 많긴 했지만 더욱 많아지게 됩니다! 이론을 열심히 배우는 것도 중요하겠습니다. 하지만 손으로 직접 쓰는 것만큼 더 좋은 공부방법도 없겠죠?! 직접 해보는 것과 열심히 보는 것은 다릅니다. 짜릿한 익스트림 자전거 처럼요! 자 먼저 concatenate 부터 시작합니다 🙌 배열의 연결 행의 수나 열의 수가 같은 두 개 이상의 배열을 연결하여 더 큰 배열을 생성합니다. 리스트 자체는 + 연산자를 통해 합치는 것이 가능합니다. [1,2] + [3,4] [1, 2, 3, 4] 다만, 이를 ndarray에서 진행하면, 벡터화 연산이 되어 버립니다. arr1 = np.arange(1,4) arr2 = np.arange(4,..
파이썬_응용단계 ep.4 생성과 변형, 전치 서론 무한한 것과 랜덤한 것은 많은 의미를 갖고 있습니다 무한을 품고 있는 것은 어떤 것들이 있을까요? 무한히 늘어나는 우주와 별, 항성들도 있구요. 무한히 멀어지는 은하와 은하 사이의 거리, 우주의 시작점에서부터 멀어지는 시간들도 있습니다. 무한히 빵을 먹어도 줄지 않는 제 식욕도 있을 겁니다. 무작위성을 품고 있는 것들은 어떤 것이 있을까요? 무작위로 쏟아지는 카지노 칩과 카드게임의 결과, 바둑에서의 수만가지 경우의 수들도 있습니다. 비가 오면 사방으로 떨어지는 물방을이 내 옷에 튀는 위치, 번개가 떨어지는 지면의 위치, 로또 복권의 당첨자 등 랜덤한 것들은 일상에서도 쉽게 찾아볼 수 있습니다. 무한히 커지는 것과 랜덤한 것의 공통점이 있다면 그것이 인간의 상상력을 자극하고, 계속 도전하게 만든다는 ..

728x90