ADSP에 출제되는 주요 개념에 대한 정리 입니다
이번 시간에는 ADSP(데이터 분석 준전문가) 준비 중 헷갈리거나, 자주 출제되는 개념을 정리하던 중
따로 찾은 부분입니다.
정상성 가정에 대해서 살펴보도록 하겠습니다.
위의 9가지 그래프를 먼저 보겠습니다.
a부터 i까지 정말 다양한 형태가 존재합니다.
(a), (i)처럼 우상향을 보이는 그래프도 존재하고, (e), (c)와 같이 우하향을 보이는 차트도 있습니다. frequency가 빽빽한 그래프, frequency가 일정한 형태를 보이는 그래프 등등 패턴도 다양합니다.
그렇다면 이중에서 정상성을 보이는 그래프는 어떤 것일까요?
바로 (b)와 (g) 입니다.
정상성은 시간에 따라서 특정한 추세가 없고, 옛날 = 현재 = 미래의 분산이 같아야 합니다.
평균도 일정합니다.
정상성은 이제 약한 정상성과 강한 정상성으로 나눌 수 있는데, 더욱 강렬하게 동일한것이 강한 정상성이라고 보면 좋겠네요.
강한 정상성 : 시간 축을 k만큼 이동해도 모든 n에 대하여 결합확률밀도함수가 동일하다.
약한 정상성 : 확률과정이 유한한 2차 적률을 갖고 , 기댓값과 분산이 시점 t와 무관하게 항상 일정하며 자기공분산이 시점 t가 아닌 시차 k에 의존한다.
우리는 강한 정상성을 현실에서 거의 찾아볼 수 없습니다. 추상적으로만 존재할 수 있겠습니다.
하지만 약한 정상성은 어느정도 완화된 조건이기 때문에 찾아볼 수 있습니다.
요컨대 백색 소음의 주파수 그래프를 측정한 것이 아래와 같은데요.
대표적인 정상성으로 판단할 수 있는 그래프 중 하나 입니다.
또다른 정의
모든 시점 t에 대해 일정한 평균을 갖는다
모든 시점 t에 대해 일정한 분산을 갖는다
자기 공분산은 시점 t에 의존하지 않고 시차 l에 의존한다.
시점은 관측 당시의 시간(정지!)인 것입니다.
시차는 관측값 a와 그 다음에 오는 관측값 b의 시간의 차이(빼기!) 입니다.
이를 만족하는 것을 약한 정상성을 띈다고 말합니다.
또한 정상성은 가설 검정을 통해서도 확인할 수 있습니다.
귀무가설 - 인코덤, 생물정보 전문위키 (incodom.kr)
귀무가설을 기각한다 = 정상성을 띈다
즉 p-value가 분포곡선에서 오른쪽 끝 부분에 위치해야 합니다. 가설의 유의수준보다 작아야 되는 것이죠.
이렇게 플롯의 형태는 물론, 가설검증을 통해서도 정상성인지, 아닌지 판단할 수 있습니다.
'필기정리 > 스터디노트' 카테고리의 다른 글
[ADSP] 2023년도 1회 (36회차) ADSP 시험 복기 및 후기 (0) | 2023.02.26 |
---|---|
[ADSP] 데이터 웨어하우스와 마트에 관하여 (0) | 2023.02.24 |
[ADSP] 데이터 분석기획 개념 - 데이터 거버넌스에 대하여 (0) | 2023.02.23 |
[ADSP] R프로그램 명령어와 형식에 관하여 (0) | 2023.02.22 |