본문 바로가기

필기정리/스터디노트

[ADSP] 2023년도 1회 (36회차) ADSP 시험 복기 및 후기

320x100


이번주에는 ADSP 36회차 시험이 있는 주간이었습니다. 
이에 필자또한 ADSP 개념들을 주로 정리해왔고, 오늘 시험을 치루고 왔습니다.


시험의 결과나 필자의 소감을 말하기에 앞서서 일단 ADSP의 다음 회차를 준비하시는 분들이나
이 시험을 준비할까? 말까? 에 대해서 생각하고 있는 분들을 위해서 2023년 1회차 복기부터 시작하겠습니다.

 

시험 일자는 2월 26일(일), 가채점 일자는 3월 17일(금)으로 예정되어 있습니다. 
3주 정도의 준비 기간이 있습니다.

 


1과목 [데이터 이해]
일단 단답형은 기출문제에서 제시되는 단어들을 약간 변형하거나, 재서술 하는 방식으로 나왔습니다
답 자체는 사물인터넷과 블록체인 이었는데요. (3월 17일 가채점 이후 수정 예정)
물론 다음 회차에서는 그대로 외우면 안되겠지요. 단순히 지난 몇년간의 기출을 외우는 수준으로는 어렵습니다.
암묵지와 형식지의 개념에 대해 묻는 문제도 나옵니다. 데이터 웨어하우스에 대해서 설명하는 부분도 있구요. 상향식 분석과 하향식 분석 구조에 대해서도 넘어가선 안될 것 입니다. 한 문제씩은 출제됩니다.



2과목 [데이터 분석 기획]
2과목부터 슬슬 신유형 출몰에 발동이 걸립니다. 아예 처음 제시되는 문제도 나오고, 단어 자체가 바뀌는 유형도 있습니다. 분석대상은 알고, 분석 방법은 모르는 경우에 대해서 묻는 문제 나옵니다. 분석 과제 정의서와 분석 마스터 플랜에 대한 개념도 물어봅니다.
단답형에서는 ROI 관점에서 빅데이터의 핵심 특징이 나오는데요. 4v 중에서 비즈니스 효과와 관련된 것, 데이터 분석과제 추진시 우선순위 평가 기준에 대해서 나옵니다.
필자의 경우 첫번째, value는 기억했지만 두번째 문제인 시급성은 전혀 기억을 못했습니다.
2과목은 정말 결과를 봐야 승패여부를 알 수 있을 것 같습니다.

ADSP 오픈카톡방에서도 단답식에서 의외의 문제라고 당황하신 분 종종 있었습니다.



3과목 [데이터 분석]

3과목, 정말 만만치 않습니다. 데이터 분석에서 고비가 될 것으로 보입니다.
아마 과락이 되지 않았을까 예상되는데요.
세가지 정도로 나눠보겠습니다.


1) R 언어


R 언어 부분 정말 꼼꼼하게 보아야 합니다. 일단 summary에 대해서 데이터를 자유롭게 분할, 선택하는 유형이었고, 기출에선 보지못한 아예 처음보는 형태가 나옵니다.
data에 무엇이 들어가는지, 선형형태를 띌지, 유의적으로 판단해야 할지 정확하게 알아야 풀 수 있습니다. (모르면 아예 소거법을 하기조차 어렵습니다)
lm() 함수가 나오는데 시험보는 시점에서는 필자도 알 수 없었습니다.


2) 각종 통계와 모델문제


통계 문제 역시 R이나 단답형보단 나은 수준이지만 쉽진 않습니다. 군집 분석의 경우에는 PAM과 같은 새로 등장한 용어도 있었고, 인공신경망의 경우 시그모이드 함수의 결과가 무엇인지 묻는 유형도  있었습니다. 재현율과 정밀도도 당연히 출제되었고, 왜도 개념도 확인했습니다.(mean vs median)


3) 단답형 문제


단답형 문제는 카톡방에서 나온 의견을 참조했을때 
- 자기회귀모형
- 랜덤포레스트
- confusion matrix를 제시하고 f1 스코어를 직접 계산하는 문제(분수)
- decision tree를 제시하고, 가지가 분리되는 기준을 작성하는 문제(3, 8)
- 평균과 표준편차를 제시하고 상위 2%의 점수를 맞추는 문제
- 집합의 기댓값과 확률변수 1개의 확률만 알려주고, 다른 확률을 계산하는 문제
이렇게 답안이 나왔습니다. 다섯번째 문제와 여섯번째 문제가 난이도가 높았다는 의견이 많았습니다. 특히 수능시험을 볼때, 확률과 통계 부분을 하지 않은 문과의 경우에는 표준편차를 활용해서 상위권 점수를 직접 계산하는 문제는 전혀 대응을 못했을 것이라 예상됩니다.


결론적으로, 다른 자격증 필기시험 처럼 단순히 기출문제만을 파고드는 것은 당락을 결정하는데 큰 도움이 안됩니다. 

 

물론 감을 익히기 위해서 기출을 아예 무시해서는 안되겠지요. 하지만 여러 머신러닝 모델과 딥러닝 모델이 영어를 기본으로 하는 만큼, 한글 해석이 다르게 나타날 수 있기 때문에 모델에 대해 정확히 이해하는 학습이 필요합니다.

특히 R의 summary의 경우 직접 찍어보는 수준의 학습이 필요합니다. 시험을 보고온 분들의 의견이 상당히 분분한 유형이었습니다.

 

2023-04-02. 1차 수정

3월 24일 공고된 내용입니다.
데이터 이해 20점, 데이터 분석 기획 12점, 데이터 분석 32점으로, 후기에서의 예상과는 조금 다르네요.

일단은 합격입니다. 앞으로도 데이터 분야에서 추가적인 스터디를 진행해야겠습니다.

 

 

728x90