아침에 빅분기 2회 필기시험을 보고 글을 적는다.
시험장 분위기는
- 응시율은 50% 이하, 옆반도 비슷 (다른 시험장에 비해 빈자리가 많음)
- 시험시간은 충분함 (100% 객관식)
- 시험장 입구에 "데이터분석"시험이라고 안내하고 있었음 ==> 나올 때 사진을 찍으려고 했는데, 이미 정리된 상태
- 문제에 R/ Python 코드(예시)는 없음
시험이후 생각나는 keyword (무작위 순서)
- Confusion Matrix관련 문제가 3~4개 정도
- F1 계산 방식: Recall, Precision
- TP(True Positive), FP(False Positive)에서 TP 비율을 계산하라고 ==> 처음 접하는 부분임
- TP에 관측치가 있는데, TP비율이 전체 Positive(예측치)중 True인지, 실제 True에서 TP인지..
- Confuation Matrix로 구하지 못하는 것 : AUROC 라고 답변
- 또 하나 더 있는데...
- 파라미터 vs. Hyper Parameter 2문제
- Hyper의 종류
- 분석주제유형
- 분석 대상도 알고 있고, 분석 방식도 알고 있다 ==> Optimization
- 빅데이터 분석 방법 절차(책과는 용어가 조금 다른데..)
- 분석 기획 --> 데이터 준비 --> 데이터 분석 --> 시스템 구현 --> 평가 및 전개
- 회귀분석 잔차의 가정
- 등분산성, 독립성 ...
- 선형성(잔차의 가장이므로 선형성에 체크했는데,..)
- 변수 선택법
- 후진 제거법(backwoard Elimination)
- 시계열의 4가지 그래프를 보여주고 없는 것 고르는 문제(STL 그래프 인가)
- 원 데이터 그래프 , 계정성 트렌드 그래프 ,...
- 전차 관련이 없는 내용이라고 답변했는데,,.
- 주제 지향적 분석(?)
- 앙상블
- 계산문제 3~4
- 최대우도??? 계산하라
- z-분포 구간 계산하기 (n, 시그마, 유의 확률 주어지고 신뢰구간 계산하기)
- T-통계표(?) 보여주고 고르기
- 가로, 세로 기준선 선택하는 방법 (단측 검증이었음)
- 시각화: 그래프 모양 설명하고 선택하기(2~3문제)
- 인포그래픽
- 베이즈 정리
- 2개의 그룹, 각 확률
- 조건부 확률을 베이즈 정리의 표현식으로 변경해라
- CNN 에서
- 5*5 의 뭐시기 에서 3*3이면 무엇은 얼마인가 (*이해 못했음)
- 교차검증
- 홀드 아웃 관련 1문제
- K-Fold Cross Validation : 순서
- L1 + L2 합친 규제 ..
- 가명처리 + 개인정보 보호(2~3문제)
- 개인정보 미 통보 대상은?
- ETL
- 파생변수
- 불규형 데이터 처리
'빅분기(빅데이터분석기사)' 카테고리의 다른 글
빅데이터분석기사 실기 후기 (0) | 2021.06.19 |
---|