본문 바로가기

빅분기(빅데이터분석기사)

빅데이터분석기사 실기 후기

오늘(2021-0-19) 빅데이터 분석기사 실기 시험을 보고 왔다 
올해 처음으로 Python을 공부하기로 정하고 공부 방법의 일환으로 빅분기에 도전했다.

오늘은 간단한 시험 문제유형을 기록하고, 간단한 복기문제를 추가하도록 할 예정

. 총 14문제( 10, 단답형, 3 간단 풀이, 1: 모델)

  • 단답형(10문제)-- ADsP 보다 약간 쉽다는 느낌(기술한 답변 기준)
    • outlier
    • 변수선택법-후진제거법
    • 결측치-평균대치법
    • 앙상블-부스팅
    • 비지도 학습
    • 하이퍼파라미터
    • 부스팅 중 테이블 형식, 약한 ..Adaboost
  • 간단풀이
    • 결측치 보정
      • 특정필드의 결측지를 median으로 보정하자
      • 보정 전후 해당 필드의 표준편차의 차이를 구하라 (보정전 표준편차 - 보정후 표준편차)
    • 순위 및 특정 조건 fiter 이후 합계(잘 이해 못함)
      • col1을 순위값(Rank)으로 변경하고, Age값이 80인 이상인 필드의 col1의 평균을 구하시오,,
    • 표준편차
      • 전체 데이터프레임의 80%을 Train으로 분리하라 (size의 80%로 했음)
      • 분활된 특정필드의 표준편차는?
  • 모델링
    • Classification 문제
    • 결측치는 없었음
    • 범주형 자료가 5개 정도(순위, 단순 구분...)
    • RandomForestClassifier을 자동시 63%정도의 roc_auc  Score 나왔음