전체 글 (7) 썸네일형 리스트형 빅데이터분석기사 실기 후기 오늘(2021-0-19) 빅데이터 분석기사 실기 시험을 보고 왔다 올해 처음으로 Python을 공부하기로 정하고 공부 방법의 일환으로 빅분기에 도전했다. 오늘은 간단한 시험 문제유형을 기록하고, 간단한 복기문제를 추가하도록 할 예정 . 총 14문제( 10, 단답형, 3 간단 풀이, 1: 모델) 단답형(10문제)-- ADsP 보다 약간 쉽다는 느낌(기술한 답변 기준) outlier 변수선택법-후진제거법 결측치-평균대치법 앙상블-부스팅 비지도 학습 하이퍼파라미터 부스팅 중 테이블 형식, 약한 ..Adaboost 간단풀이 결측치 보정 특정필드의 결측지를 median으로 보정하자 보정 전후 해당 필드의 표준편차의 차이를 구하라 (보정전 표준편차 - 보정후 표준편차) 순위 및 특정 조건 fiter 이후 합계(잘 .. 2회 빅데이터분석기사 필기 시험을 마치고 아침에 빅분기 2회 필기시험을 보고 글을 적는다. 시험장 분위기는 응시율은 50% 이하, 옆반도 비슷 (다른 시험장에 비해 빈자리가 많음) 시험시간은 충분함 (100% 객관식) 시험장 입구에 "데이터분석"시험이라고 안내하고 있었음 ==> 나올 때 사진을 찍으려고 했는데, 이미 정리된 상태 문제에 R/ Python 코드(예시)는 없음 시험이후 생각나는 keyword (무작위 순서) Confusion Matrix관련 문제가 3~4개 정도 F1 계산 방식: Recall, Precision TP(True Positive), FP(False Positive)에서 TP 비율을 계산하라고 ==> 처음 접하는 부분임 TP에 관측치가 있는데, TP비율이 전체 Positive(예측치)중 True인지, 실제 True에서 T.. 차원축소_변수선택, 변수추출(PCA, LASSO, Ridge,..) ADP의 변수 선택법 관련 준비하면서 정리한 내용입니다. 첨부한 HTML파일을 참고하세요.(혹시 설명에 오류가 있으면 연락주세요) 주요 작성한 내용입니다 2.4.0 Variable selection method 0: Logistic Regression with all variables(모든 변수 적용) 2.4.1: Forward selection(전진선택법) 2.4.2 Variable selection method 2: Backward elimination(후진 제거법) 2.4.3: Stepwise selection(단계적 선택법) 2.4.4 Variable selection method 4: Genetic Algorithm(유전 알고리즘) 2.4.5 Shrinkage method 1: Ridge log.. R_스크래핑 scraping[영화 평점, 게시판, 논문 초록] 고려대 스크램블 강의내용 정리 myinno 2021 1 30 개요 Part 1: XPath with XML Part 2: 연구논문 (arXiv Papers) Part 3: 영화평점 (IMDB Top 50 Movies) Part 4: 한글Page:ppomppu 개요 고려대 강의 정리(youtube) - 강필성 교수 2020년도 2학기 고려대학교 산업경영공학부 데이터분석을 위한 프로그래밍 언어 (R) [Korea University] Programming Language for Data Analytics (Undergraduate) KoreaUniv DSBA _ 06-1 ~ 06-4) 06-1: Web Scraping - Backgrounds 8 시간 강의를 들으면 R로 Scraping 전문가 익숙하지 않아.. 19회 ADP 실기 후기 _답안 정리[시계열] 분류 분석 예제_시계열 myinno 2020 10 27 1 개요 19회 ADP 실기 3번 문제의 Review로 작성함 SARIMA 분석을 요구하는 문제( 교통량데이터…) SARIMA 관련 공부를 하던중 고려대 ‘예측모델’ 강의를 듣게 되었음 해당 강의 실습내용을 R로 구현해본 내용임 19회 ADP실기 3번 문제와 유사하다고 판단함 [강의동영상] 김성범[ 단장 / 4단계 BK21 산업경영공학교육연구단 ] 예측모델 ARIMA 모델 Python 실습 https://www.youtube.com/watch?v=rdR2fNDq6v0&list=PLpIPLT0Pf7IqSuMx237SHRdLd5ZA4AQwd&index=11&t=1312s 1차 정리: 2021-01-22 (처음 작성) 2 계절성이 강한 시계열 데이터 분석.. 19회 ADP 실기 후기 _답안 정리[Classification] 분류 분석 예제 myinno 2020 10 27 1 개요 19회 ADP 실기 1번 문제와 유사하며, 아래와 흐름으로 작성함 실기 답변은 아래와 유사하게 작성 했음 그래프에 대한 해석은 좀더 비지니스 관점으로 분석이 더 필요함 (시험에서도 그래프에 대한 설명을 강조했음) 시험은 별도의 Test 데이터셋이 있었고, 해당 Data에 예측결과를 추가하여 Load하는 요건도 있었음음 1차 정리: 2020-10-27 2차 정리: 2021-01-20 2 Classification 분류 문제: 통신사 고객이탈여부, 신용카드 발급여부, 신용대출 취급여부등에 사용 문제 풀이 순서 데이터 로딩 및 EDA 모델링 2.1 EDA 2.1.1 공통 Libary 로딩 if(!require(caret)) {install.package.. 19회 ADP실기 시험 후기 나이: 정통 386세대 (586) 직업: SI [금융 관련] ADP 시험 동기: 2020-01월 '데이터 분석 전문가'라는 자격증명의 존재를 알게 됨 2015년 경부터 그냥 취미(?)로 R 및 통계학을 공부했음 회사 분위기가 DT(Digital Transformation)로 변화를 강조하는 분위기이고 개인적인 대안으로 R공부(프로젝트 현장에서 R로 일부 시각화 적용) R코드를 따라 하면서 결과 해석에 대한 이론 지식이 부족하다고 판단 통계학 강의 수강(KMOOC 강의) 시험 이력 필기: 2020-6 (17회 필기): 필기는 별도 후기 없음 실기: 2020-12 (19회 실기) 작성 동기 2020-12: 시험 종료 후 시계열 관련은 답안은 자신이 없어, 불학 격이라고 판단하고 다음 시험을 준비하는 일환으로.. 이전 1 다음