데이터 분석 커리큘럼 안내
“데이터 분석을 해보고 싶은데, 어떻게 시작해야 할지 모르겠어요.”
“혼자 공부하려니 막막하고 방향성도 모르겠고 복잡해요.”
“실제로 분석하고 예측하는 경험을 해보고 싶어요!”
”머신러닝을 배워보고 싶어요.”
”맨땅에 헤딩하는 기분이에요.”
커리큘럼 소개
데이터 분석 커리큘럼은 데이터 분석 입문자를 대상으로 한 실습 중심의 커리큘럼입니다.
단순히 이론만 배우는 것이 아니라 데이터 전처리부터 (머신러닝)모델 학습, 보고서 작성까지 전 과정을 직접 실습해보게 됩니다.
전통적 통계학 기반 분석이 아닌, 머신러닝을 기반으로 분석하는 방법을 배웁니다.
커리큘럼 설계에 참고한 기준 설명
커리큘럼은 처음 배우시는 분을 대상으로 설계되었습니다.
“디테일보단 큰 흐름”에서 데이터 분석이라는 것이 뭘 하는 건지에 대한 감을 잡을 수 있도록 구성하는 데에 집중하였습니다.
“큰 흐름을 파악하고 키워드를 얻어가면, 키워드로 나중에 검색이나 GPT에 물어보는 등을 통해 혼자 공부할 수 있게 된다”라는 것을 모토 중의 하나로 삼았습니다.
운영 방식
•
진행 기간: 25년 9월 ~ 12월(약 4개월)
•
학습 내용: Scikit-learn 기본 제공 모델 및 XGBoost, LightGBM, CatBoost 등의 부스팅 계열 모델 기반 회귀(Regression) 분석
•
진행 방식
◦
매주 세션 진행
◦
강의 형태로, 이론을 강의 후 팀 단위로 실습 진행
◦
매주 학습 내용을 바탕으로 학기 중 2회(중간고사 기간 전, 기말고사 기간 전) 보고서 작성 및 최종 발표
•
수료 조건
◦
수료점수 4점이 필요합니다.
◦
최종 보고서를 제출하고, 평가 기준을 통과해야 합니다.
평가 기준
•
수료를 하게 되면?
◦
공개하여도 손색이 없는 데이터 분석 리포트를 얻게 됩니다.
◦
데이터 분석 비기너 커리큘럼의 수료증이 발급됩니다.
주차별 커리큘럼
•
세부 일정 및 내용은 멘토의 판단 하에 일부 조정될 수 있습니다.
회차 | 주제 | 학습 목표 |
1회 | 데이터 분석 개론 및 데이터셋 소개 | 데이터 분석이 무엇이고, 예측해야 하는 값의 종류 및 머신러닝이 무엇인지를 알 수 있다. |
2회 | 전처리, 분석 시작 | 데이터셋의 데이터 종류가 무엇이고, 각 종류 별로 분석 전에 수행해야 하는 절차와 결측치(Missing value), 이상치(Outlier), 노이즈(Noise)가 무엇인지 알 수 있다. |
3회 | 사이킷런과 모델 학습 및 평가 | 1주차 개론을 기반으로 단계별로 수행해야 할 일을 코드로 작성할 수 있다. |
4회 | 시각화 | 분포형 자료, 수치형 자료 등을 시각화 하고, 보고서 작성에 필요한 시각 자료를 만들 수 있다. |
5회 | 1차 보고서 완성 및 발표 진행 | 1차 보고서를 완성하고, 보고서를 읽고 이해할 수 있다. |
6회 | 다양한 모델 소개 | 다양한 모델이 존재함을 알고, 각 모델 별로 간단한 원리 및 구조와 성능이 차이나는 이유를 간략하게 이해할 수 있다. |
7회 | 하이퍼파라미터 | 모델 별로 존재하는 하이퍼파라미터를 파악할 수 있고, 코드로 조정할 수 있다. |
8회 | EDA, Feature engineering, 파생 변수 | 결측치, 이상치 등을 처리함을 넘어, 데이터의 의미나 특성을 파악할 수 있다. |
9회 | 분석에 쓰인 수학 개념 정리 | 지금까지의 내용에서 사용된 수학적 지식과 어떨 때 이 지식이 왜 필요한지 알 수 있다. |
10회 | 최종 발표 | 최종 분석 보고서 발표 및 시상 |
멘토 소개
이재민
•
컴퓨터·인공지능공학부 컴퓨터공학전공 4학년
•
GDG 닉네임 샌즈(Sans)
•
프론트 백엔드 개발도 경험해봄
•
아침에 가끔 못일어남
•
현재 2025 ETRI(한국전자통신연구원) 네트워크 AI 해커톤 참여 중
“저는 딥러닝 및 Multimodal model, VLM(Vision-Language Model), LLM(Large Language Model), 생성형 AI(Generative AI)와 같은 주제에 관심을 갖고 공부하고 있고 관련된 스펙을 쌓고 있습니다. 현재는 머신러닝 중에서도 딥러닝과 관련된 대회나 공모전에 참가하려고 하고 있네요. 관련해서 커리어에 관한 질문이나 그게 아닌 가벼운 질문 같은 것도 언제든 환영하오니 질문이 있으시면 편하게 물어봐주시길 바랍니다.”
이재훈
•
컴퓨터·인공지능공학부 컴퓨터공학전공 3학년
•
데이콘 출전 경험
“저도 작년에 데이터 비기너를 하였습니다. 그 때의 멘토님께 많은 것을 배워 유익한 학기가 되었습니다. 이번 학기에 들어오는 멘티님들도 저처럼 유익한 시간이 될 수 있게 노력하겠습니다. 저는 보안과 데이터 분석을 공부중입니다. “