- [책 정보] (https://wikibook.co.kr/ml-definitive-guide/)
- [예제코드 다운로드] (https://github.com/wikibook/ml-definitive-guide/archive/master.zip)
CH01 (파이썬 기반의 머신러닝과 생태계 이해) <노트북 바로가기>
- boolean 인덱싱을 통한 데이터프레임 조건 추출
- Aggregation 적용 방법
- groupby 적용 방법
- 결측 데이터 처리 방법 (isna, fillna)
- apply, lambda 적용 방법
CH02 (사이킷런으로 시작하는 머신러닝)<폴더>
- Scikit-learn 설치
- train_test_split()
- 예측 평가
- 교차검증 (KFold, StratifiedKFold, cross_val_score)
- 하이퍼파라미터 튜닝(GridSearchCV)
- 데이터 인코딩 (레이블인코딩, 원핫인코딩)
- 피처스케일링 (표준화, 정규화) (StandardScaler, MinMaxScaler)
- 배운 내용으로 타이타닉 생존자 예측
- 결정트리, 랜덤포레스트, 로지스틱 회귀를 이용해 학습
CH03 (평가) <노트북 바로가기>
- 정확도
- 오차 행렬
- 정밀도
- 재현율
- F1 스코어
- ROC-AUC
- Pima Indians Diabetes Database 데이터로 정리한
CH04 (분류) <폴더>
- 앙상블
- Gradient Boosting Machine - GBM
- eXtra Gradient Boost - XGB
- XGB를 이용한 실습
- LightGBM - LGBM
- LGBM을 이용한 실습
- XGB, LGBM 비교하며 실습한 Satander Customer Satisfaction(캐글 데이터)
- creditcardfraud 실습 (캐글 데이터)
- Stacking