kaggle-for-korean in python

한국인을 위한 (파이썬) 캐글 튜토리얼

작성자 Profile

: kaggle에서 쓰이는 용어들

CV = Cross-validation score
- 모델을 trainining dataset을 validation split을 한 후에, cross-validation을 해서 구한 점수를 나타냅니다.
- 한번의 validation을 통해 얻은 score라면, overfitting일 가능성이 높지만, CV 방식은 좀 더 객관적인 점수를 나타냅니다.
- 하지만 test dataset으로 계산하지 않은, 로컬한 점수입니다. CV가 LB보다 많이 높을 경우, overfitting으로 간주합니다.
- ~~Discussion에서 CV는 얼마인데, LB는 얼마가 나온다는 얘기를 많이 볼 수 있습니다.~~
LB = Leaderboard score
DAE = Denoising autoencoder
VAE = Variational autoencoder
OverSampling/UnderSampling
OOF = Out-Of-Fold
leak
Stacking
Stacking2
Target encoding

: Exploratory Data Analysis

Name		Name	Last commit message	Last commit date
Latest commit History 9 Commits
README.md		README.md