데이터 살펴보기

 

결측치 처리

  • is.na 활용

 

Missing map

  • missing data 있는지 시각적으로 확인하려면… (Amelia::missmap)

 

결측치 처리방법

  • 1. 단순무식하게 그냥 뺀다

 

  • 2. 특정 값으로 대체한다 (Single imputation)

 

  • 3. 고급지게(?) 대체한다? (Multiple imputation)
    • MAR 가정: Missing At Random (결측 변수값과 결측여부과 무관.? 단, 관측된 타 변수들과 결측여부가 관련있음)
    • https://www.analyticsvidhya.com/blog/2016/03/tutorial-powerful-packages-imputing-missing-values/
    • MICE 패키지
      • MICE method
        • PMM (Predictive Mean Matching) ? For numeric variables
        • logreg(Logistic Regression) ? For Binary Variables( with 2 levels)
        • polyreg(Bayesian polytomous regression) ? For Factor Variables (>= 2 levels)
        • Proportional odds model (ordered, >= 2 levels)

 

 


Leave Comment

이메일은 공개되지 않습니다. 필수 입력창은 * 로 표시되어 있습니다