ANOVA (분산분석, Analysis of Variance)

범주형 x + 수량형 y: 독립변수는 범주형 자료, 종속변수는 수량형 자료인 경우 활용

  • 데이터 분포의 시각화
    • ggplot() + geom_boxplot()
    • 그룹 간 차이를 확인

 

  • 분산분석
    • 모수 추정값 Estimate
      • 이 케이스의 경우, class = pickup 이면 연비가 평균 7.92만큼 감소한다고 해석 가능
      • 표준오차 1.62 이므로, 95% 신뢰구간은 -7.92+- (1.96 * 1.62)

 

  • 분산분석 진단
    • 분산분석의 가정
      • 잔차의 분포가 독립이다
      • 잔차의 분산이 동일하다
    • plot.lm() 함수로 확인

 

 

 

 


Leave Comment

이메일은 공개되지 않습니다. 필수 입력창은 * 로 표시되어 있습니다