Association Rule Analysis

연관규칙 분석

 

  • 개념
    • 일련의 거래, 사건들 간의 규칙을 발견

 

  • 평가 척도
    • 지지도(support)
      • A와 B를 동시에 포함하는 거래수 / 전체 거래수
      • 값이 클수록 자주 발생하는 거래 (규칙의 중요성에 대한 척도)
    • 신뢰도(confidence)
      • A와 B를 동시에 포함하는 거래수 / A를 포함하는 거래수
      • A가 일어난 상황 하에서 B가 일어날 확률 (조건부확률)
      • 값이 클수록 A 구매 시 B도 구매하는 비율이 높음 (규칙의 신뢰성에 대한 척도)
    • 향상도(lift)
      • A와 B를 동시에 포함하는 거래비율 / (A를 포함하는 거래비율 * B를 포함하는 거래비율)
      • 항목 A와 B의 구매 패턴이 독립적인지, 서로 상관이 있는지를 확인
      • 값이 1보다 클수록 양의 상관관계
        • lift = 1  (서로 독립.  상관관계 없음)
        • 0 < lift < 1 (음의 상관관계)

 

 

  • 분석 준비
    • library 및 데이터 불러오기
    • id별로 split 한 후 transaction 데이터로 변환

 

  • 연관규칙 분석

 

  • 다른 데이터셋으로 한번 더 ㅎㅎ

 


1 Comments

  1. Pingback: [TIL] 2018-04-19 (목) – Today I Learned

Leave Comment

이메일은 공개되지 않습니다. 필수 입력창은 * 로 표시되어 있습니다