association rule 예제

컨텍스트 기반 연결 규칙은 연결 규칙의 한 형태입니다. 컨텍스트 기반 연결 규칙은 컨텍스트 변수의 값에 따라 최종 연결 규칙 집합을 변경하는 숨겨진 변수 명명된 컨텍스트 변수를 고려하여 연결 규칙 마이닝에서 더 많은 정확도를 주장합니다. 예를 들어 시장 바구니 분석의 바구니 방향은 월 초에 홀수 패턴을 반영합니다. 이는 비정상적인 맥락, 즉 월초에 급여가 그려짐에 따라 [37] 리프트 비율은 전체 책 유형(청소년, 참조, 지리 및 자식)을 모두 구매한 경우 거래가 발견될 가능성을 나타냅니다. 트랜잭션의 인구. 즉, 리프트 비율은 신뢰도를 C 지원 값으로 나눈 값입니다. 규칙 2의 경우 신뢰도가 90.35%인 경우 지원은 846/2000 = .423으로 계산됩니다. 리프트 비율은 .9035/.423 또는 2.136으로 계산됩니다. 90.35%의 지지와 2.136의 리프트 비율을 감안할 때 이 규칙은 유용한 것으로 간주될 수 있습니다. 연결 규칙 마이닝은 기본 수준에서 기계 학습 모델을 사용하여 데이터베이스에서 패턴 또는 공동 발생에 대한 데이터를 분석합니다. 연결 규칙이라고 하는 빈번한 if-then 연결을 식별합니다.

협회 규칙 마이닝에 대한 유명한 이야기는 “맥주와 기저귀”이야기입니다. 슈퍼마켓 쇼핑객의 행동에 대한 의도적인 설문 조사는 기저귀를 구입하는 고객 (아마도 젊은 남성)도 맥주를 구입하는 경향이 있음을 발견했습니다. 이 일화는 일상적인 데이터에서 예기치 않은 연결 규칙을 찾을 수있는 방법의 예로 인기를 얻었습니다. 이야기의 양에 관해서는 다양한 의견이 있습니다. [35] 다니엘 파워스는 다음과 같은 말합니다:[35] 프로그래머는 연결 규칙을 사용하여 기계 학습이 가능한 프로그램을 구축합니다. 머신 러닝은 명시적으로 프로그래밍되지 않고 보다 효율적으로 프로그램을 구축하려는 인공 지능(AI)의 일종입니다. 여러 구매 패턴을 관찰할 수 있습니다. 예: Associations.xlsx 데이터 집합에 포함된 데이터는 모두 0과 1이므로 입력 데이터 형식에서 이진 행렬 형식의 데이터를 선택합니다.

데이터의 각 열이 고유한 항목을 나타내는 경우 이 옵션을 선택해야 합니다. XLMiner는 데이터를 영하와 영하가 아닌 두 엔티티의 행렬로 처리합니다. 모든 비영도는 1로 처리됩니다. 0은 해당 트랜잭션에 항목이 없다는 것을 나타내고 1은 항목이 있음을 의미합니다. 각 데이터 행이 해당 트랜잭션에 있는 항목 코드 또는 이름으로 구성된 경우 항목 목록에서 데이터를 선택합니다. 따라서 신뢰도는 조건부 확률 P(E Y | )의 추정치로 해석될 수 있다. E X) {디스플레이 스타일 P(E_{Y}| E_{X}}} [3] [5] 규칙 2는 청소년 책, 참조 책 및 지리 책을 구입한 경우 90.35 %의 신뢰도가있는 어린이 책도 구입한다는 것을 나타냅니다. A 지원 열은 규칙이 114건의 거래를 지원한다는 것을 나타내며, 이는 114명이 청소년 책, 참조 책 및 지리 책을 구입했음을 의미합니다. C 지원 열은 자식 도서 구입과 관련된 트랜잭션 수를 나타냅니다. A 및 C 지원 열은 청소년 책, 참조 책, 지리 도서 및 자녀 책을 구입한 거래 수를 나타냅니다.