Las reglas de asociación nos permiten encontrar relaciones entre items que concretamente se forman dentro de transacciones, estos items entre sí tienen una correspondencia y se representa por X -> Y
Definición de una regla de asociación
Las reglas de asociación se forman de 2 conjuntos.
1. Conjunto de items.
2. Conjunto de transacciones.

Las transacciones tienen un subconjunto de items al cual llamaremos T-Items en el cual una regla se forma por la asociación:
A => B.
Donde,
A,B ⊆ Items y A ∩ B.
Aquí los conjuntos A y B se denominarán respectivamente antecedente (lenft-hand-side) y consecuente (right-hand-side).
ejemplo de regla
Hagamos un ejemplo que se nos puede presentar en la vida real, creemos la siguiente tabla de transacciones de venta de productos deportivos.

Como podemos observar en la imagen tenemos la lista de items.
Items = {zapatos, medias, camiseta}.
Podemos observar que tenemos 3 transacciones en las cuales utilizamos V para compra y F para no compra podemos ver las asociaciones:
asociacion1 = {zapatos} => {medias}.
Podemos ver que si un cliente compró zapatos también compró medias.
asociacion2 = {zapatos} => {camiseta}.
Podemos ver que si un cliente compró zapatos también compró medias.
asociacion3 = {zapatos,medias} => {camiseta}.
Podemos ver que si un cliente compró zapatos y medias entonces compró una camiseta.
Como se puede ver estas transacciones son pequeñas para la cantidad real de datos que se tienen en un negocio para esto existen variables que nos ayudarán cuando tengamos muchas transacciones estas son el soporte y la confianza.
Soporte
El soporte que tiene un conjunto de items para una base de datos se lo realiza:
Soporte (A) = |A| / |D|.
En este caso reemplazando a nuestro ejemplo anterior tenemos:
Soporte (ZapatosMedias) = 1 / 3 (1 de cada 3 transacciones).
S = 0.33 es conveniente convertirlo a porcentaje del cual tenemos 33%.
Cabe recalcar como soporte las veces que se repite un item dentro de una transacción este item puede ser el A de la asociación 1, 2 y 3. En varias transacciones mientras mayor el soporte mas sirve ese dato para el análisis.
Confianza
En la confianza ya utilizamos la asociación de nuestros items la fórmula es la siguiente:
Confianza (A => B) = Soporte (A U B) / Soporte (A).
En este caso reemplazando a nuestro ejemplo anterior tenemos:
Confianza ({Zapatos, Medias}) = Soporte ({Zapatos, Medias} U {Camiseta}) / Soporte ({Zapatos, Medias}).
Confianza = 0.33 / 0.33 = 1 Si lo pasamos a porcentaje tenemos = 100 %.
En este caso tenemos que el 100% de los casos {Zapatos,Medias} => {Camiseta}. La regla es cierta en el 100% de los casos. Cuando mejor es el porcentaje de la confianza mas seguridad nos dará sobre los datos que se analizan.
Esperamos con esta breve explicación dejar claro el funcionamiento de las reglas de asociación un siguiente post aplicaremos estas reglas a unos datos de ejemplo y utilizaremos el algoritmo Apriori. Si te gustó el contenido compártelo en tus redes sociales.