Minería de datos, modelos y técnicas

Mineria_datos

Muchas veces hemos escuchado el término de minería de datos o data mining, y rápidamente lo asociamos con algo que relaciona datos o información pero nos queda una inquietud grande con el término minería, si eres de ese grupo de personas aquí te aclaro con detalle todo este concepto.

Minería de datos

La tecnología ha tenido una evolución muy grande con el pasar de los años si recordamos el inicio de los sistemas digitales, las compuertas lógicas, el almacenamiento de estados, la llegada de los transistores y con ellos el inicio de la revolución digital que con ella hemos llegado al manejo de información de una manera mas fácil es decir almacenarla, distribuirla y procesarla.

Con la evolución de la computación industrial se ha logrado un avance en el almacenamiento y el procesamiento de datos con herramientas que pueden almacenar gigantes cantidades como:

  • Transacciones de ventas
  • Descripciones de productos
  • Blogs
  • Chats
  • Promociones de ventas
  • Perfiles de compañías
  • Perfiles de personas

Como ejemplos podemos citar las Millones de transacciones que tiene por semana la empresa Wal-Mart según (Data Mining, Concepts and Techniques, Jiawei han), también la información que se recogen de sensores, procesos de medición, experimentos científicos y muchas fuentes mas.

El análisis de datos no es materia nueva ya que las personas lo realizaban manualmente utilizando muchas veces técnicas estadísticas para obtener diferentes reportes o resultados, al crecer la cantidad de datos la posibilidad de manipularlos fue más complicada que se necesitaron tecnologías de la computación para procesarlas generando procesos automáticos.

Con mucha información para analizar se genera la necesidad de buscar metodologías de análisis inteligente de datos de lo cual nace el término KDD (Knowledge Discovery in Databases) que es el proceso que nos permite obtener conocimiento de un gran conjunto de datos.

Con la explicación anterior podemos decir que la minería de datos se ocupa de la obtención de conocimiento de un conjunto de datos, descubriendo patrones, relaciones entre los datos, clasificaciones de comportamiento

Modelo

He buscado en muchos sitos una explicación clara para modelo en minería de datos, pero siempre en mente mi idea de modelo de base de datos, aunque claramente no es eso, entonces te resumo la mejor definición que he encontrado para modelo.

Haciendo uso de la estadística se crea un modelo que permite encontrar o mostrar la data que no es visible en un conjunto de datos.

La minería de datos contempla 2 modelos:

  1. Predictivo: Busca entrenar (Machine learning) con los datos recolectados y hacer predicciones futuras.
  2. Descriptivo: Identifica patrones a través de las propiedades de los datos con el objetivo de describir datos futuros.

Técnicas

Las técnicas que tenemos luego de definir el modelo son las siguientes:

Predictivas

  • Regresión lineal
  • Regresión Logística
  • Clasificación
  • Clasificación No supervisada

Descriptivas

  • Clustering
  • Reglas de asociación
  • Detección de Outliers
  • Visualización

Podemos encontrar más técnicas, en futuros post seguiremos hablando de cada una de estas técnicas. Si tienes algo mas que aportar o dudas no olvides dejarnos tus comentarios, si te gusto este artículo no olvides !!!Compartirlo en todas las redes sociales.