DATA MINING

lunes, 21 de noviembre de 2016

DATA MINING


QUE ES DATA MINING

La minería de datos son distintos procesos y métodos cualitativos en donde se trabaja con grandes cantidades de datos haciendo uso o ayudándose con herramientas. 

CARACTERÌSTICAS DE LA MINERÌA DE DATOS 
  • Explorar los datos se encuentra en las profundidades de las bases de datos,
  • En algunos casos, los datos se consolidan en un almacén de datos y en , mercados de datos; en otros, se mantienen en servidores de Internet e Intranet.
  • El entorno de la minería de datos suele tener una arquitectura cliente-servidor.
  • Las herramientas de la minería de datos ayudan a extraer el mineral de la información enterrado en archivos corporativos o en registros públicos, archivados
  • El minero es, muchas veces un usuario final con poca o ninguna habilidad de programación
  • Hurgar y sacudir a menudo implica el descubrimiento de resultados valiosos e inesperados.
  • Las herramientas de la minería de datos se combinan fácilmente y pueden analizarse y procesarse rápidamente.
  • Debido a la gran cantidad de datos, algunas veces resulta necesario usar procesamiento en paralelo para la minería de datos.
  • La minería de datos produce cinco tipos de información: Asociaciones, Secuencias, Clasificaciones, Agrupamientos, Pronósticos.
  • Los mineros de datos usan varias herramientas y técnicas.
CONCEPTOS DEL DATA MINING

  • Este proceso se puede definir mediante los seis pasos básicos siguientes:
  • Definir el problema
  • Preparar los datos
  • Explorar los datos
  • Generar modelos
  • Explorar y validar los modelos

Definir el problema






El primer paso del proceso de minería de datos, tal como se resalta en el siguiente diagrama, consiste en definir claramente el problema y considerar formas de usar los datos para proporcionar una respuesta para el mismo.
  • Analizar los requisitos empresariales
  • Definir el ámbito del problema
  • Definir métricas de evaluación del modelo
  • Definir los objetivos concretos del proyecto


PREPARAR LOS DATOS

  • El segundo paso del proceso de minería de datos, como se indica en el siguiente diagrama, consiste en consolidar y limpiar los datos identificados en el paso Definir el problema.
  • Para filtrar automáticamente la información:
  • Integration Services en Business Intelligence Development Studio
  • Introducción a Master Data Services (MDS)
  • Data Quality Services
EXPLORAR LOS DATOS

El tercer paso del proceso de minería de datos, como se resalta en el siguiente diagrama, consiste en explorar los datos preparados. 

GENERAR MODELOS

El cuarto paso del proceso de minería de datos, como se resalta en el siguiente diagrama, consiste en generar el modelo o modelos de minería de datos. Usará los conocimientos adquiridos en el paso Explorar los datos para definir y crear los modelos.

EXPLORAR Y VALIDAD LOS MODELOS

El quinto paso del proceso de minería de datos, como se resalta en el siguiente diagrama, consiste en explorar los modelos de minería de datos que ha generado y comprobar su eficacia.

IMPLEMENTAR Y ACTUALIZAR LOS MODELOS

El último paso del proceso de minería de datos, como se resalta en el siguiente diagrama, consiste en implementar los modelos que funcionan mejor en un entorno de producción.

Ventajas y desventajas

Ventajas:

  • Los modelos son fáciles de entender.
  • Enormes bases de datos pueden ser analizadas.
  • La minería de datos descubre información que no se esperaba obtener.
  • Los Modelos Son Confiables


Desventajas:
  • Dificultad de recopilación de los dato
  • El preprocesamiento de datos puede llevar demasiado tiempo
  • No está asegurada la obtención de un modelo válido

 Ejemplos de áreas de aplicación de data mining

  • Toma de Decisiones. Ejemplos: banca, finanzas, seguros, marketing, políticas sanitarias
  • o demográficas.
  • Procesos Industriales.
  • Investigación Científica Ejemplos: medicina, epidemiología, bioinformática, psicología.
  • Soporte al Diseño de Bases de Datos.
  • Mejora de Calidad de Datos.
  • Mejora en el área de empresas de Consulting. 

IMPLEMENTACIÒN DE LA MINERÍA DE DATOS

  • Gobiernos: El FBI analizará las bases de datos comerciales para detectar terroristas.
  • Empresariales: Detección de fraudes en las tarjetas de crédito.
  • Universidad
  • Investigación espacial: Proyecto SKYCAT
  • Deporte
  • Medicina
  • Internet: Web Mining 



0 comentarios :