DATA MINING
QUE ES DATA MINING
La minería de datos son
distintos procesos y métodos cualitativos en donde se trabaja con grandes
cantidades de datos haciendo uso o ayudándose con herramientas.
CARACTERÌSTICAS
DE LA MINERÌA DE DATOS
- Explorar los datos se encuentra en las profundidades de las bases de datos,
- En algunos casos, los datos se consolidan en un almacén de datos y en , mercados de datos; en otros, se mantienen en servidores de Internet e Intranet.
- El entorno de la minería de datos suele tener una arquitectura cliente-servidor.
- Las herramientas de la minería de datos ayudan a extraer el mineral de la información enterrado en archivos corporativos o en registros públicos, archivados
- El minero es, muchas veces un usuario final con poca o ninguna habilidad de programación
- Hurgar y sacudir a menudo implica el descubrimiento de resultados valiosos e inesperados.
- Las herramientas de la minería de datos se combinan fácilmente y pueden analizarse y procesarse rápidamente.
- Debido a la gran cantidad de datos, algunas veces resulta necesario usar procesamiento en paralelo para la minería de datos.
- La minería de datos produce cinco tipos de información: Asociaciones, Secuencias, Clasificaciones, Agrupamientos, Pronósticos.
- Los mineros de datos usan varias herramientas y técnicas.
CONCEPTOS
DEL DATA MINING
- Este proceso se puede definir mediante los seis pasos básicos siguientes:
- Definir el problema
- Preparar los datos
- Explorar los datos
- Generar modelos
- Explorar y validar los modelos
Definir el problema
El
primer paso del proceso de minería de datos, tal como se resalta en el
siguiente diagrama, consiste en definir claramente el problema y considerar
formas de usar los datos para proporcionar una respuesta para el mismo.
- Analizar los requisitos empresariales
- Definir el ámbito del problema
- Definir métricas de evaluación del modelo
- Definir los objetivos concretos del proyecto
PREPARAR
LOS DATOS
- El segundo paso del proceso de minería de datos, como se indica en el siguiente diagrama, consiste en consolidar y limpiar los datos identificados en el paso Definir el problema.
- Para filtrar automáticamente la información:
- Integration Services en Business Intelligence Development Studio
- Introducción a Master Data Services (MDS)
- Data Quality Services
EXPLORAR LOS DATOS
El tercer paso del proceso de minería de datos, como se
resalta en el siguiente diagrama, consiste en explorar los datos preparados.
GENERAR MODELOS
El cuarto paso del proceso de minería de datos, como se
resalta en el siguiente diagrama, consiste en generar el modelo o modelos de
minería de datos. Usará los conocimientos adquiridos en el
paso Explorar los datos para definir y crear los modelos.
EXPLORAR Y VALIDAD LOS MODELOS
El quinto paso del proceso de minería de datos, como se
resalta en el siguiente diagrama, consiste en explorar los modelos de minería
de datos que ha generado y comprobar su eficacia.
IMPLEMENTAR Y ACTUALIZAR LOS MODELOS
El último paso del proceso de minería de datos, como se
resalta en el siguiente diagrama, consiste en implementar los modelos que
funcionan mejor en un entorno de producción.
Ventajas y desventajas
Ventajas:
- Los modelos son fáciles de entender.
- Enormes bases de datos pueden ser analizadas.
- La minería de datos descubre información que no se esperaba obtener.
- Los Modelos Son Confiables
Desventajas:
- Dificultad de recopilación de los dato
- El preprocesamiento de datos puede llevar demasiado tiempo
- No está asegurada la obtención de un modelo válido
- Toma de Decisiones. Ejemplos: banca, finanzas, seguros, marketing, políticas sanitarias
- o demográficas.
- Procesos Industriales.
- Investigación Científica Ejemplos: medicina, epidemiología, bioinformática, psicología.
- Soporte al Diseño de Bases de Datos.
- Mejora de Calidad de Datos.
- Mejora en el área de empresas de Consulting.
IMPLEMENTACIÒN DE LA MINERÍA DE DATOS
- Gobiernos: El FBI analizará las bases de datos comerciales para detectar terroristas.
- Empresariales: Detección de fraudes en las tarjetas de crédito.
- Universidad
- Investigación espacial: Proyecto SKYCAT
- Deporte
- Medicina
- Internet: Web Mining
0 comentarios :
Publicar un comentario