EXPLORAR LOS DATOS
El tercer paso del proceso de minería de datos, como se
resalta en el siguiente diagrama, consiste en explorar los datos preparados.
GENERAR MODELOS
El cuarto paso del proceso de minería de datos, como se
resalta en el siguiente diagrama, consiste en generar el modelo o modelos de
minería de datos. Usará los conocimientos adquiridos en el
paso Explorar los datos para definir y crear los modelos.
EXPLORAR Y VALIDAD LOS MODELOS
El quinto paso del proceso de minería de datos, como se
resalta en el siguiente diagrama, consiste en explorar los modelos de minería
de datos que ha generado y comprobar su eficacia.
IMPLEMENTAR Y ACTUALIZAR LOS MODELOS
El último paso del proceso de minería de datos, como se
resalta en el siguiente diagrama, consiste en implementar los modelos que
funcionan mejor en un entorno de producción.
Ventajas y desventajas
Ventajas:
- Los modelos son fáciles de entender.
- Enormes bases de datos pueden ser analizadas.
- La minería de datos descubre información que no se esperaba
obtener.
- Los Modelos Son Confiables
Desventajas:
- Dificultad de recopilación de los dato
- El preprocesamiento de datos puede llevar demasiado tiempo
- No está asegurada la obtención de un modelo válido
Ejemplos de áreas de aplicación de data mining
- Toma de Decisiones. Ejemplos: banca, finanzas, seguros,
marketing, políticas sanitarias
- o demográficas.
- Procesos Industriales.
- Investigación Científica Ejemplos: medicina, epidemiología,
bioinformática, psicología.
- Soporte al Diseño de Bases de Datos.
- Mejora de Calidad de Datos.
- Mejora en el área de empresas de Consulting.
IMPLEMENTACIÒN DE LA MINERÍA DE DATOS
- Gobiernos: El FBI analizará las bases de datos comerciales
para detectar terroristas.
- Empresariales: Detección de fraudes en las tarjetas de
crédito.
- Universidad
- Investigación espacial: Proyecto SKYCAT
- Deporte
- Medicina
- Internet: Web Mining