Que Es Mineria De Datos?
Consiste en la extracción de información que reside en los datos, es decir que prepara, sondea y explora los datos para sacar la información oculta y que podría ser útil para algún proceso.
Características
- Explorar los datos que se encuentran en las profundidades de las bases de datos, como los almacenes de datos.
- Los datos se consolidan en un almacén de datos y en mercados de datos; en otros, se mantienen en servidores de Internet e Intranet.
- El entorno de la minería de datos suele tener una arquitectura cliente-servidor.
- Las herramientas de la minería de datos ayudan a extraer la materia prima de la información enterrada en archivos corporativos o en registros públicos.
- La minería de datos produce cinco tipos de información:
- Asociaciones.
- Secuencias.
- Clasificaciones.
- Agrupamientos.
- Pronósticos.
Fases De La Minería De Datos
La Minería de datos posee los siguientes pasos:- Filtrado de datos. El formato de los datos contenidos en su fuente de origen nunca es el correcto, y la mayoría de las veces no es posible utilizar ningún algoritmo de minería sobre los datos en bruto.
- Selección de Variables. Después de haber sido preprocesados, en la mayoría de los casos se tiene una cantidad enorme de datos. La selección de características reduce el tamaño de los datos eligiendo las variables más influyentes en el problema, sin apenas sacrificar la calidad del modelo de conocimiento obtenido del proceso de minería.
- Extracción de Conocimiento. Mediante una técnica de minería de datos, se obtiene un modelo de conocimiento, que representa patrones de comportamiento observados en los valores de las variables del problema o relaciones de asociación entre dichas variables.
- Interpretación y Evaluación. Una vez obtenido el modelo, se debe proceder a su validación, comprobando que las conclusiones que arroja son válidas y suficientemente satisfactorias.
Técnicas De Minería De Datos
Las técnicas de la minería de datos provienen de la Inteligencia artificial y de la estadística, estas no son más que algoritmos que se aplican sobre un conjunto de datos para la obtención de resultados.Estas técnicas son:
- Redes neuronales. Paradigma de aprendizaje y procesamiento automático inspirado en la forma como funciona el sistema nervioso del ser humano. Se trata de un sistema de interconexión de neuronas en una red que colabora para producir un estímulo de salida
- Regresión lineal. Forma relaciones entre datos. Es rápida y eficaz, pero insuficiente en espacios multidimensionales donde puedan relacionarse más de 2 variables.
- Árboles de decisión. Es un modelo de predicción que se utiliza en la inteligencia artificial, que sirven para representar y categorizar una serie de condiciones que suceden de forma sucesiva, para la resolución de un problema.
- Modelos estadísticos. Expresión simbólica representada por una igualdad o ecuación que se emplea en todos los diseños experimentales y en la regresión para indicar los diferentes factores que modifican la variable de respuesta.
- Agrupamiento. Procedimiento de agrupación de una serie de vectores según criterios de distancia; se tratará de disponer los vectores de entrada de forma que estén más cercanos aquellos que tengan características comunes.
Extensiones De la Minería de datos
Web Mining (Minería De La Web)Es una de las extensiones de la minería de datos, consiste es una metodología de recuperación de la información que usa herramientas de la minería de datos para extraer información del contenido de las páginas, de sus enlaces y de los registro de navegación de los usuarios.
De acuerdo a los objetivos de análisis, la minería Web se puede dividir en tres tipos diferentes:
- Web Content Mining (minería de contenido Web). Es el proceso que consiste en la extracción de conocimiento del contenido de documentos o sus descripciones.
- Web Structure Mining (minería de estructura Web). Es el proceso de inferir conocimiento de la organización de la Web y la estructura de sus enlaces.
- Web Usage Mining (minería de uso Web). Es el proceso de extracción de modelos interesantes usando los logs de los accesos al Web.
Áreas de Aplicación de la Minería de datos
Algunas de las aplicaciones de Minería de Datos son:- Análisis de riesgos en créditos: Esta es una aplicación similar detección de fraudes, pero con la ventaja de de la existencia de maneras tradicionales para realizarlo. El clásico procedimiento de asignación de puntos puede ser complementado y mejorado con la ayuda de la minería de datos.
- Clasificación de cuerpos celestes: Debido a la gran contribución a estas tareas por parte del reconocimiento de imágenes y los pre-procesamientos involucrados, esta aplicación también puede considerarse como perteneciente al área del reconocimiento de patrones de imágenes.
- Terrorismo: La minería de datos ha sido utilizada por la unidad Able Danger del Ejército de los EE.UU. quien había identificado al líder de los atentados del 11 de septiembre de 2001, Mohammed Atta, y a otros secuestradores como posibles miembros de Al Qaeda que operaban en los EE.UU. un año antes del ataque.
- Ingeniería eléctrica: Las técnicas minería de datos han sido ampliamente utilizadas para monitorear las condiciones de las instalaciones de alta tensión. La finalidad de esta monitorización es obtener información valiosa sobre el estado del aislamiento de los equipos. Para la vigilancia de las vibraciones o el análisis de los cambios de carga en transformadores se utilizan ciertas técnicas para agrupación de datos (clustering) tales como los Mapas Auto-Organizativos (SOM, Self-organizing map). Estos mapas sirven para detectar condiciones anormales y para estimar la naturaleza de dichas anomalías.
- Patrones de fuga: Un ejemplo más habitual es el de la detección de patrones de fuga. En muchas industrias como la banca, las telecomunicaciones, etc. Existe un comprensible interés en detectar cuanto antes aquellos clientes que puedan estar pensando en rescindir sus contratos para pasarse a la competencia. A estos clientes se les podrían hacer ofertas personalizadas, ofrecer promociones especiales, etc., con el objetivo último de retenerlos. La minería de datos ayuda a determinar qué clientes son los más proclives a darse de baja estudiando sus patrones de comportamiento y comparándolos con muestras de clientes que se dieron de baja en el pasado.
- Fraudes: Un caso análogo es el de la detección de fraude en el uso de tarjetas de crédito o de servicios de telefonía móvil e, incluso, en la relación de los contribuyentes con el fisco. Generalmente, estas operaciones fraudulentas o ilegales suelen seguir patrones característicos que permiten, con cierto grado de probabilidad, distinguirlas de las legítimas y desarrollar así mecanismos para tomar medidas rápidas frente a ellas.
- Recursos humanos: La minería de datos también puede ser útil para estos departamentos en la identificación de las características de sus empleados de mayor éxito. La información obtenida puede ayudar a la contratación de personal, centrándose en los esfuerzos de sus empleados y los resultados obtenidos por éstos. Además, la ayuda ofrecida por las aplicaciones para Dirección estratégica en una empresa se traducen en la obtención de ventajas a nivel corporativo, tales como mejorar el margen de beneficios o compartir objetivos; y en la mejora de las decisiones operativas, tales como desarrollo de planes de producción o gestión de mano de obra.
0 comentarios:
Publicar un comentario