La minería de datos (es la etapa de análisis de “Knowledge Discovery in Databases” o KDD), es un campo de las ciencias de la computación referido al proceso que intenta descubrir patrones en grandes volúmenes de conjuntos de datos. Utiliza los métodos de la inteligencia artificial, aprendizaje automático, estadística y sistemas de bases de datos.
El objetivo general del proceso de minería de datos consiste en extraer información de un conjunto de datos y transformarla en una estructura comprensible para su uso posterior. Además de la etapa de análisis en bruto, que involucra aspectos de bases de datos y gestión de datos, procesamiento de datos, el modelo y las consideraciones de inferencia, métricas de intereses, consideraciones de la Teoría de la Complejidad computacional, post-procesamiento de las estructuras descubiertas, la visualización y actualización en línea.
Cuando empezamos a investigar, ya hace muchos años el E-LEARNING-INCLUSIVO, pusimos en uno de los focos la necesidad vital de que una parte de la retroalimentación, síncrona y asíncrona, se hiciese con Inteligencia Artificial, ya que si aceptamos por ejemplo los MOOCs, es imposible establecer un feedback de calidad y efectivo, si no se introducen programas artificiales que ayuden a la inteligencia humana en su realización.
De esta manera podemos conseguir lo que algunos llaman, trabajar con la web inteligente, de otra manera siempre será vender “humo” y de ello los MOOCs como una innovación que es, tampoco se muestra ajena a este proceso.
Una manera de implementar este desarrollo sería como lo harían en cualquier empresa de innovación..con una metodología “ágil” iterativa, las fases que maneja están relacionadas con su fase predecesora y/o sucesora de tal manera que el cambio se maneja con menores impactos en comparación con las metodologías tradicionales.
ya en otra fase “Preparación de Datos”, está ampliamente relacionada con la fase dos “Entendimiento de los datos”, por lo tanto es altamente probable que al realizar la preparación de los datos se deba regresar a la fase anterior a entender o definir nuevamente algún dato que fue mal interpretado o que se incorpora.
La preparación de los datos es una parte crítica dentro del análisis avanzado de información, ya sea que se trate de efectuar un análisis estadístico, un análisis de minería de datos o textos o bien para la construcción de un sistema de descubrimiento de conocimiento.
La fase de preparación de datos es un actor de éxito, sin ella no puede generarse satisfactoriamente ningún análisis avanzado o sistema inteligente. La preparación de los datos consta de: validación, transformación y selección.
ejemplo:
Pasos en la preparación de los datos
| |
1. Selección de datos
| |
En este paso se van a seleccionar los conjunto de datos sobre los cuáles se aplicarán las técnicas de análisis avanzado para alcanzar las metas, alcances y objetivos fijados en la fase uno.
Es probable que se determinen no sólo uno sino varios conjuntos de datos, a través de realizar diferentes combinaciones de los atributos que fueron estudiados e incluidos en la fase dos.
A continuación describimos y aplicamos al prototipo algunos de estos puntos
| |
Ejemplo
| |
Segmentar categorías
| |
Crear nuevas alternativas
| |
flexibilidad, diversidad | |
Etc…
|
T
|
2. Limpieza de datos
| |
Es necesario negociar y determinar cuál será el tratamiento que se empleará para aquellos datos incompletos, omitidos, erróneos, etc.
Es importante involucrar a los aprendices en las decisiones de limpieza para no generar criterios de remplazo erróneos y que ocasionen desviaciones o mayor dispersión en los análisis estadísticos.
| |
En nuestro piloto
Para datos omitidos o erróneos: sustituir las características por aquellos que presenten el valor más repetido (moda de la serie).
Para datos numéricos: Colocar el precio promedio del conjunto del mismo tipo en los valores omitidos.
Etc.
| |
3. Construcción de datos
| |
En los análisis estadísticos ó de minería de datos, para detectar tendencias, patrones de comportamiento, grupos, etc… , es frecuente que se incluyan datos que no fueron considerados en la selección inicial y que incluso pueden no formar parte del negocio. Se trata de incorporar datos (muchas veces del exterior) que proporcionen más información o ayuden a afinar los análisis.
Para realizar una prognosis y una diagnosis, predictivas más asertivas es indispensable añadir nuevos datos que aporten valor al análisis.
Las reglas de funcionamiento, las trasformaciones y variantes de los datos en el analisis que estamos haciendo deben de ser consideradas en esta parte.
| |
En nuestro ejemplo
Incorporaremos varias variables, entre ellas,
calidad, diversidad, inclusividad, excelencia personalizada…
| |
4. Integración de datos
| |
Los datos preparados en los pasos anteriores muchas veces serán integrados (unidos) para su análisis en campos nuevos.
| |
5. Formato de datos
| |
De ser necesario hacer un reformateo a los datos. En términos de análisis para poder realizarlos es más en algunos casos necesario asignar claves numéricas a los datos nominales que procesar textos.
|
A partir de esta concepción, que será realizada de manera continuada y sujeta siempre a retroalimentaciones constantes, lo que a veces originará en mitad de un CURSO, un cambio radical de estrategias, ya que los aprendices y sus diferentes situaciones:
-adaptaciones al curso.
-aceptación o no, de la calidad del mismo
-Dificultades o facilidades personales y de grupos para realizarlo
-Propuestas alternativas o de innovación en el mismo curso
-Si la evaluación continuada que vamos estableciendo tiene o no, errores, mejoras,…
….
Por tanto en este aspecto-solo es uno dentro de la complejidad de E-LEARNING-INCLUSIVO- se demuestra lo que verdaderamente es una formación abierta, masiva y sobre todo, inclusiva y ubicua….
Fuentes:
http://juandomingofarnos.wordpress.com Innovación y Conocimiento de Juan Domingo Farnós
http://es.scribd.com/doc/33025056/Bases-Para-e-Learning-Inclusivo Bases para un E-learning-Inclusivo de Juan Domingo Farnós
http://www.sih-ai.com/datam.html Servicios inteligentes Hahn
http://blogcued.blogspot.com.es/2011/06/diseno-de-un-curso-con-e-learning.html Diseño de un curso con E-learning-Inclusivo de Juan Domingo Farnós en CUED
Este post ha sido publicado originalmente en juandon. Innovación y conocimiento. Autorizada por el autor su publicación en este Blog CUED.
Este post ha sido publicado originalmente en juandon. Innovación y conocimiento. Autorizada por el autor su publicación en este Blog CUED.
No hay comentarios:
Publicar un comentario