Diagramas de Dispersión – Scatter Diagrams.

Los Diagramas de Dispersión o Scatter Diagrams son técnicas de mejora o herramientas especialmente útiles para mejorar operaciones y procesos en general. Estos diagramas se utilizan para analizar la relación o correlación entre dos variables o entre dos conjuntos de datos. aunque no necesariamente han de mostrarnos la existencia de una relación causa-efecto. Si el diagrama de dispersión nos muestra una conexión muy fuerte entre el conjunto de datos que analizamos, puede ser una importante evidencia de una relación causa-efecto, pero no una prueba positiva.

A continuación se muestra un diagrama de dispersión:

Otros factores que deberíamos considerar cuando usamos un diagrama de este tipo son los siguientes:

  • No todas las relaciones entre las variables tienen porque ser lineales.
  • La pendiente de la gráfica no nos muestras información sobre la fuerza de la relación. Todo depende de la escala en la que estemos trabajando.
  • Se recomienda utilizar una cantidad mayor de 100 pares de datos para obtener un gráfico suficientemente consistente.
  • Como comentamos anteriormente, los diagramas de dispersión pueden ser usados para darnos una evidencia de una relación causa-efecto, pero no la prueba. En general, el trabajo causa-efecto, requiere de una buena comprensión del sistema o entorno que estamos midiendo y puede requerir de nuevas pruebas.

Cuando realizamos un diagrama de dispersión es muy útil aplicar las herramientas estadísticas que tenemos a nuestro alcance. Por ejemplo, con los datos podemos construir una distribución de puntos o distribución de probabilidades. Podemos construir una campana de Gauss, en la que podemos analizar estadísticamente el comportamiento de la relación que estamos estudiando.

Por ejemplo, datos de la gráfica superior:

 

Media -11,5451889
Error típico 0,21909796
Mediana -10,8571429
Moda -8,57142857
Desviación estándar 5,02971808
Varianza de la muestra 25,298064
Curtosis 2,55845035
Coeficiente de asimetría -1,13515707
Rango 37,2081176
Mínimo -37,804878
Máximo -0,59676044
Suma -6084,31453
Cuenta 527
Mayor (1) -0,59676044
Menor(1) -37,804878
Nivel de confianza(95,0%) 0,43041447
Coeficiente de Correlación -0,15911512

 

Algunos conceptos o ideas que sacamos de este proceso estadístico:

  • El coeficiente de correlación nos devuelve un valor numérico que nos muestra el grado de correlación. El coeficiente de Correlación se mueve entre los valores 1 a -1. Si este valor se acerca a -1 tendremos una correlación fuerte e inversa. Si este valor se acerca a +1 tendremos una correlación fuerte y directa. Por el contrario si se aproxima a cero, la correlación sera débil. En el caso que nos ocupa, vemos que existe muy poca correlación entre las dos variables mostradas. En una correlación perfecta, todos los puntos se alinean perfectamente en una linea recta.
  • Tenemos posibilidades de representar una linea de regresión para ver como se ajusta la tendencia y su pendiente.
  • La desviación estándar de la distribución nos ayuda a identificar la posibilidad de que un posible efecto sea debido a una posible causa (siempre asumiendo que la relación causa-efecto haya sido probada). Este valor es sumamente importante para determinar la probabilidad de que un posible dato este incluido dentro de un intervalo o rango.

Este tipo de gráfico y sus cálculos numéricos y estadísticos abren un abanico impresionante para valorar, identificar, y gestionar los diferentes grados de rendimiento antes y después de la aplicación de mejoras en el proceso, por lo que se convierten en herramientas ideales para utilizarlos en los ciclos de mejoras.

 

Enlace permanente a este artículo: http://javiersole.com/?p=964