La correlación lineal

La teoría de la correlación y la regresión son muy recientes y su descubrimiento se debe al médico inglés Sir Francis Galton.

Galton nació el año 1822 en Birminghan en el seno de una familia acomodada. Estudió en Hospital General de Birmingham, en el King’s College de Londres y en el Trinity de Cambridge.

Sus trabajos se desarrollaron entorno al estudio de la herencia y la expresión matemática de los fenómenos vinculados a ella. El contexto histórico en el que vivió favoreció su interés por la herencia génética: nació el mismo año que George Mendel con el que mantenía una gran afinidad y era primo de Charles Darwin.

En 1869 publicó el libro “Hereditary Genius”, y través del estudio de problemas de la herencia, llegó al concepto de correlación, siendo el primero en asignar a un conjunto de variables un número que permitía obtener una medida del grado de relación existente entre ellas.

Llegó a inferir que las personas excepcionalmente altas solían tener hijos de estatura menor que sus progenitores, mientras que las personas muy bajas solían tener hijos más altos que sus padres.

Esta observación llevó a Galton a enunciar su “principio de la mediocridad”, aplicable a las tallas de una generación respecto de las siguientes. Éste fue el origen del actual análisis de la regresión.

La observación de Galton es sin duda cierta, pero el supuesto de la regresión de la mediocridad es totalmente falso y se considera actualmente como una de las falacias de la regresión.

La justificación que se da hoy a este hecho es que los valores extremos de una distribución se deben en gran parte al azar, de ahí que los factores genéticos que producen una talla excepcional por exceso o por defecto no pasan a los hijos.

Su obra “Meteorográphica” fue el primer intento de previsión del tiempo y por otra parte puede ser considerado como el padre de la eugenesia.>

Los trabajos de Galton fueron continuados y mejorados, entre otros, por Karl Pearson.

Pearson nació en Londres en 1857 y comenzó estudiando derecho. Posteriormente ejerció la abogacía al tiempo que simultaneaba sus actividades políticas y literarias. A los 27 años comenzó a impartir clases de matemáticas aplicadas en la universidad de Londres.

En 1901 fundó la revista “Biométrica”, en la que publicó una biografía monumental de Galton.

A Pearson se deben aportaciones tan importantes como la distribución ji-dos o el test de Karl Pearson para es estudio de la bondad del ajuste de una distribución empírica a otra teórica.

Observa las imágenes que muestran dos simuladores de regresión lineal:



Sigue las instrucciones de utilización de los modelos de simulación de Excel que puedes descargar a continuación:

Modelo 1:
  • Con las flechas se pueden modificar 10 valores de las variables estadísticas x e y entre 0 y 10.
  • Se actualizan inmediatamente el diagrama de dispersión y la recta de regresión.
  • Se obtiene la media y la desviación típica de cada variable.
  • Se obtienen la covarianza y el coeficiente de correlación.
  • Se obtienen la pendiente y la ordenada en el origen de la recta de regresión.
Modelo 2:
  • Con las flechas se pueden modificar 10 valores de las variables estadísticas x e y entre 0 y 10.
  • Se actualizan inmediatamente el diagrama de dispersión y las rectas de regresión.
  • Se obtiene el coeficiente de correlación y el ángulo entre las rectas de regresión.
  • Se obtienen las pendientes y las ordenadas en el origen de las rectas de regresión.
  • Con las flechas de desplazamiento se obtiene el valor esperado de y para un x dado y viceversa.
  • También se observa esta relación gráficamente.
Simuladores 1 y 2