El coeficiente de correlación de Pearson es una medida de la relación lineal entre dos variables aleatorias y cuantitativas. La diferencia entre el coeficiente de correlación y la covarianza no es otra que a éste primero no le afecta la escala de medida de las variables. ¿Qué quiere decir esto? Que si por ejemplo estamos estudiando el grado de relación entre el peso y la altura de un grupo de población, el coeficiente de correlación entre ambas variables no varía si expresamos la altura de algunos individuos en metros y la de otros en centímetros.
En definitiva, el coeficiente de correlación de Pearson podemos definirlo como un índice estadístico que permite evaluar el grado de relación lineal entre dos variables cuantitativas.
Éste índice de correlación se encuentra en el intervalo [-1,1]:
Las notas de 5 alumnos de una clase en Matemáticas y Lengua son:
| Matemáticas (x) | Lengua (y) | xi.yi | xi2 | yi2 |
| 10 | 5 | 50 | 100 | 25 |
| 4 | 7 | 28 | 16 | 49 |
| 3 | 9 | 27 | 9 | 81 |
| 9 | 2 | 18 | 81 | 4 |
| 4 | 6 | 24 | 16 | 36 |
| 30 | 29 | 147 | 222 | 195 |
Hallamos las medias aritméticas de ambas variables
Media de x -> 6
Media de y -> 5,8
Calculamos la covarianza
Covarianza xy -> (147 / 5) – (6 * 5,8) = -5,4
Calculamos las desviaciones típicas
Desviación típica de x = V[(222/5)*62] = 39,97
Desviación típica de y = V[(195/5)*5,82] = 36,22
Aplicamos la fórmula del índice de correlación lineal
r = -5,4 / (36,97 * 36,22) = -0,004 -> El índice es prácticamente 0. Hay una correlación negativa entre las notas de los alumnos en matemáticas y lengua; el grado de relación lineal entre las notas es prácticamente nulo.
En los últimos años, el Big Data se ha desarrollado a pasos cada vez más…
Según datos publicados en noviembre del pasado año 2016, alrededor del 10% de despachos jurídicos…
El Big Data dejó hace unos años de ser un sueño para convertirse en una…
De manera progresiva, el Big Data va formando cada vez más parte de nuestra vida…
El Big Data, de manera paulatina, va apoderándose de distintos ámbitos de nuestro entorno. Una…
En los últimos años se ha hablado mucho sobre el Big Data. Teniendo en cuenta…