Calculateur de Coefficient de Corrélation

Visualisation des données

Calculateur de Coefficient de Corrélation

Qu'est-ce que le Coefficient de Corrélation ?

Le coefficient de corrélation, souvent noté r, est une mesure statistique qui quantifie la force et la direction de la relation linéaire entre deux variables. Il varie de -1 à +1, où :

  • +1 indique une corrélation positive parfaite
  • 0 indique aucune corrélation linéaire
  • -1 indique une corrélation négative parfaite

Formule et ses Composants

La formule du coefficient de corrélation de Pearson est :

\[r = \frac{n(\sum xy) - (\sum x)(\sum y)}{\sqrt{[n\sum x^2 - (\sum x)^2][n\sum y^2 - (\sum y)^2]}}\]

Où :

  • r = coefficient de corrélation
  • n = nombre de paires de données
  • Σxy = somme des produits des données appariées
  • Σx = somme des valeurs x
  • Σy = somme des valeurs y
  • Σx² = somme des valeurs x au carré
  • Σy² = somme des valeurs y au carré

Étapes de Calcul

  1. Calculer Σx, Σy, Σxy, Σx², et Σy²
  2. Calculer le numérateur : n(Σxy) - (Σx)(Σy)
  3. Calculer le dénominateur : \(\sqrt{[n\sum x^2 - (\sum x)^2][n\sum y^2 - (\sum y)^2]}\)
  4. Diviser le numérateur par le dénominateur

Exemple de Calcul

Calculons le coefficient de corrélation pour l'ensemble de données suivant :

X : 1, 2, 3, 4, 5

Y : 2, 4, 5, 4, 5

  1. n = 5
  2. Σx = 1 + 2 + 3 + 4 + 5 = 15
  3. Σy = 2 + 4 + 5 + 4 + 5 = 20
  4. Σxy = (1)(2) + (2)(4) + (3)(5) + (4)(4) + (5)(5) = 70
  5. Σx² = 1² + 2² + 3² + 4² + 5² = 55
  6. Σy² = 2² + 4² + 5² + 4² + 5² = 86
  7. Numérateur : 5(70) - (15)(20) = 50
  8. Dénominateur : \(\sqrt{[5(55) - 15^2][5(86) - 20^2]} = \sqrt{(25)(30)} = \sqrt{750} \approx 27.39\)
  9. r = 50 / 27.39 ≈ 0.83

Représentation Visuelle

r ≈ 0.83

Ce nuage de points représente l'ensemble de données de l'exemple. La ligne rouge indique la corrélation positive entre les variables X et Y.