Calculateur de R-carré (Coefficient de détermination)

Visualisation des données

Calculateur de R-carré (Coefficient de détermination)

Qu'est-ce que le R-carré ?

Le R-carré, également connu sous le nom de coefficient de détermination, est une mesure statistique qui représente la proportion de la variance de la variable dépendante qui est prévisible à partir de la ou des variables indépendantes. Il fournit une mesure de la qualité de la réplication des résultats observés par le modèle, basée sur la proportion de la variation totale des résultats expliquée par le modèle.

Formule et sa signification

La valeur R-carré est calculée comme le carré du coefficient de corrélation (r) entre les valeurs observées et prédites de la variable dépendante :

\[R^2 = r^2 = \left(\frac{n(\sum xy) - (\sum x)(\sum y)}{\sqrt{[n\sum x^2 - (\sum x)^2][n\sum y^2 - (\sum y)^2]}}\right)^2\]

Où :

  • \(n\) est le nombre d'observations
  • \(x\) représente la variable indépendante
  • \(y\) représente la variable dépendante
  • \(\sum\) désigne la somme

Les valeurs R-carré varient de 0 à 1, où :

  • 0 indique que le modèle n'explique aucune variabilité des données de réponse autour de sa moyenne
  • 1 indique que le modèle explique toute la variabilité des données de réponse autour de sa moyenne

Étapes de calcul

  1. Calculer les sommes : \(\sum x\), \(\sum y\), \(\sum xy\), \(\sum x^2\), et \(\sum y^2\)
  2. Calculer le coefficient de corrélation (r) en utilisant la formule ci-dessus
  3. Élever au carré le coefficient de corrélation pour obtenir R-carré

Exemple de calcul

Calculons le R-carré pour l'ensemble de données suivant :

X : 1, 2, 3, 4, 5

Y : 2, 4, 5, 4, 5

  1. Calculer les sommes :
    • \(\sum x = 15\)
    • \(\sum y = 20\)
    • \(\sum xy = 70\)
    • \(\sum x^2 = 55\)
    • \(\sum y^2 = 86\)
  2. Calculer r : \[r = \frac{5(70) - (15)(20)}{\sqrt{[5(55) - 15^2][5(86) - 20^2]}} \approx 0,8018\]
  3. Calculer R-carré : \[R^2 = (0,8018)^2 \approx 0,6429\]

Par conséquent, environ 64,29% de la variance de Y peut être expliquée par la variance de X.

Représentation visuelle

Ce nuage de points représente l'ensemble de données de l'exemple. La ligne rouge indique la ligne de meilleur ajustement, et la proximité des points par rapport à cette ligne représente visuellement la force de la corrélation et, par conséquent, la valeur R-carré.