Des articles

5.4 : Transformations linéaires spéciales dans R²


Objectifs d'apprentissage

  1. Trouver la matrice des rotations et des réflexions dans (mathbb{R}^2) et déterminer l'action de chacune sur un vecteur dans (mathbb{R}^2).

Dans cette section, nous examinerons quelques exemples particuliers de transformations linéaires dans (mathbb{R}^2) incluant les rotations et les réflexions. Nous utiliserons les descriptions géométriques de l'addition vectorielle et de la multiplication scalaire discutées précédemment pour montrer qu'une rotation de vecteurs selon un angle et la réflexion d'un vecteur sur une ligne sont des exemples de transformations linéaires.

Plus généralement, notons une transformation donnée par une rotation par (T). Pourquoi une telle transformation est-elle linéaire ? Considérez l'image suivante qui illustre une rotation. Soit (vec{u},vec{v}) des vecteurs.

Voyons comment obtenir (Tleft [ vec{u}+vec{v} ight ]). Simplement, vous ajoutez (T (vec{u})) et (T(vec{v})). Voici pourquoi. Si vous ajoutez (T(vec{u})) à (T(vec{v})) vous obtenez la diagonale du parallélogramme déterminé par (T(vec{u})) et (T(vec{v})), car cette action est notre addition vectorielle habituelle. Maintenant, supposons que nous ajoutions d'abord (vec{u}) et (vec{v}), puis appliquons la transformation (T) à (vec{u}+vec{v} ). On trouve donc (T( vec{u}+vec{v})). Comme le montre le diagramme, cela se traduira par le même vecteur. Autrement dit, (T(vec{u}+vec{v}) = T(vec{u}) + T(vec{v})).

En effet, la rotation préserve tous les angles entre les vecteurs ainsi que leurs longueurs. En particulier, il préserve la forme de ce parallélogramme. Ainsi à la fois (Tleft [vec{u} ight ]+Tleft [vec{v} ight ]) et (Tleft [vec{u}+vec{v} right ]) donnent le même vecteur. Il s'ensuit que (T) distribue sur l'addition des vecteurs de (mathbb{R}^{2}).

De même, si (k) est un scalaire, il s'ensuit que (Tleft [kvec{u} ight ]=kTleft [vec{u} ight ]). Ainsi, les rotations sont un exemple de transformation linéaire par définition [def:lineartransformation].

Le théorème suivant donne la matrice d'une transformation linéaire qui fait pivoter tous les vecteurs d'un angle de ( heta).

Théorème (PageIndex{1}): Rotation

Soit (R_{ heta}: mathbb{R}^2 o mathbb{R}^2) une transformation linéaire donnée par des vecteurs tournants d'un angle de ( heta). Alors la matrice (A) de (R_{ heta}) est donnée par [left [ egin{array}{rr} cos left [ heta ight ] & -sin left [ heta ight ] sin left [ heta ight ] & cos left [ heta ight ] end{array} ight ]]

Preuve

Soit (vec{e}_{1} = left [ egin{array}{r} 1 0 end{array} ight ]) et (vec{e}_{2} = left [ egin{array}{r} 0 1 end{array} ight ] .) Ceux-ci identifient les vecteurs géométriques qui pointent le long de l'axe positif (x) et positif (y) axe comme indiqué.

À partir du théorème [thm:matrixoflineartransformation], nous devons trouver (R_{ heta}(vec{e}_{1})) et (R_{ heta}(vec{e}_{2} ),) et les utiliser comme colonnes de la matrice (A) de (T). On peut utiliser (func{cos},func{sin}) de l'angle ( heta) pour trouver les coordonnées de (R_{ heta}(vec{e}_{1}) ) comme le montre l'image ci-dessus. Les coordonnées de (R_{ heta}(vec{e}_{2})) découlent également de la trigonométrie. Ainsi [R_{ heta}(vec{e}_{1})=left [ egin{array}{r} cos heta sin heta end{array} ight ] , R_{ heta}(vec{e}_{2})=left [ egin{array}{r} -sin heta cos heta end{array} ight ]] Donc , du théorème [thm:matrixoflineartransformation], [A=left [ egin{array}{rr} cos heta & -sin heta sin heta & cos heta end{array} droite ]]

Nous pouvons également le prouver algébriquement sans utiliser l'image ci-dessus. La définition de (left [ cos left [ heta ight ] ,sin left [ heta ight ] ight ]) est comme les coordonnées du point de (R_{ heta}( vec{e}_{1})). Maintenant, le point du vecteur (vec{e}_{2}) est exactement (pi /2) plus loin le long du cercle unité du point de (vec{e}_{1} ), et donc après rotation d'un angle de ( heta) les coordonnées (x) et (y) du point de (R_{ heta}(vec{e}_{2} )) sont donnés par [left [ x,y ight ] =left [ cos left [ heta +pi /2 ight ] ,sin left [ heta +pi /2 right ] ight ] =left [ -sin heta ,cos heta ight ]]

Considérez l'exemple suivant.

Exemple (PageIndex{1}) : Rotation dans (mathbb{R}^2)

Soit (R_{frac{pi}{2}} : mathbb{R}^2 o mathbb{R}^2) la rotation passant par (pi/2). Trouvez la matrice de (R_{frac{pi}{2}}). Ensuite, trouvez (R_{frac{pi}{2}} (vec{x})) où (vec{x} = left [ egin{array}{r} 1 - 2 end{tableau} ight ]).

Solution

Par le théorème [thm:rotation], la matrice de (R_{frac{pi}{2}}) est donnée par [left [ egin{array}{rr} cos left [ heta ight ] & -sin left [ heta ight ] sin left [ heta ight ] & cos left [ heta ight ] end{array} ight ] = left [ egin{array}{rr} cos left [ pi/2 ight ] & -sin left [ pi/2 ight ] sin left [ pi/2 ight ] & cos left [ pi/2 ight ] end{array} ight ] = left [ egin{array}{rr} 0 & -1 1 & 0 end{array} ight ]]

Pour trouver (R_{frac{pi}{2}} (vec{x})), on multiplie la matrice de (R_{frac{pi}{2}}) par ( vec{x}) comme suit [left [ egin{array}{rr} 0 & -1 1 & 0 end{array} ight ] left [ egin{array}{r} 1 -2 end{array} ight ] = left [ egin{array}{r} 2 1 end{array} ight ]]

Voyons maintenant un exemple de transformation linéaire impliquant deux angles.

Exemple (PageIndex{2}): La matrice de rotation de la somme de deux angles

Trouvez la matrice de la transformation linéaire qui est obtenue en faisant d'abord tourner tous les vecteurs d'un angle de (phi) puis d'un angle ( heta .) Par conséquent, la transformation linéaire fait tourner tous les vecteurs d'un angle de ( heta +phi .)

Solution

Soit (R_{ heta +phi }) la transformation linéaire qui fait tourner chaque vecteur d'un angle de ( heta +phi .) Alors pour obtenir (R_{ heta +phi }, ) on applique d'abord (R_{phi }) puis (R_{ heta }) où (R_{phi }) est la transformation linéaire qui tourne d'un angle de (phi) et (R_{ heta }) est la transformation linéaire qui tourne d'un angle de ( heta). En désignant les matrices correspondantes par (A_{ heta +phi }), (A_{phi },) et (A_{ heta },) il s'ensuit que pour tout (vec{u }) [R_{ heta +phi }left [vec{u} ight ]=A_{ heta +phi }vec{u}=A_{ heta }A_{phi } vec{u} = R_{ heta }R_{phi } left [vec{u} ight ]] Notez l'ordre des matrices ici !

Par conséquent, vous devez avoir [egin{aligned} A_{ heta +phi } &=&left [ egin{array}{cc} cos left [ heta +phi ight ] & - sin left [ heta +phi ight ] sin left [ heta +phi ight ] & cos left [ heta +phi ight ] end{array} ight ] &=&left [ egin{array}{cc} cos heta & -sin heta sin heta & cos heta end{array} ight ] left [ egin{ array}{cc} cos phi & -sin phi sin phi & cos phi end{array} ight ] =A_{ heta }A_{phi } end{aligned} ]

La multiplication matricielle habituelle donne [egin{aligned} A_{ heta +phi } &=& left [ egin{array}{cc} cos left [ heta +phi ight ] & - sin left [ heta +phi ight ] sin left [ heta +phi ight ] & cos left [ heta +phi ight ] end{array} ight ] &=&left [ egin{array}{cc} cos heta cos phi -sin heta sin phi & -cos heta sin phi -sin heta cos phi sin heta cos phi +cos heta sin phi & cos heta cos phi -sin heta sin phi end{array} ight ] &= & A_{ heta }A_{phi } end{aligné}]

Cela ne vous semble-t-il pas familier ? Ce sont les identités trigonométriques habituelles pour la somme de deux angles dérivés ici en utilisant des concepts d'algèbre linéaire.

Ici, nous nous sommes concentrés sur les rotations en deux dimensions. Cependant, vous pouvez envisager des rotations et d'autres concepts géométriques dans un nombre quelconque de dimensions. C'est l'un des principaux avantages de l'algèbre linéaire. Vous pouvez décomposer une procédure géométrique difficile en petites étapes, chacune correspondant à une multiplication par une matrice appropriée. Ensuite, en multipliant les matrices, vous pouvez obtenir une seule matrice qui peut vous donner des informations numériques sur les résultats de l'application de la séquence donnée de procédures simples.

Les transformations linéaires qui reflètent les vecteurs sur une ligne sont un deuxième type important de transformations dans (mathbb{R}^2). Considérons le théorème suivant.

Théorème (PageIndex{2}): Réflexion

Soit (Q_m: mathbb{R}^2 o mathbb{R}^2) une transformation linéaire donnée en réfléchissant des vecteurs sur la ligne (vec{y}=mvec{x}) . Alors la matrice de (Q_m) est donnée par [frac{1}{1+m^2} left [ egin{array}{cc} 1-m^2 & 2m 2m & m^ 2-1 end{tableau} ight ]]

Considérez l'exemple suivant.

Exemple (PageIndex{3}) : Réflexion dans (mathbb{R}^2)

Soit (Q_2: mathbb{R}^2 o mathbb{R}^2) la réflexion sur la ligne (vec{y}=2vec{x}). Alors (Q_2) est une transformation linéaire. Trouvez la matrice de (Q_2). Ensuite, trouvez (Q_2 (vec{x})) où (vec{x} = left [ egin{array}{r} 1 -2 end{array} ight ]) .

Solution

Par le théorème [thm:reflection], la matrice de (Q_2) est donnée par [frac{1}{1+m^2} left [ egin{array}{cc} 1-m^2 & 2m 2m & m^2-1 end{array} ight ] = frac{1}{1+(2)^2} left [ egin{array}{cc} 1-(2)^ 2 & 2(2) 2(2) & (2)^2-1 end{array} ight ] = frac{1}{5} left [ egin{array}{rr} -3 & 8 8 & 3 end{tableau} ight ]]

Pour trouver (Q_2(vec{x})) on multiplie (vec{x}) par la matrice de (Q_2) comme suit : [frac{1}{5} left [ egin{array}{rr} -3 & 8 8 & 3 end{array} ight ] left [ egin{array}{r} 1 -2 end{array} ight ] = left [ egin{array}{r} - frac{19}{5} frac{2}{5} end{array} ight ]]

Considérons l'exemple suivant qui incorpore une réflexion ainsi qu'une rotation de vecteurs.

Exemple (PageIndex{4}) : Rotation suivie d'une réflexion

Trouvez la matrice de la transformation linéaire qui est obtenue en faisant d'abord tourner tous les vecteurs d'un angle de (pi /6) puis en réfléchissant à travers l'axe (x).

Solution

D'après le théorème [thm:rotation], la matrice de la transformation qui implique une rotation d'un angle de (pi /6) est [left [ egin{array}{rr} cos left [ pi / 6 ight ] & -sin left [ pi /6 ight ] sin left [ pi /6 ight ] & cos left [ pi /6 ight ] end{array} ight ] =left [ egin{array}{cc} frac{1}{2}sqrt{3} & - frac{1}{2} frac{1}{2} & frac{1}{2}sqrt{3} end{array} ight ]]

La réflexion sur l'axe (x) est la même action que la réflexion des vecteurs sur la ligne (vec{y}=mvec{x}) avec (m=0). Par le théorème [thm:reflection], la matrice pour la transformation qui reflète tous les vecteurs à travers l'axe (x) est [frac{1}{1+m^2} left [ egin{array}{cc } 1-m^2 & 2m 2m & m^2-1 end{array} ight ] = frac{1}{1+(0)^2} left [ egin{array}{cc } 1-(0)^2 & 2(0) 2(0) & (0)^2-1 end{array} ight ] = left [ egin{array}{rr} 1 & 0 0 & -1 end{tableau} ight ]]

Par conséquent, la matrice de la transformation linéaire qui tourne d'abord sur (pi /6) puis se réfléchit sur l'axe (x) est donnée par [left [ egin{array}{rr} 1 & 0 0 & -1 end{array} ight ] left [ egin{array}{rr} frac{1}{2}sqrt{3} & - frac{1}{2} frac{1}{2} & frac{1}{2}sqrt{3} end{array} ight ] = left [ egin{array}{rr} frac{1}{2 }sqrt{3} & - frac{1}{2} - frac{1}{2} & - frac{1}{2}sqrt{3} end{array} ight ] ]


Coefficient de détermination

En statistiques, le coefficient de détermination, noté R 2 ou r 2 et prononcé "R au carré", est la proportion de la variance dans la variable dépendante qui est prévisible à partir de la ou des variables indépendantes.

Il s'agit d'une statistique utilisée dans le cadre de modèles statistiques dont l'objectif principal est soit la prédiction de résultats futurs, soit la vérification d'hypothèses, sur la base d'autres informations connexes. Il fournit une mesure de la façon dont les résultats observés sont reproduits par le modèle, en fonction de la proportion de la variation totale des résultats expliquée par le modèle. [1] [2] [3]

Il existe plusieurs définitions de R 2 qui ne sont que parfois équivalents. Une classe de tels cas comprend celle de la régression linéaire simple où r 2 est utilisé au lieu de R 2 . Lorsqu'une interception est incluse, alors r 2 est simplement le carré du coefficient de corrélation de l'échantillon (c'est-à-dire, r) entre les résultats observés et les valeurs des prédicteurs observés. [4] Si des régresseurs supplémentaires sont inclus, R 2 est le carré du coefficient de corrélation multiple. Dans les deux cas, le coefficient de détermination varie normalement de 0 à 1.

Il existe des cas où la définition informatique de R 2 peut donner des valeurs négatives, selon la définition utilisée. Cela peut se produire lorsque les prédictions comparées aux résultats correspondants n'ont pas été dérivées d'une procédure d'ajustement de modèle utilisant ces données. Même si une procédure d'ajustement du modèle a été utilisée, R 2 peut toujours être négatif, par exemple lorsqu'une régression linéaire est effectuée sans inclure d'interception, [5] ou lorsqu'une fonction non linéaire est utilisée pour ajuster les données. [6] Dans les cas où des valeurs négatives surviennent, la moyenne des données fournit un meilleur ajustement aux résultats que les valeurs de fonction ajustées, selon ce critère particulier.

Un article publié dans la revue PeerJ Computer Science en 2021 indique que le coefficient de détermination peut être plus véridique que SMAPE, MAE, MAPE, MSE et RMSE dans l'évaluation de l'analyse de régression [7] .

Lors de l'évaluation de l'adéquation de l'ajustement simulé (Ouipred) vs mesuré (Ouiobs), il n'est pas approprié de se baser sur les R 2 de la régression linéaire (c'est-à-dire, Ouiobs= m·Ouipred +b). [8] Le R 2 quantifie le degré de toute corrélation linéaire entre Ouiobs et Ouipred, tandis que pour l'évaluation de la qualité de l'ajustement, une seule corrélation linéaire spécifique doit être prise en considération : Ouiobs = 1·Ouipred + 0 (c'est-à-dire la ligne 1:1). [9] [10]


Soit $_1, mathbf_2>$ soit la base standard pour $R^2$.
Alors la représentation matricielle $A$ de la transformation linéaire $T$ est donnée par
[A=[T(mathbf_1), T(mathbf_2)].] Sur la figure, on voit que
[mathbf_1=commencer
-3\ 1
finir ext < et >mathbf_2=commencer
5\ 2
finir,] et
[T(mathbf_1)=commencer
2\ 2
finir ext < et >T(mathbf_2)=commencer
1\ 3
finir.]

Les valeurs de $T(mathbf_1)$ et $T(mathbf_2)$ ne sont pas indiqués dans la figure mais nous pouvons déterminer ces valeurs comme suit.
Notez que $_1, mathbf_2>$ est une base pour $R^2$ (car ils sont linéairement indépendants de la figure).

Exprimons $mathbf_1$ comme combinaison linéaire de $mathbf-1$ et $mathbf_2$.
Laisser
[mathbf_1=c_1mathbf_1+c_2mathbf_2,] où $c_1, c_2$ sont des scalaires à déterminer.

En conclusion, la représentation matricielle de $T$ est
[A=[T(mathbf_1), T(mathbf_2)]=frac<1><11>egin
-3& 13 \
-1& 19
finir.] Cliquez ici si résolu 32


Analyse graphique

Le but de cet exercice est de construire un modèle de régression simple que nous pouvons utiliser pour prédire la distance (dist) en établissant une relation linéaire statistiquement significative avec la vitesse (vitesse). Mais avant de passer à la syntaxe, essayons de comprendre graphiquement ces variables. En règle générale, pour chacune des variables indépendantes (prédicteurs), les graphiques suivants sont tracés pour visualiser le comportement suivant :

  1. Nuage de points: Visualisez la relation linéaire entre le prédicteur et la réponse
  2. Box plot: pour repérer toute observation aberrante dans la variable. Avoir des valeurs aberrantes dans votre prédicteur peut affecter considérablement les prédictions car elles peuvent facilement affecter la direction/pente de la ligne de meilleur ajustement.
  3. Diagramme de densité: Pour voir la distribution de la variable prédictive. Idéalement, une distribution proche de la normale (courbe en cloche), sans être asymétrique vers la gauche ou la droite est préférable. Voyons comment faire chacun d'eux.

Nuage de points

Les nuages ​​de points peuvent aider à visualiser les relations linéaires entre la variable dépendante (réponse) et les variables indépendantes (prédicteur). Idéalement, si vous avez plusieurs variables prédictives, un nuage de points est tracé pour chacune d'entre elles par rapport à la réponse, ainsi que la ligne des meilleures comme indiqué ci-dessous.

Le nuage de points et la ligne de lissage ci-dessus suggèrent une relation linéairement croissante entre les variables « dist » et « vitesse ». C'est une bonne chose, car l'une des hypothèses sous-jacentes de la régression linéaire est que la relation entre la réponse et les variables prédictives est linéaire et additive.

BoxPlot - Vérifiez les valeurs aberrantes

En règle générale, tout point de données situé en dehors de la plage interquartile de 1,5 * (1,5 * jeQR ) est considéré comme une valeur aberrante, où IQR est calculé comme la distance entre les valeurs du 25e et du 75e centile pour cette variable.

Diagramme de densité - Vérifiez si la variable de réponse est proche de la normalité


Terminologie de la régression linéaire

Avant d'aller plus loin, je veux parler de la terminologie elle-même, car je vois qu'elle embrouille de nombreux scientifiques en herbe. Réparons cela ici !

D'accord, une dernière fois, c'était notre formule de fonction linéaire :

Les variables a et b :

Les variables a et b de cette équation définissent la position de votre droite de régression et j'ai déjà mentionné que la variable a est appelée pente (car elle définit la pente de votre droite) et la variable b s'appelle intercepter.

Dans la communauté de l'apprentissage automatique, la variable a (la pente) est aussi souvent appelé le Coefficient de régression.

Les variables x et y :

La variable x dans l'équation est la variable d'entrée — et y est le variable de sortie.
C'est aussi une convention de nommage très intuitive. Par exemple, dans cette équation :

Si votre valeur d'entrée est x = 1 , votre valeur de sortie sera y = -1,89 .

Mais dans l'apprentissage automatique, ces paires de valeurs x-y ont de nombreux noms alternatifs… ce qui peut causer des maux de tête. Voici donc quelques synonymes courants que vous devriez connaître :

  • variable d'entrée (x) – variable de sortie ( y )
  • variable indépendante (x) – variable dépendante ( y )
  • variable prédictive (x) – variable prédite ( y )
  • fonctionnalité (x) – cibler ( y )

Vous voyez, la confusion n'est pas un accident… Mais au moins, vous avez maintenant votre dictionnaire de régression linéaire ici.


Interprétation R au carré | Régression linéaire au carré R

L'apprentissage automatique implique beaucoup de statistiques. Dans l'article suivant, nous examinerons le concept de R-Squared qui est utile dans la sélection des fonctionnalités.

La corrélation (autrement appelée « R ») est un nombre compris entre 1 et -1 où une valeur de +1 implique qu'une augmentation de x entraîne une certaine augmentation de y, -1 implique qu'une augmentation de x entraîne une diminution de y , et 0 signifie qu'il n'y a aucune relation entre x et y. Comme la corrélation, R² vous indique à quel point deux choses sont liées. Cependant, nous avons tendance à utiliser R² car il est plus facile à interpréter. R² est le pourcentage de variation (c'est-à-dire varie de 0 à 1) expliqué par la relation entre deux variables.

Ce dernier semble plutôt alambiqué, alors jetons un coup d'œil à un exemple. Supposons que nous décidions de tracer la relation entre le salaire et les années d'expérience. Dans le graphique suivant, chaque point de données représente un individu.

Nous pouvons calculer la moyenne ou la moyenne en prenant la somme de tous les individus de l'échantillon et en la divisant par le nombre total d'individus de l'échantillon.

La variance de l'ensemble de données entier est égale à la somme de la distance entre chaque point de données et la moyenne au carré. La différence est au carré de sorte que les points en dessous de la moyenne ne s'annulent pas avec les points au-dessus de la moyenne.

Disons maintenant que nous avons pris les mêmes personnes, mais cette fois, nous avons décidé de tracer la relation entre leur salaire et leur taille.

Remarquez comment le salaire moyen reste le même indépendamment de ce que nous considérons comme la variable indépendante. En d'autres termes, nous pouvons utiliser d'autres aspects de la vie des gens comme Xmais le salaire restera le même.

Supposons que nous utilisions la régression linéaire pour trouver le meilleur ajustement ligne.

La valeur de peut alors s'exprimer par :

var (moyenne) est la variance par rapport à la moyenne et var(ligne) est la variance par rapport à la ligne.

Comme nous l'avons mentionné précédemment, la variance peut être calculée en faisant la somme des différences entre les salaires individuels et la moyenne au carré.

En utilisant la même logique, nous pouvons déterminer la variation autour de la ligne orange.

En supposant que nous obtenions les valeurs suivantes pour la variance de la ligne et de la moyenne.

On peut calculer en utilisant la formule décrite précédemment.

La valeur R² implique qu'il y a 96% moins de variation autour de la ligne que la moyenne. En d'autres termes, le rapport entre le salaire et les années d'expérience explique 96 % de la variation. En d'autres termes, les années d'expérience sont un bon indicateur de salaire, car lorsque les années d'expérience augmentent, le salaire augmente également et vice versa.

Voyons comment nous pourrions utiliser R² pour évaluer un modèle de régression linéaire. Pour commencer, importez les bibliothèques suivantes.

Nous utiliserons l'ensemble de données suivant. Si vous souhaitez suivre, copiez son contenu dans un fichier csv.

Nous chargeons les données dans notre programme à l'aide de pandas et les traçons à l'aide de matplotlib.

Ensuite, nous formons un modèle de régression linéaire sur nos données salariales.

Nous pouvons voir la meilleure ligne d'ajustement produite par notre modèle en exécutant les lignes suivantes.

Ensuite, nous calculons R² en utilisant la formule discutée dans la section précédente.

Plutôt que de l'implémenter à partir de zéro à chaque fois, nous pouvons tirer parti de la fonction sklearn r2_score.


Cette définition peut aussi s'écrire [3]

D'autres noms pour la transposée conjuguée d'une matrice sont Conjugué hermitien, matrice choquée, matrice adjointe ou alors transjuguer. La transposée conjuguée d'une matrice A > peut être désignée par l'un de ces symboles :

Supposons que l'on veuille calculer la transposée conjuguée de la matrice suivante A > .

On transpose d'abord la matrice :

Ensuite, nous conjuguons chaque entrée de la matrice :

La transposition conjuguée peut être motivée en notant que les nombres complexes peuvent être utilement représentés par des matrices réelles 2 × 2, obéissant à l'addition et à la multiplication matricielles :

C'est-à-dire en désignant chaque complexe numéro z par le réel Matrice 2×2 de la transformation linéaire sur le diagramme d'Argand (considérée comme la réel espace vectoriel R 2 ^<2>> ), affecté par le complexe z-multiplication sur C > .

Ainsi, un m-par-m matrice de nombres complexes pourrait être bien représentée par un 2m-par-2m matrice de nombres réels. La transposition conjuguée survient donc très naturellement comme résultat de la simple transposition d'une telle matrice - lorsqu'elle est considérée à nouveau comme m-par-m matrice composée de nombres complexes.


Contenu

De nombreux physiciens, dont Woldemar Voigt, George FitzGerald, Joseph Larmor et Hendrik Lorentz [4] lui-même, discutaient de la physique impliquée par ces équations depuis 1887. [5] Au début de 1889, Oliver Heaviside avait montré à partir des équations de Maxwell que l'électricité le champ entourant une distribution sphérique de charge devrait cesser d'avoir une symétrie sphérique une fois que la charge est en mouvement par rapport à l'éther. FitzGerald a alors conjecturé que le résultat de distorsion de Heaviside pourrait être appliqué à une théorie des forces intermoléculaires. Quelques mois plus tard, FitzGerald a publié la conjecture selon laquelle les corps en mouvement se contractent, afin d'expliquer le résultat déconcertant de l'expérience de 1887 sur le vent d'éther de Michelson et Morley. En 1892, Lorentz a présenté indépendamment la même idée de manière plus détaillée, qui a ensuite été appelée hypothèse de contraction FitzGerald-Lorentz. [6] Leur explication était largement connue avant 1905. [7]

Lorentz (1892-1904) et Larmor (1897-1900), qui croyaient à l'hypothèse de l'éther luminifère, ont également recherché la transformation sous laquelle les équations de Maxwell sont invariantes lorsqu'elles sont transformées de l'éther en un référentiel mobile. Ils ont étendu l'hypothèse de contraction de FitzGerald-Lorentz et ont découvert que la coordonnée temporelle doit également être modifiée (« heure locale »). Henri Poincaré a donné une interprétation physique de l'heure locale (au premier ordre en v/c, la vitesse relative des deux référentiels normalisée à la vitesse de la lumière) comme conséquence de la synchronisation d'horloge, en supposant que la vitesse de la lumière est constante dans les référentiels en mouvement. [8] Larmor est crédité d'avoir été le premier à comprendre la propriété cruciale de dilatation du temps inhérente à ses équations. [9]

En 1905, Poincaré fut le premier à reconnaître que la transformation avait les propriétés d'un groupe mathématique et lui donna le nom de Lorentz. [10] Plus tard dans la même année, Albert Einstein a publié ce qu'on appelle maintenant la relativité restreinte, en dérivant la transformation de Lorentz sous les hypothèses du principe de relativité et de la constance de la vitesse de la lumière dans n'importe quel référentiel inertiel, et en abandonnant le l'éther comme inutile. [11]

Une un événement est quelque chose qui se passe à un certain point dans l'espace-temps, ou plus généralement, le point dans l'espace-temps lui-même. Dans tout référentiel inertiel, un événement est spécifié par une coordonnée temporelle ct et un ensemble de coordonnées cartésiennes X, oui, z pour spécifier la position dans l'espace dans ce cadre. Les indices étiquettent des événements individuels.

Du deuxième postulat de relativité d'Einstein (invariance de c) il s'ensuit que :

dans tous les référentiels inertiels pour les événements connectés par signaux lumineux. La quantité de gauche est appelée la intervalle espace-temps entre les événements une1 = (t1, X1, oui1, z1) et une2 = (t2, X2, oui2, z2) . L'intervalle entre deux quelconques événements, pas nécessairement séparés par des signaux lumineux, est en fait invariant, c'est-à-dire indépendant de l'état de mouvement relatif des observateurs dans différents référentiels inertiels, comme le montre l'homogénéité et l'isotropie de l'espace. La transformation recherchée doit donc posséder la propriété que :

où (ct, X, oui, z) sont les coordonnées spatio-temporelles utilisées pour définir les événements dans une image, et (ct′, X′, oui′, z′) sont les coordonnées dans un autre cadre. On constate d'abord que (D2) est satisfait si un 4-uplet arbitraire b des nombres sont ajoutés aux événements une1 et une2 . De telles transformations sont appelées traductions de l'espace-temps et ne sont pas traités davantage ici. On observe alors qu'un linéaire la solution préservant l'origine du problème plus simple résout également le problème général :

(une solution satisfaisant la formule de gauche satisfait automatiquement celle de droite voir également l'identité de polarisation). Trouver la solution au problème le plus simple n'est qu'une question de recherche dans la théorie des groupes classiques qui préservent des formes bilinéaires de diverses signatures. [nb 2] Première équation dans (D3) peut s'écrire de manière plus compacte comme :

où (·, ·) fait référence à la forme bilinéaire de signature (1, 3) sur ℝ 4 exposée par la formule de droite dans (D3). La notation alternative définie à droite est appelée la produit scalaire relativiste. L'espace-temps mathématiquement considéré comme 4 doté de cette forme bilinéaire est connu sous le nom d'espace de Minkowski M . La transformation de Lorentz est donc un élément du groupe O(1, 3) , le groupe de Lorentz ou, pour ceux qui préfèrent l'autre signature métrique, O(3, 1) (appelé aussi groupe de Lorentz). [nb 3] On a :

qui est précisément la préservation de la forme bilinéaire (D3) ce qui implique (par linéarité de et bilinéarité de la forme) que (D2) est satisfait. Les éléments du groupe de Lorentz sont les rotations et booste et leurs mélanges. Si les traductions de l'espace-temps sont incluses, alors on obtient le groupe de Lorentz inhomogène ou le groupe Poincaré.

Les relations entre les coordonnées spatio-temporelles amorcées et non amorcées sont les Transformations de Lorentz, chaque coordonnée dans un cadre est une fonction linéaire de toutes les coordonnées dans l'autre cadre, et les fonctions inverses sont la transformation inverse. En fonction de la façon dont les images se déplacent les unes par rapport aux autres et de la façon dont elles sont orientées dans l'espace les unes par rapport aux autres, d'autres paramètres décrivant la direction, la vitesse et l'orientation entrent dans les équations de transformation.

Les transformations décrivant un mouvement relatif avec une vitesse constante (uniforme) et sans rotation des axes de coordonnées spatiales sont appelées booste, et la vitesse relative entre les images est le paramètre de la transformation. L'autre type de base de transformation de Lorentz est la rotation dans les coordonnées spatiales uniquement, ces mêmes accélérations sont des transformations inertielles car il n'y a pas de mouvement relatif, les cadres sont simplement inclinés (et non en rotation continue), et dans ce cas, les quantités définissant la rotation paramètres de la transformation (par exemple, représentation axe-angle, ou angles d'Euler, etc.). Une combinaison d'une rotation et d'un boost est un transformation homogène, qui retransforme l'origine en origine.

Le groupe complet de Lorentz O (3, 1) contient également des transformations spéciales qui ne sont ni des rotations ni des accélérations, mais plutôt des réflexions dans un plan passant par l'origine. Deux d'entre elles peuvent être distinguées, l'inversion spatiale dans laquelle les coordonnées spatiales de tous les événements sont inversées en signe et l'inversion temporelle dans laquelle la coordonnée temporelle de chaque événement obtient son signe inversé.

Les boosts ne doivent pas être confondus avec de simples déplacements dans l'espace-temps dans ce cas, les systèmes de coordonnées sont simplement décalés et il n'y a pas de mouvement relatif. Cependant, ceux-ci comptent aussi comme des symétries forcées par la relativité restreinte puisqu'ils laissent l'intervalle espace-temps invariant. Une combinaison d'une rotation avec un boost, suivie d'un décalage dans l'espace-temps, est un transformation de Lorentz inhomogène, un élément du groupe de Poincaré, également appelé groupe inhomogène de Lorentz.

Transformation de coordonnées Modifier

Un observateur "stationnaire" dans le cadre F définit des événements avec des coordonnées t, X, oui, z . Un autre cadre Fse déplace avec la vitesse v relatif à F , et un observateur dans ce cadre "mobile" Fdéfinit les événements en utilisant les coordonnées t′, X′, oui′, z′ .

Les axes de coordonnées dans chaque image sont parallèles (le X et Xles axes ′ sont parallèles, les oui et ouiles axes ′ sont parallèles et les z et zles axes ′ sont parallèles), restent mutuellement perpendiculaires et le mouvement relatif est le long de la coïncidence xx′ haches. À t = t′ = 0 , les origines des deux systèmes de coordonnées sont les mêmes, (x, y, z) = (X′, oui′, z) = (0, 0, 0) . En d'autres termes, les temps et les positions coïncident lors de cet événement. Si tout cela est vérifié, alors les systèmes de coordonnées sont dits dans configuration standard, ou alors synchronisé.

Si un observateur en F enregistre un événement t, x, y, z , puis un observateur dans Fenregistre le même événement avec coordonnées [13]

v est la vitesse relative entre les images dans le X -direction, c est la vitesse de la lumière et

Ici, v est le paramètre de la transformation, pour un boost donné c'est un nombre constant, mais peut prendre une plage continue de valeurs. Dans la configuration utilisée ici, la vitesse relative positive v > 0 est le mouvement le long des directions positives du xxaxes, vitesse relative nulle v = 0 n'est pas un mouvement relatif, tandis que la vitesse relative négative v < 0 est le mouvement relatif le long des directions négatives du xxaxes. La grandeur de la vitesse relative v ne peut pas égaler ou dépasser c , donc seulement les vitesses subluminales −c < v < c sont autorisés. La gamme correspondante de γ est 1 γ < .

Les transformations ne sont pas définies si v est en dehors de ces limites. A la vitesse de la lumière ( v = c ) γ est infini, et plus rapide que la lumière ( v > c ) γ est un nombre complexe, dont chacun rend les transformations non physiques. Les coordonnées spatiales et temporelles sont des quantités mesurables et numériquement doivent être des nombres réels.

En tant que transformation active, un observateur dans F′ remarque les coordonnées de l'événement à "booster" dans les directions négatives de la xxaxes, à cause du −v dans les métamorphoses. Cela a l'effet équivalent de la système de coordonnées F′ amplifié dans les directions positives de la xxaxes, tandis que l'événement ne change pas et est simplement représenté dans un autre système de coordonnées, une transformation passive.

Les relations inverses ( t, X, oui, z en terme de t′, X′, oui′, z′ ) peut être trouvé en résolvant algébriquement l'ensemble d'équations d'origine. Un moyen plus efficace consiste à utiliser des principes physiques. Ici Fest le repère "stationnaire" tandis que F est le cadre "mobile". Selon le principe de relativité, il n'y a pas de référentiel privilégié, donc les transformations de F' à F doit prendre exactement la même forme que les transformations de F à F. La seule différence est F se déplace avec la vitesse −v relatif à F(c'est-à-dire que la vitesse relative a la même amplitude mais est dirigée de manière opposée). Ainsi, si un observateur en Fnote un événement t′, X′, oui′, z′ , alors un observateur dans F note le même événement avec coordonnées

et la valeur de γ reste inchangé. Cette "astuce" consistant à simplement inverser la direction de la vitesse relative tout en préservant son amplitude et en échangeant des variables amorcées et non amorcées, s'applique toujours à trouver la transformation inverse de chaque impulsion dans n'importe quelle direction.

Parfois, il est plus pratique d'utiliser β = v/c (bêta minuscule) au lieu de v , pour que

ce qui montre beaucoup plus clairement la symétrie dans la transformation. Dans les plages autorisées de v et la définition de β , il suit −1 < β < 1 . L'utilisation de β et γ est standard dans toute la littérature.

Les transformations de Lorentz peuvent également être dérivées d'une manière qui ressemble à des rotations circulaires dans l'espace 3D en utilisant les fonctions hyperboliques. Pour le coup de pouce dans le X direction, les résultats sont

ζ (zêta minuscule) est un paramètre appelé rapidité (de nombreux autres symboles sont utilisés, y compris , , , , , ). Compte tenu de la forte ressemblance avec les rotations des coordonnées spatiales dans l'espace 3D dans les plans cartésiens xy, yz et zx, un boost de Lorentz peut être considéré comme une rotation hyperbolique des coordonnées espace-temps dans les plans xt, yt et zt de temps cartésien de Espace de Minkowski 4D. Le paramètre ζ est l'angle de rotation hyperbolique, analogue à l'angle ordinaire des rotations circulaires. Cette transformation peut être illustrée par un diagramme de Minkowski.

Les fonctions hyperboliques résultent de la différence entre les carrés du temps et les coordonnées spatiales dans l'intervalle espace-temps, plutôt qu'une somme. La signification géométrique des fonctions hyperboliques peut être visualisée en prenant X = 0 ou ct = 0 dans les transformations. En mettant au carré et en soustrayant les résultats, on peut dériver des courbes hyperboliques de valeurs de coordonnées constantes mais variables ζ , qui paramétre les courbes selon l'identité

A l'inverse le ct et X les axes peuvent être construits pour des coordonnées variables mais constantes ζ . La définition

fait le lien entre une valeur constante de rapidité, et la pente de la ct axe dans l'espace-temps. Une conséquence de ces deux formules hyperboliques est une identité qui correspond au facteur de Lorentz

En comparant les transformations de Lorentz en termes de vitesse relative et de rapidité, ou en utilisant les formules ci-dessus, les connexions entre β , γ , et ζ sommes

Prendre la tangente hyperbolique inverse donne la rapidité

Depuis -1 < β < 1 , il suit −∞ < ζ < . De la relation entre ζ et β , rapidité positive ζ > 0 est le mouvement le long des directions positives du xxaxes, vitesse nulle ζ = 0 n'est pas un mouvement relatif, tandis que la rapidité négative ζ < 0 est le mouvement relatif le long des directions négatives du xxaxes.

Les transformations inverses sont obtenues en échangeant des quantités amorcées et non amorcées pour changer les cadres de coordonnées, et en niant la rapidité ζ → −ζ car cela équivaut à nier la vitesse relative. Donc,

Les transformations inverses peuvent être visualisées de la même manière en considérant les cas où X= 0 et ct′ = 0 .

Jusqu'à présent, les transformations de Lorentz ont été appliquées à un événement. S'il y a deux événements, il y a une séparation spatiale et un intervalle de temps entre eux. Il résulte de la linéarité des transformations de Lorentz que deux valeurs de coordonnées spatiales et temporelles peuvent être choisies, les transformations de Lorentz peuvent être appliquées à chacune, puis soustraites pour obtenir les transformations de Lorentz des différences

où Δ (delta majuscule) indique une différence de quantités, par exemple, ΔX = X2X1 pour deux valeurs de X coordonnées, et ainsi de suite.

Ces transformations sur différences plutôt que des points spatiaux ou des instants de temps sont utiles pour un certain nombre de raisons :

  • dans les calculs et les expériences, ce sont les longueurs entre deux points ou intervalles de temps qui sont mesurés ou d'intérêt (par exemple, la longueur d'un véhicule en mouvement, ou le temps qu'il faut pour se déplacer d'un endroit à un autre),
  • les transformations de la vitesse peuvent être facilement dérivées en faisant la différence infiniment petite et en divisant les équations, et le processus répété pour la transformation de l'accélération,
  • si les systèmes de coordonnées ne coïncident jamais (c'est-à-dire pas dans la configuration standard), et si les deux observateurs peuvent se mettre d'accord sur un événement t0, X0, oui0, z0 dans F et t0′, X0′, oui0′, z0' dans F′ , alors ils peuvent utiliser cet événement comme origine, et les différences de coordonnées d'espace-temps sont les différences entre leurs coordonnées et cette origine, par exemple, ΔX = XX0 ,X′ = X′ − X0' , etc.

Implications physiques Modifier

Une exigence critique des transformations de Lorentz est l'invariance de la vitesse de la lumière, un fait utilisé dans leur dérivation, et contenu dans les transformations elles-mêmes. Si dans F l'équation d'une impulsion lumineuse le long de la X la direction est X = ct , puis dans F′ les transformations de Lorentz donnent X′ = ct′ , et vice versa, pour tout −c < v < c .

Pour des vitesses relatives bien inférieures à la vitesse de la lumière, les transformations de Lorentz se réduisent à la transformation galiléenne

conformément au principe de correspondance. On dit parfois que la physique non relativiste est une physique de "l'action instantanée à distance". [14]

Trois prédictions contre-intuitives, mais correctes, des transformations sont :

Relativité de la simultanéité Supposons que deux événements se produisent simultanément ( Δt = 0 ) le long de l'axe x, mais séparés par un déplacement non nul ΔX . Puis dans F′ , on trouve que Δ t ′ = γ − v Δ x c 2 >>> , donc les événements ne sont plus simultanés selon un observateur en mouvement. Dilatation du temps Supposons qu'il y ait une horloge au repos dans F . Si un intervalle de temps est mesuré au même point dans cette trame, de sorte que ΔX = 0 , alors les transformations donnent cet intervalle en Fpar Δt′ = γΔt . Inversement, supposons qu'il y ait une horloge au repos dans F. Si un intervalle est mesuré au même point dans cette trame, de sorte que ΔX′ = 0 , alors les transformations donnent cet intervalle dans F par Δt = γΔt. Dans tous les cas, chaque observateur mesure l'intervalle de temps entre les tics d'une horloge en mouvement pour être plus long d'un facteur γ que l'intervalle de temps entre les tics de sa propre horloge. Contraction de la longueur Supposons qu'il y ait une tige au repos dans F aligné le long de l'axe x, de longueurX . Dans F′ , la tige se déplace avec la vitesse -v , donc sa longueur doit être mesurée en prenant deux simultanément (t′ = 0 ) mesures aux extrémités opposées. Dans ces conditions, la transformée de Lorentz inverse montre que ΔX = γΔX. Dans F les deux mesures ne sont plus simultanées, mais cela n'a pas d'importance car la tige est au repos dans F . Ainsi, chaque observateur mesure la distance entre les extrémités d'une tige en mouvement pour être plus courte d'un facteur 1/γ que les extrémités d'une tige identique au repos dans son propre cadre. La contraction de la longueur affecte toute quantité géométrique liée aux longueurs, donc du point de vue d'un observateur en mouvement, les zones et les volumes sembleront également se rétrécir le long de la direction du mouvement.

Transformations vectorielles Modifier

L'utilisation de vecteurs permet d'exprimer de manière compacte les positions et les vitesses dans des directions arbitraires. Un seul coup de pouce dans n'importe quelle direction dépend du vecteur de vitesse relative complet v avec une grandeur | v | = v qui ne peut pas égaler ou dépasser c , de sorte que 0 v < c .

Seuls le temps et les coordonnées parallèles à la direction du mouvement relatif changent, contrairement aux coordonnées perpendiculaires. Dans cet esprit, divisez le vecteur de position spatiale r tel que mesuré en F , et rtel que mesuré en F' , chacune en composantes perpendiculaires (⊥) et parallèles ( ‖ ) à v ,

alors les transformations sont

où · est le produit scalaire. Le facteur Lorentz γ conserve sa définition pour un boost dans n'importe quelle direction, puisqu'il ne dépend que de l'amplitude de la vitesse relative. La définition β = v/c avec une magnitude 0 β < 1 est également utilisé par certains auteurs.

Présentation d'un vecteur unitaire m = v/v = β/β dans le sens du mouvement relatif, la vitesse relative est v = vm avec ampleur v et direction m , et la projection et le rejet vectoriels donnent respectivement

L'accumulation des résultats donne les transformations complètes,

La projection et le rejet s'appliquent également aux r. Pour les transformations inverses, échanger r et rpour changer les coordonnées observées et annuler la vitesse relative v → −v (ou simplement le vecteur unitaire m → −m puisque l'ampleur v est toujours positif) pour obtenir

Le vecteur unitaire a l'avantage de simplifier les équations pour un seul boost, permet soit v ou alors β à réintégrer quand cela convenait, et la paramétrisation de la rapidité est immédiatement obtenue en remplaçant β et βγ . Ce n'est pas pratique pour les boosts multiples.

La relation vectorielle entre vitesse relative et rapidité est [15]

et le "vecteur de rapidité" peut être défini comme

dont chacun sert d'abréviation utile dans certains contextes. L'ampleur de ζ est la valeur absolue du scalaire de rapidité confiné à 0 ζ < ∞ , ce qui correspond à l'intervalle 0 ≤ β < 1 .

Transformation des vitesses Modifier

Définition des vitesses de coordonnées et du facteur de Lorentz par

prendre les différentielles dans les coordonnées et le temps des transformations vectorielles, puis diviser les équations, conduit à

Les vitesses vous et voussont la vitesse d'un objet massif. Ils peuvent également être pour un troisième référentiel inertiel (disons F′′), auquel cas ils doivent être constant. Désignons l'une ou l'autre entité par X. Alors X se déplace avec la vitesse vous par rapport à F, ou de manière équivalente avec la vitesse vous′ par rapport à F′, à son tour F′ se déplace avec la vitesse v par rapport à F. Les transformations inverses peuvent être obtenues d'une manière similaire, ou comme avec l'échange de coordonnées de position vous et vous, et changer v à -v .

La transformation de la vitesse est utile dans l'aberration stellaire, l'expérience de Fizeau et l'effet Doppler relativiste.

Les transformations de Lorentz de l'accélération peuvent être obtenues de la même manière en prenant des différentiels dans les vecteurs de vitesse, et en les divisant par le différentiel de temps.

Transformation d'autres quantités Modifier

En général, étant donné quatre quantités UNE et Z = (ZX, Zoui, Zz) et leurs homologues boostés par Lorentz UNE' et Z′ = (ZX, Zoui, Zz) , une relation de la forme

implique la transformation des quantités sous des transformations de Lorentz similaires à la transformation des coordonnées d'espace-temps

La décomposition de Z (et Z′ ) en composantes perpendiculaires et parallèles à v est exactement le même que pour le vecteur position, de même que le processus d'obtention des transformations inverses (échange (UNE, Z) et (UNE′, Z′) pour changer les quantités observées, et inverser le sens du mouvement relatif par la substitution m ↦ −m ).

Les quantités (UNE, Z) forment collectivement un quatre vecteurs, où UNE est la "composante temporelle", et Z le « composant semblable à l'espace ». Exemples de UNE et Z sont les suivants:

Quatre vecteur UNE Z
Position à quatre vecteurs Temps (multiplié par c ), ct Vecteur de position, r
Quatre élans Énergie (divisée par c ), E/c Élan, p
Vecteur à quatre ondes fréquence angulaire (divisée par c ), ω/c vecteur d'onde, k
Quatre rotations (Sans nom), st Tournoyer, s
Quatre courants Densité de charge (multipliée par c ), c La densité actuelle, j
Quatre potentiels électromagnétiques Potentiel électrique (divisé par c ), φ/c Potentiel vecteur magnétique, UNE

Pour un objet donné (par exemple, particule, fluide, champ, matériau), si UNE ou alors Z correspondent à des propriétés spécifiques à l'objet comme sa densité de charge, sa densité de masse, son spin, etc., ses propriétés peuvent être fixées dans le cadre de repos de cet objet. Ensuite, les transformations de Lorentz donnent les propriétés correspondantes dans un repère se déplaçant par rapport à l'objet à vitesse constante. Cela brise certaines notions tenues pour acquises en physique non relativiste. Par exemple, l'énergie E d'un objet est un scalaire en mécanique non relativiste, mais pas en mécanique relativiste car l'énergie change sous les transformations de Lorentz, sa valeur est différente pour divers référentiels inertiels. Dans le cadre de repos d'un objet, il a une énergie de repos et une quantité de mouvement nulle. Dans un cadre boosté, son énergie est différente et il semble avoir un élan. De même, en mécanique quantique non relativiste, le spin d'une particule est un vecteur constant, mais en mécanique quantique relativiste, le spin s dépend du mouvement relatif. Dans le référentiel de repos de la particule, le pseudovecteur de spin peut être fixé à son spin non relativiste ordinaire avec une quantité temporelle nulle st , cependant un observateur amplifié percevra une composante temporelle non nulle et un spin modifié. [16]

Toutes les quantités ne sont pas invariantes sous la forme indiquée ci-dessus, par exemple le moment angulaire orbital L n'a pas de quantité semblable au temps, et le champ électrique non plus E ni le champ magnétique B . La définition du moment cinétique est L = r × p , et dans un référentiel amplifié le moment angulaire modifié est L′ = r′ × p. L'application de cette définition en utilisant les transformations de coordonnées et de moment conduit à la transformation du moment angulaire. Il s'avère L se transforme avec une autre quantité vectorielle N = (E/c 2 )rtp liés aux boosts, voir le moment angulaire relativiste pour plus de détails. Pour le cas de la E et B champs, les transformations ne peuvent pas être obtenues directement en utilisant l'algèbre vectorielle. La force de Lorentz est la définition de ces champs, et en F il est F = q(E + v × B) tandis que dans F' il est F′ = q(E′ + v′ × B) . Une méthode pour dériver les transformations du champ EM d'une manière efficace qui illustre également l'unité du champ électromagnétique utilise l'algèbre tensorielle, donnée ci-dessous.

Tout au long, les lettres majuscules italiques non gras sont des matrices 4×4, tandis que les lettres gras non italiques sont des matrices 3×3.

Groupe homogène de Lorentz Modifier

Ecriture des coordonnées dans les vecteurs colonnes et la métrique de Minkowski η sous forme de matrice carrée

l'intervalle d'espace-temps prend la forme (T dénote la transposition)

et est invariant sous une transformation de Lorentz

où est une matrice carrée qui peut dépendre de paramètres.

L'ensemble de toutes les transformations de Lorentz dans cet article est noté L >> . Cet ensemble avec la multiplication matricielle forme un groupe, dans ce contexte connu sous le nom de Groupe Lorentz. Aussi, l'expression ci-dessus X·X est une forme quadratique de signature (3,1) sur l'espace-temps, et le groupe de transformations qui laisse cette forme quadratique invariante est le groupe orthogonal indéfini O(3,1), un groupe de Lie. En d'autres termes, le groupe de Lorentz est O(3,1). Comme présenté dans cet article, tous les groupes de Lie mentionnés sont des groupes de Lie matriciels. Dans ce contexte, l'opération de composition revient à une multiplication matricielle.

De l'invariance de l'intervalle d'espace-temps, il résulte

et cette équation matricielle contient les conditions générales sur la transformation de Lorentz pour assurer l'invariance de l'intervalle d'espace-temps. Prendre le déterminant de l'équation en utilisant la règle du produit [nb 4] donne immédiatement

L'écriture de la métrique de Minkowski sous forme de matrice de blocs et de la transformation de Lorentz sous la forme la plus générale,

effectuer les multiplications matricielles par blocs obtient des conditions générales sur , une, b, M pour assurer l'invariance relativiste. Peu d'informations peuvent être extraites directement de toutes les conditions, cependant l'un des résultats

est utile b T b 0 toujours donc il s'ensuit que

L'inégalité négative peut être inattendue, car Γ multiplie la coordonnée temporelle et cela a un effet sur la symétrie temporelle. Si l'égalité positive est vérifiée, alors est le facteur de Lorentz.

Le déterminant et l'inégalité fournissent quatre façons de classer Lorentz Ttransformations (ici LTs pour la brièveté). Tout LT particulier n'a qu'un seul signe déterminant et une seule inégalité.Il existe quatre ensembles qui incluent chaque paire possible donnée par les intersections (symbole en forme de "n" signifiant "et") de ces ensembles de classification.

Intersection, Antichrone (ou non orthochrone) LTs L ↓ = < Λ : Γ ≤ − 1 >>^=> Orthochrone LTs L ↑ = < Λ : Γ ≥ 1 >>^=>
Correct LTs L + = < Λ : det ( Λ ) = + 1 >>_<+>=> Antichrone correct LTs L + ↓ = L + ∩ L ↓ >_<+>^=>_<+>cap >^> Correctement orthochrone LTs L + ↑ = L + ∩ L ↑ >_<+>^=>_<+>cap >^>
Non conforme LTs L − = < Λ : det ( Λ ) = − 1 >>_<->=> Antichrone incorrect LTs L − ↓ = L − ∩ L ↓ >_<->^=>_<->cap >^> Orthochrone incorrecte LTs L − ↑ = L − ∩ L ↑ >_<->^=>_<->cap >^>

où « + » et « - » indiquent le signe déterminant, tandis que « ↑ » pour ≥ et « ↓ » pour désignent les inégalités.

Le groupe complet de Lorentz se divise en l'union (symbole en forme de "u" signifiant "ou") de quatre ensembles disjoints

Un sous-groupe d'un groupe doit être fermé sous la même opération du groupe (ici multiplication matricielle). En d'autres termes, pour deux transformations de Lorentz et L à partir d'un ensemble particulier, les transformations composites de Lorentz ΛL et LΛ doit être dans le même ensemble que Λ et L . Ce n'est pas toujours le cas : la composition de deux transformations de Lorentz antichrones est orthochrone, et la composition de deux transformations de Lorentz impropres est propre. En d'autres termes, alors que les ensembles L + ↑ >_<+>^> , L + >_<+>> , L ↑ >^> , et L 0 = L + ↑ ∪ L − ↓ >_<0>=>_<+>^cup >_<->^> tous forment des sous-groupes, les ensembles contenant des transformations impropres et/ou antichrones sans suffisamment de transformations orthochrones appropriées (par exemple L + ↓ >_<+>^> , L − ↓ >_<->^> , L − ↑ >_<->^> ) ne forment pas de sous-groupes.

Des transformations appropriées Modifier

Si un cadre Fest boosté avec la vélocité vous par rapport au cadre F , et un autre cadre Fest boosté avec la vélocité v relatif à F′ , les boosts séparés sont

et la composition des deux boosts relie les coordonnées dans F'' et F ,

Les transformations successives agissent à gauche. Si vous et v sont colinéaires (parallèles ou antiparallèles le long d'une même ligne de mouvement relatif), les matrices boost commutent : B(v)B(vous) = B(vous)B(v) . Cette transformation composite se trouve être un autre coup de pouce, B(w) , où w est colinéaire avec vous et v .

Si vous et v ne sont pas colinéaires mais dans des directions différentes, la situation est considérablement plus compliquée. Les boosts de Lorentz dans différentes directions ne font pas la navette : B(v)B(vous) et B(vous)B(v) ne sont pas égaux. Aussi, chacune de ces compositions est ne pas un seul coup de pouce, mais ce sont toujours des transformations de Lorentz, elles préservent chacune l'intervalle espace-temps. Il s'avère que la composition de deux boosts de Lorentz équivaut à un boost suivi ou précédé d'une rotation sur les coordonnées spatiales, sous la forme de R(ρ)B(w) ou alors B( w )R( ρ ) . Le w et w sont des vitesses composites, tandis que ρ et ρ sont des paramètres de rotation (par exemple des variables d'axe-angle, des angles d'Euler, etc.). La rotation sous forme de matrice de blocs est simplement

R(ρ) est une matrice de rotation 3D, qui fait tourner n'importe quel vecteur 3D dans un sens (transformation active), ou de manière équivalente le cadre de coordonnées dans le sens opposé (transformation passive). Il est ne pas simple à connecter w et ρ (ou alors w et ρ ) aux paramètres de boost d'origine vous et v . Dans une composition de boosts, le R La matrice est appelée la rotation de Wigner et donne lieu à la précession de Thomas. Ces articles donnent les formules explicites pour les matrices de transformation composites, y compris les expressions pour w, ρ, w , ρ .

Dans cet article, la représentation axe-angle est utilisée pour ρ . La rotation se fait autour d'un axe dans la direction d'un vecteur unitaire e , par l'angle θ (positif dans le sens antihoraire, négatif dans le sens horaire, selon la règle de la main droite). Le "vecteur axe-angle"

servira d'abréviation utile.

Les rotations spatiales seules sont également des transformations de Lorentz, elles laissent l'intervalle espace-temps invariant. Comme les boosts, les rotations successives autour de différents axes ne commutent pas. Contrairement aux boosts, la composition de deux rotations quelconques équivaut à une seule rotation. Voici d'autres similitudes et différences entre les matrices de boost et de rotation :

    : B(v) −1 = B(−v) (mouvement relatif dans la direction opposée), et R(θ) −1 = R(−θ) (rotation en sens inverse autour du même axe) pour aucun mouvement/rotation relatif : B(0) = R(0) = je
  • déterminant de l'unité : det(B) = dét(R) = +1 . Cette propriété en fait des transformations appropriées. : B est symétrique (égale transposition), tandis que R est non symétrique mais orthogonal (transposition égale inverse, R T = R −1 ).

La transformation de Lorentz proprement dite la plus générale Λ(v, θ) inclut un boost et une rotation ensemble, et est une matrice non symétrique. Comme cas particuliers, (0, θ) = R(θ) et (v, 0) = B(v) . Une forme explicite de la transformation générale de Lorentz est lourde à écrire et ne sera pas donnée ici. Néanmoins, des expressions sous forme fermée pour les matrices de transformation seront données ci-dessous en utilisant des arguments théoriques de groupe. Il sera plus facile d'utiliser la paramétrisation de la rapidité pour les boosts, auquel cas on écrit Λ(ζ, θ) et B(ζ) .

Le groupe Lie SO + (3,1) Modifier

L'ensemble des transformations

avec la multiplication matricielle comme opération de composition forme un groupe, appelé "groupe de Lorentz restreint", et est le groupe orthogonal indéfini spécial SO + (3,1). (Le signe plus indique qu'il préserve l'orientation de la dimension temporelle).

Pour plus de simplicité, regardez le boost de Lorentz infinitésimal dans la direction x (l'examen d'un boost dans n'importe quelle autre direction, ou la rotation autour de n'importe quel axe, suit une procédure identique). Le boost infinitésimal est un petit boost loin de l'identité, obtenu par l'expansion de Taylor de la matrice de boost au premier ordre environ ζ = 0 ,

où les termes d'ordre supérieur non représentés sont négligeables car ζ est petit et BX est simplement la matrice de boost dans le X direction. La dérivée de la matrice est la matrice des dérivées (des entrées, par rapport à la même variable), et il est entendu que les dérivées sont d'abord trouvées puis évaluées à ζ = 0 ,

Pour le moment, KX est défini par ce résultat (sa signification sera expliquée sous peu). Dans la limite d'un nombre infini de pas infiniment petits, on obtient la transformation de boost finie sous forme d'une matrice exponentielle

Le vecteur axe-angle θ et vecteur de rapidité ζ sont au total six variables continues qui constituent les paramètres du groupe (dans cette représentation particulière), et les générateurs du groupe sont K = (KX, Koui, Kz) et J = (JX, Joui, Jz) , chacun des vecteurs de matrices aux formes explicites [nb 6]

Ceux-ci sont tous définis de manière analogue à KX ci-dessus, bien que les signes moins dans les générateurs de suralimentation soient conventionnels. Physiquement, les générateurs du groupe de Lorentz correspondent à des symétries importantes dans l'espace-temps : J sont les générateurs de rotation qui correspondent au moment cinétique, et K sont les booster les générateurs qui correspondent au mouvement du système dans l'espace-temps. La dérivée de toute courbe lisse C(t) avec C(0) = je dans le groupe en fonction de certains paramètres de groupe t par rapport à ce paramètre de groupe, évalué à t = 0 , sert de définition d'un générateur de groupe correspondant g , et cela reflète une transformation infinitésimale loin de l'identité. La courbe lisse peut toujours être considérée comme une exponentielle car l'exponentielle mappera toujours g en douceur dans le groupe via t → exp(tG) pour tous t cette courbe donnera g à nouveau lorsqu'il est différencié à t = 0 .

L'expansion des exponentielles dans leur série de Taylor obtient

qui reproduisent de manière compacte les matrices boost et rotation comme indiqué dans la section précédente.

Il a été dit que la transformation de Lorentz générale proprement dite est le produit d'une impulsion et d'une rotation. Au infinitésimal niveler le produit

est commutatif car seuls des termes linéaires sont requis (des produits comme (θ·J)(ζ·K) et (ζ·K)(θ·J) comptent comme des termes d'ordre supérieur et sont négligeables). Prendre la limite comme précédemment conduit à la transformation finie sous la forme d'une exponentielle

L'inverse est également vrai, mais la décomposition d'une transformation de Lorentz générale finie en de tels facteurs n'est pas triviale. En particulier,

parce que les générateurs ne commutent pas. Pour une description de la façon de trouver les facteurs d'une transformation de Lorentz générale en termes de boost et de rotation en principe (cela ne donne généralement pas une expression intelligible en termes de générateurs J et K ), voir Rotation de Wigner. Si, d'autre part, la décomposition est donnée en termes de générateurs, et on veut trouver le produit en termes de générateurs, alors la formule Baker-Campbell-Hausdorff s'applique.

L'algèbre de Lie donc (3,1) Modifier

Les générateurs Lorentz peuvent être additionnés ou multipliés par des nombres réels, pour obtenir plus de générateurs Lorentz. En d'autres termes, l'ensemble de tous les générateurs Lorentz

avec les opérations d'addition matricielle ordinaire et de multiplication d'une matrice par un nombre, forme un espace vectoriel sur les nombres réels. [nb 7] Les générateurs JX, Joui, Jz, KX, Koui, Kz forment un ensemble de base de V, et les composantes des vecteurs axe-angle et vitesse, θX,oui,z,X,oui,z , sont les coordonnées d'un générateur de Lorentz par rapport à cette base. [nb 8]

Trois des relations de commutation des générateurs de Lorentz sont

où la parenthèse [UNE, B] = UN BBA est connu comme le commutateur, et les autres relations peuvent être trouvées en prenant des permutations cycliques des composants x, y, z (c'est-à-dire changer x en y, y en z et z en x, répéter).

Ces relations de commutation, et l'espace vectoriel des générateurs, remplissent la définition de l'algèbre de Lie s o ( 3 , 1 ) >(3,1)> . En résumé, une algèbre de Lie est définie comme un espace vectoriel V sur un corps de nombres, et avec une opération binaire [ , ] (appelée crochet de Lie dans ce contexte) sur les éléments de l'espace vectoriel, satisfaisant les axiomes de bilinéarité, d'alternance et d'identité de Jacobi. Ici l'opération [ , ] est le commutateur qui satisfait tous ces axiomes, l'espace vectoriel est l'ensemble des générateurs de Lorentz V comme indiqué précédemment, et le champ est l'ensemble des nombres réels.

Lier la terminologie utilisée en mathématiques et en physique : Un générateur de groupe est n'importe quel élément de l'algèbre de Lie. Un paramètre de groupe est un composant d'un vecteur de coordonnées représentant un élément arbitraire de l'algèbre de Lie par rapport à une base. Une base est donc un ensemble de générateurs constituant une base de l'algèbre de Lie au sens habituel de l'espace vectoriel.

L'application exponentielle de l'algèbre de Lie au groupe de Lie,

fournit une correspondance biunivoque entre des voisinages suffisamment petits de l'origine de l'algèbre de Lie et des voisinages de l'élément d'identité du groupe de Lie. Dans le cas du groupe de Lorentz, la carte exponentielle n'est que l'exponentielle matricielle. Globalement, la carte exponentielle n'est pas biunivoque, mais dans le cas du groupe de Lorentz, elle est surjective (sur). Par conséquent, tout élément de groupe dans la composante connexe de l'identité peut être exprimé comme une exponentielle d'un élément de l'algèbre de Lie.

Transformations incorrectes Modifier

Les transformations de Lorentz incluent également l'inversion de parité

qui nie toutes les coordonnées spatiales seulement, et l'inversion du temps

ce qui annule uniquement la coordonnée de temps, car ces transformations laissent l'intervalle espace-temps invariant. Ici je est la matrice d'identité 3D. Ceux-ci sont tous deux symétriques, ce sont leurs propres inverses (voir involution (mathématiques)), et chacun a un déterminant -1. Cette dernière propriété en fait des transformations impropres.

Si est une transformation de Lorentz orthochrone propre, alors TΛ est impropre antichrone, Pest orthochrone impropre, et TP= TPest proprement antichrone.

Groupe de Lorentz inhomogène Modifier

Deux autres symétries spatio-temporelles n'ont pas été prises en compte. Pour que l'intervalle espace-temps soit invariant, on peut montrer [18] qu'il est nécessaire et suffisant que la transformation de coordonnées soit de la forme

C est une colonne constante contenant les traductions dans le temps et dans l'espace. Si C ≠ 0, c'est un transformation de Lorentz inhomogène ou alors Transformation de Poincaré. [19] [20] Si C = 0, c'est un transformation de Lorentz homogène. Les transformations de Poincaré ne sont pas traitées plus loin dans cet article.

Vecteurs contravariants Modifier

Écriture de la transformation matricielle générale des coordonnées comme équation matricielle

permet de définir la transformation d'autres quantités physiques qui ne peuvent pas être exprimées sous forme de quatre vecteurs, par exemple des tenseurs ou des spineurs de n'importe quel ordre dans l'espace-temps 4d. Dans la notation d'indice tensoriel correspondante, l'expression matricielle ci-dessus est

où les indices inférieur et supérieur désignent respectivement les composantes covariantes et contravariantes, [21] et la convention de sommation est appliquée. C'est une convention standard d'utiliser des indices grecs qui prennent la valeur 0 pour les composantes temporelles et 1, 2, 3 pour les composantes spatiales, tandis que les indices latins prennent simplement les valeurs 1, 2, 3, pour les composantes spatiales. Notez que le premier indice (lecture de gauche à droite) correspond dans la notation matricielle à un index de ligne. Le deuxième index correspond à l'index de la colonne.

La matrice de transformation est universelle pour tous les quatre vecteurs, pas seulement pour les coordonnées spatio-temporelles à 4 dimensions. Si UNE est un quadrivecteur quelconque, alors en notation tensorielle

dans laquelle les indices amorcés désignent les indices de A dans la trame amorcée. Cette notation réduit le risque d'épuiser l'alphabet grec à peu près de moitié.

Pour un général m -objet composant que l'on peut écrire

où est la représentation appropriée du groupe de Lorentz, un m×m matrice pour tout Λ . Dans ce cas, les indices doivent ne pas être considérés comme des indices d'espace-temps (parfois appelés indices de Lorentz), et ils vont de 1 à m . Par exemple, si X est un bispinor, alors les indices sont appelés Indices de Dirac.

Vecteurs covariants Modifier

Il existe également des quantités vectorielles avec des indices covariants. Ils sont généralement obtenus à partir de leurs objets correspondants à indices contravariants par l'opération de abaisser un indice par exemple.,

η est le tenseur métrique. (L'article lié fournit également plus d'informations sur ce qu'est réellement mathématiquement l'opération d'augmentation et d'abaissement des indices.) L'inverse de cette transformation est donné par

où, vus comme des matrices, η μν est l'inverse de ημν . Comme ça arrive, η μν = ημν . C'est ce qu'on appelle relever un indice. Pour transformer un vecteur covariant UNEμ , augmentez d'abord son indice, puis le transformez selon la même règle que pour les 4 -vecteurs contravariants, puis enfin abaissez l'indice

C'est-à-dire, c'est le (μ, ν) -composant de la inverse transformation de Lorentz. On définit (pour une question de notation),

et peut dans cette notation écrire

Maintenant pour une subtilité. La sommation implicite du membre de droite de

déborde un index de ligne de la matrice représentant Λ −1 . Ainsi, en termes de matrices, cette transformation doit être considérée comme la transposition inverse de agissant sur le vecteur colonne UNEμ . Autrement dit, en notation matricielle pure,

Cela signifie exactement que les vecteurs covariants (considérés comme des matrices de colonnes) se transforment selon la représentation duale de la représentation standard du groupe de Lorentz. Cette notion se généralise aux représentations générales, remplacez simplement Λ par Π(Λ) .

Tenseurs Modifier

Si A et B sont des opérateurs linéaires sur les espaces vectoriels U et V , alors un opérateur linéaire UNEB peut être défini sur le produit tensoriel de U et V , noté UV selon [22]

De là, il est immédiatement clair que si u et v sont des quatre vecteurs dans V , alors vousvT2VVV se transforme en

La deuxième étape utilise la bilinéarité du produit tensoriel et la dernière étape définit un 2-tenseur sous forme de composant, ou plutôt, elle renomme simplement le tenseur vousv .

Ces observations se généralisent de manière évidente à plus de facteurs, et en utilisant le fait qu'un tenseur général sur un espace vectoriel V peut être écrit comme la somme d'un coefficient (composant !) multiplié par les produits tensoriels des vecteurs de base et des covecteurs de base, on arrive à la loi de transformation pour toute quantité tensorielle T . Il est donné par [23]

Λχ ' ψ est défini ci-dessus. Cette forme peut généralement être réduite à la forme générale m -objets composants donnés ci-dessus avec une seule matrice ( Π(Λ) ) opérant sur des vecteurs colonnes. Cette dernière forme est parfois préférée, par exemple pour le tenseur de champ électromagnétique.

Transformation du champ électromagnétique Modifier

Les transformations de Lorentz peuvent également être utilisées pour illustrer que le champ magnétique B et champ électrique E sont simplement des aspects différents de la même force — la force électromagnétique, résultant du mouvement relatif entre les charges électriques et les observateurs. [24] Le fait que le champ électromagnétique montre des effets relativistes devient clair en réalisant une simple expérience de pensée. [25]

  • Un observateur mesure une charge au repos dans l'image F. L'observateur détectera un champ électrique statique. Comme la charge est stationnaire dans ce référentiel, il n'y a pas de courant électrique, donc l'observateur n'observe aucun champ magnétique.
  • L'autre observateur dans le repère F′ se déplace à la vitesse v par rapport à F et la charge. Cette l'observateur voit un champ électrique différent parce que la charge se déplace à la vitesse −v dans leur cadre de repos. Le mouvement de la charge correspond à un courant électrique, et donc l'observateur dans le repère F′ voit aussi un champ magnétique.

Les champs électriques et magnétiques se transforment différemment de l'espace et du temps, mais exactement de la même manière que le moment angulaire relativiste et le vecteur boost.

Le tenseur de champ électromagnétique est donné par

en unités SI. En relativité, le système d'unités gaussien est souvent préféré aux unités SI, même dans les textes dont le choix principal des unités est les unités SI, car le champ électrique y est E et l'induction magnétique B ont les mêmes unités rendant l'apparition du tenseur de champ électromagnétique plus naturelle. [26] Considérons un coup de pouce de Lorentz dans le X -direction. Il est donné par [27]

où le tenseur de champ est affiché côte à côte pour une référence plus facile dans les manipulations ci-dessous.

La loi de transformation générale (T3) devient

Pour le champ magnétique on obtient

Pour les résultats du champ électrique

Ici, β = (β, 0, 0) est utilisé. Ces résultats peuvent être résumés par

et sont indépendants de la signature métrique. Pour les unités SI, remplacez EEc . Misner, Thorne & Wheeler (1973) appellent cette dernière forme la vue 3 + 1 par opposition à la vue géométrique représenté par l'expression du tenseur

et mettre en avant la facilité avec laquelle des résultats difficiles à atteindre avec la vue 3+1 peuvent être obtenus et compris. Seuls les objets qui ont des propriétés de transformation de Lorentz bien définies (en fait sous quelconque transformation de coordonnées en douceur) sont des objets géométriques. Dans la vue géométrique, le champ électromagnétique est un objet géométrique à six dimensions dans espace-temps par opposition à deux champs de 3 vecteurs interdépendants mais séparés dans espace et temps. Les champs E (seul) et B (seuls) n'ont pas de propriétés de transformation de Lorentz bien définies. Les fondements mathématiques sont des équations (T1) et (T2) qui cède immédiatement (T3). Il convient de noter que les tenseurs amorcés et non amorcés se réfèrent à la même événement dans l'espace-temps. Ainsi, l'équation complète avec dépendance espace-temps est

La contraction de la longueur a un effet sur la densité de charge ρ et densité de courant J , et la dilatation du temps a un effet sur le débit de charge (courant), de sorte que les distributions de charge et de courant doivent se transformer de manière liée sous un boost. Il s'avère qu'ils se transforment exactement comme les quatre vecteurs espace-temps et énergie-impulsion,

ou, dans la vue géométrique plus simple,

On dit que la densité de charge se transforme en composante temporelle d'un quadrivecteur. C'est un scalaire rotationnel. La densité de courant est un 3-vecteur.

Les équations de Maxwell sont invariantes sous les transformations de Lorentz.

Spineurs Modifier

Équation (T1) tenir inchangé pour toute représentation du groupe Lorentz, y compris la représentation bispinor. Dans (T2) on remplace simplement toutes les occurrences de Λ par la représentation bispinor Π(Λ) ,

L'équation ci-dessus pourrait, par exemple, être la transformation d'un état dans l'espace de Fock décrivant deux électrons libres.

Transformation des champs généraux Modifier

Un général sans interaction l'état multiparticulaire (état spatial de Fock) dans la théorie quantique des champs se transforme selon la règle [28]

W(Λ, p) est la rotation de Wigner et (j) est le (2j + 1) représentation -dimensionnelle de SO(3) .


2.5 - Le coefficient de détermination, r au carré

Commençons notre enquête sur le coefficient de détermination, r 2 , en examinant deux exemples différents — un exemple dans lequel la relation entre la réponse oui et le prédicteur X est très faible et un deuxième exemple dans lequel la relation entre la réponse oui et le prédicteur X est assez fort. Si notre mesure doit bien fonctionner, elle devrait pouvoir faire la distinction entre ces deux situations très différentes.

Voici une intrigue illustrant une relation très faible entre oui et X. Il y a deux lignes sur le tracé, une ligne horizontale placée à la réponse moyenne, (ar), et une droite de régression estimée à faible pente, (hat). Notez que la pente de la droite de régression estimée n'est pas très raide, ce qui suggère qu'en tant que prédicteur X augmente, il n'y a pas beaucoup de changement dans la réponse moyenne oui. Notez également que les points de données ne « côtoient » pas la droite de régression estimée :

Les calculs à droite du graphique montrent des valeurs de "sommes des carrés" contrastées :

  • SSR est la "somme des carrés de régression" et quantifie dans quelle mesure la droite de régression inclinée estimée, (hat_i), provient de la "ligne d'absence de relation" horizontale, la moyenne de l'échantillon ou (ar).
  • SSE est la "somme des carrés des erreurs" et quantifie de combien les points de données, (y_i), varient autour de la ligne de régression estimée, (hat_je).
  • SSTO est la "somme totale des carrés" et quantifie de combien les points de données, (y_i), varient autour de leur moyenne, (ar).

Notez que SSTO = SSR + SSE. Les sommes des carrés semblent assez bien raconter l'histoire. Ils nous disent que la plupart des variations dans la réponse oui (SSTO = 1827,6) est simplement dû à une variation aléatoire (ESS = 1708,5), non due à la régression de oui au X (RSS = 119,1). Vous remarquerez peut-être que RSS divisé par SSTO est 119,1/1827,6 ou 0,065. Voyez-vous où cette quantité apparaît sur le tracé de la ligne ajustée ci-dessus ?

Comparez l'exemple ci-dessus avec le suivant dans lequel l'intrigue illustre une relation assez convaincante entre oui et X. La pente de la droite de régression estimée est beaucoup plus raide, ce qui suggère qu'en tant que prédicteur X augmente, il y a un changement (diminution) assez substantiel dans la réponse oui. Et, ici, les points de données « embrassent » la ligne de régression estimée :

Les sommes des carrés pour cet ensemble de données racontent une histoire très différente, à savoir que la plupart de la variation de la réponse oui (SSTO = 8487,8) est due à la régression de oui au X (RSS = 6679.3) pas seulement en raison d'une erreur aléatoire (ESS = 1708,5). Et, RSS divisé par SSTO est 6679.3/8487.8 ou 0.799, qui apparaît à nouveau sur le tracé de la ligne ajustée.

Les deux exemples précédents ont suggéré comment nous devrions définir formellement la mesure. Bref, le "coefficient de détermination" ou alors "r-valeur au carré, a noté r 2 , est la somme des carrés de régression divisée par la somme totale des carrés. Alternativement, comme démontré dans ce screencast ci-dessous, puisque SSTO = RSS + ESS, la quantité r 2 est également égal à un moins le rapport de la somme des carrés de l'erreur sur la somme des carrés totale :

Voici quelques caractéristiques de base de la mesure :

  • Depuis r 2 est une proportion, c'est toujours un nombre entre 0 et 1.
  • Si r 2 = 1, tous les points de données tombent parfaitement sur la droite de régression. Le prédicteur X compte pour tout de la variation de oui!
  • Si r 2 = 0, la droite de régression estimée est parfaitement horizontale. Le prédicteur X compte pour rien de la variation de oui!

Nous avons appris l'interprétation des deux cas faciles — quand r 2 = 0 ou r 2 = 1 — mais comment interpréter r 2 quand c'est un nombre entre 0 et 1, comme 0,23 ou 0,57, disons ? Voici deux façons similaires, mais légèrement différentes, dont le coefficient de détermination r 2 peut être interprété. On dit soit :

"r 2 × 100 pour cent de la variation de oui est réduit en tenant compte du prédicteur X"

"r 2 × 100 pour cent de la variation de oui est « expliquée par » la variation du prédicteur X."

De nombreux statisticiens préfèrent la première interprétation. J'ai tendance à privilégier la seconde. Le risque d'utiliser la seconde interprétation - et donc pourquoi " expliqué par " apparaît entre guillemets - est qu'elle peut être mal comprise comme suggérant que le prédicteur X cause le changement de réponse oui. L'association n'est pas la causalité. Autrement dit, simplement parce qu'un ensemble de données se caractérise par une grande r-valeur au carré, cela n'implique pas que X cause les changements dans oui. Tant que vous gardez le sens correct à l'esprit, il est bon d'utiliser la deuxième interprétation. Une variation sur la deuxième interprétation est de dire, "r 2 × 100 pour cent de la variation de oui est expliqué par la variation du prédicteur X."

Les élèves demandent souvent : « qu'est-ce qui est considéré comme un grand r-valeur au carré ?" Cela dépend du domaine de recherche. Les spécialistes des sciences sociales qui essaient souvent d'apprendre quelque chose sur l'énorme variation du comportement humain auront tendance à avoir beaucoup de mal à obtenir r-valeurs au carré bien au-dessus, disons 25 % ou 30 %. D'un autre côté, les ingénieurs qui ont tendance à étudier des systèmes plus précis trouveraient probablement un r-valeur au carré de seulement 30% inacceptable. La morale de l'histoire est de lire la littérature pour apprendre ce qui est typique r-les valeurs au carré sont pour votre domaine de recherche !

Reprenons l'exemple de la mortalité par cancer de la peau (skincancer.txt). Tout logiciel statistique qui effectue une analyse de régression linéaire simple rapportera le r-valeur au carré pour vous, qui dans ce cas est de 67,98 % ou 68 % au nombre entier le plus proche.

On peut dire que 68 % de la variation du taux de mortalité par cancer de la peau est réduit en tenant compte de la latitude. Ou, nous pouvons dire - en sachant ce que cela signifie vraiment - que 68% de la variation de la mortalité par cancer de la peau est "expliquée par" la latitude.


Modèles linéaires généralisés (GLM) dans R, Partie 4 : Options, fonctions de liaison et interprétation

L'année dernière, j'ai écrit plusieurs articles (GLM en R 1, GLM en R 2, GLM en R 3) qui offraient une introduction aux modèles linéaires généralisés (GLM) en R.

Pour rappel, les modèles linéaires généralisés sont une extension des modèles de régression linéaire qui permettent à la variable dépendante d'être non normale.

Dans notre exemple de cette semaine, nous adaptons un GLM à un ensemble de données liées à l'éducation.

Lisons dans un ensemble de données d'une expérience composée de scores de test de numératie (calcul), de scores à un test d'anxiété (anxiété) et d'une variable de résultat binaire (succès) qui enregistre si oui ou non les étudiants ont finalement réussi à être admis dans un prestigieux l'université par le biais d'un test d'admission.

Nous utiliserons la commande glm() pour exécuter une régression logistique, en régressant le succès sur les scores de numératie et d'anxiété.

La variable ‘success’ est une variable binaire qui prend la valeur 1 pour les individus qui ont réussi à être admis, et la valeur 0 pour ceux qui ne l'ont pas fait. Regardons les valeurs moyennes de la numératie et de l'anxiété.

Nous commençons par ajuster un modèle qui inclut des interactions via l'opérateur de formule astérisque. Le lien le plus couramment utilisé pour les variables de résultat binaires est le lien logit, bien que d'autres liens puissent être utilisés.

glm() est la fonction qui indique à R d'exécuter un modèle linéaire généralisé.

Entre parenthèses, nous donnons à R des informations importantes sur le modèle. A gauche du

est la variable dépendante : le succès. Il doit être codé 0 & 1 pour que glm le lise en binaire.

, nous listons les deux variables prédictives. Le * indique que non seulement nous voulons chaque effet principal, mais nous voulons également un terme d'interaction entre la numératie et l'anxiété.

Et enfin, après la virgule, on précise que la distribution est binomiale. La fonction de lien par défaut dans glm pour une variable de résultat binomiale est le logit. Plus à ce sujet ci-dessous.

Nous pouvons accéder à la sortie du modèle en utilisant summary() .

Les estimations (coefficients des prédicteurs – numératie et anxiété) sont maintenant en logits. Le coefficient de numératie est : 1,94556, de sorte qu'un changement d'une unité en numératie produit approximativement un changement d'unité de 1,95 dans le log des cotes (c.

D'après les signes des deux prédicteurs, nous voyons que la numératie influence positivement l'admission, mais l'anxiété influence négativement la survie.

Nous ne pouvons pas en dire beaucoup plus que cela car la plupart d'entre nous ne peuvent pas penser en termes de logits. Au lieu de cela, nous pouvons convertir ces logits en rapports de cotes.

Pour ce faire, nous exposons chaque coefficient. (Cela signifie augmenter la valeur e –environ 2,72–à la puissance du coefficient. e^b).

Ainsi, le rapport de cotes pour la numératie est :

Cependant, dans cette version du modèle, les estimations sont non significatives et nous avons une interaction non significative. Le modèle 1 produit la relation suivante entre le logit (log odds) et les deux prédicteurs :

logit(p) = 0,88 + 1,95* numératie – 0,45 * anxiété – 1,0* terme d'interaction

La sortie produite par glm() inclut plusieurs quantités supplémentaires qui nécessitent une discussion.

Nous voyons une valeur z pour chaque estimation. La valeur z est la statistique de Wald qui teste l'hypothèse selon laquelle l'estimation est nulle. L'hypothèse nulle est que l'estimation a une distribution normale avec une moyenne de zéro et un écart type de 1. La valeur p citée, P(>|z|), donne la zone de queue dans un test bilatéral.

Pour notre exemple, nous avons une déviance nulle d'environ 68,03 sur 49 degrés de liberté. Cette valeur indique un mauvais ajustement (une différence significative entre les valeurs ajustées et les valeurs observées). L'inclusion des variables indépendantes (calcul et anxiété) a diminué la déviance de près de 40 points sur 3 degrés de liberté. La Déviance Résiduelle est de 28,2 sur 46 degrés de liberté (c'est-à-dire une perte de

A propos de l'auteur: David Lillis a enseigné R à de nombreux chercheurs et statisticiens. Son entreprise, Sigma Statistics and Research Limited, propose à la fois des cours en ligne et des ateliers en face à face sur R, ainsi que des services de codage chez R. David est titulaire d'un doctorat en statistiques appliquées.


Voir la vidéo: Matrice et application linéaire partie 2 (Octobre 2021).