Des articles

5.1 : Le théorème central limite pour les moyennes d'échantillons (moyennes) - Mathématiques


Supposons que (X) est une variable aléatoire avec une distribution qui peut être connue ou inconnue (il peut s'agir de n'importe quelle distribution). En utilisant un indice qui correspond à la variable aléatoire, supposons :

  1. (mu_{x} =) la moyenne de (X)
  2. (sigma_{x} =) l'écart type de (X)

Si vous tirez des échantillons aléatoires de taille (n), alors à mesure que (n) augmente, la variable aléatoire (ar{X}) qui consiste en des moyennes d'échantillons, tend à être distribuée normalement et

[ar{X} sim N(mu_{x}), dfrac{sigma_{x}}{sqrt{n}}.]

Le théorème central limite pour les moyennes d'échantillons dit que si vous continuez à tirer des échantillons de plus en plus gros (comme lancer un, deux, cinq et enfin dix dés) et à calculer leurs moyennes, les moyennes d'échantillon forment leurs propres distribution normale (la distribution d'échantillonnage). La distribution normale a la même moyenne que la distribution d'origine et une variance qui est égale à la variance d'origine divisée par la taille de l'échantillon. La variable (n) est le nombre de valeurs qui sont moyennées ensemble, pas le nombre de fois que l'expérience est effectuée.

Pour le dire plus formellement, si vous tirez des échantillons aléatoires de taille (n), la distribution de la variable aléatoire (ar{X}), qui consiste en des moyennes d'échantillons, est appelée la distribution d'échantillonnage de la moyenne. La distribution d'échantillonnage de la moyenne se rapproche d'une distribution normale lorsque (n), la taille de l'échantillon, augmente.

La variable aléatoire (ar{X}) a un score (z) différent de celui de la variable aléatoire (X). La moyenne (ar{x}) est la valeur de (ar{X}) dans un échantillon.

[z = dfrac{ar{x}-mu_{x}}{left(dfrac{sigma_{x}}{sqrt{n}} ight)}]

  • (mu_{x}) est la moyenne de (X) et de (ar{X}).
  • (sigma ar{x} = dfrac{sigma_{x}}{sqrt{n}} = ) écart type de (ar{X}) et est appelé l'erreur type de la moyenne .

Howto: Trouver des probabilités pour les moyennes sur la calculatrice

2sd DISTRIBUTION

2:normalcdf

( ext{normalcdf} left( ext{valeur inférieure de la zone, valeur supérieure de la zone, moyenne}, dfrac{ ext{écart-type}}{sqrt{ ext{taille de l'échantillon}}} droite))

où:

  • moyenne est la moyenne de la distribution originale
  • écart-type est l'écart type de la distribution d'origine
  • taille de l'échantillon (= n)

Exemple (PageIndex{1})

Une distribution inconnue a une moyenne de 90 et un écart type de 15. Des échantillons de taille (n = 25) sont tirés au hasard dans la population.

  1. Trouvez la probabilité que la moyenne de l'échantillon soit comprise entre 85 et 92.
  2. Trouvez la valeur qui est de deux écarts types au-dessus de la valeur attendue, 90, de la moyenne de l'échantillon.

Répondre

une.

Soit (X =) une valeur de la population inconnue d'origine. La question de probabilité vous demande de trouver une probabilité pour le moyenne de l'échantillon.

Soit (ar{X} =) la moyenne d'un échantillon de taille 25. Puisque (mu_{x} = 90, sigma_{x} = 15), et (n = 25),

[ar{X} sim N(90, dfrac{15}{sqrt{25}}). pas de numéro]

Trouvez (P(85 < x < 92)). Tracez un graphique.

[P(85 < x < 92) = 0.6997 onumber]

La probabilité que la moyenne de l'échantillon soit comprise entre 85 et 92 est de 0,6997.

Figure (PageIndex{1}).

normalcdf(valeur inférieure, valeur supérieure, moyenne, erreur standard de la moyenne)

La liste des paramètres est abrégée (valeur inférieure, valeur supérieure, (mu), (dfrac{sigma}{sqrt{n}}))

normalcdf((85,92,90,dfrac{15}{sqrt{25}}) = 0.6997)

b.

Pour trouver la valeur qui est de deux écarts types au-dessus de la valeur attendue 90, utilisez la formule :

[ egin{align*} ext{value} &= mu_{x} + (# ext{ofTSDEVs})left(dfrac{sigma_{x}}{sqrt{n}} droite) [5pt] &= 90 + 2 left(dfrac{15}{sqrt{25}} ight) = 96 end{align*}]

La valeur qui est de deux écarts types au-dessus de la valeur attendue est 96.

L'erreur standard de la moyenne est

[dfrac{sigma_{x}}{sqrt{n}} = dfrac{15}{sqrt{25}} = 3. onumber]

Rappelons que l'erreur standard de la moyenne est une description de la distance (en moyenne) entre la moyenne de l'échantillon et la moyenne de la population dans des échantillons aléatoires simples répétés de taille (n).

Exercice (PageIndex{1})

Une distribution inconnue a une moyenne de 45 et un écart type de huit. Des échantillons de taille (n) = 30 sont tirés au hasard dans la population. Trouvez la probabilité que la moyenne de l'échantillon soit comprise entre 42 et 50.

Répondre

(P(42 < ar{x} < 50) = left(42, 50, 45, dfrac{8}{sqrt{30}} ight) = 0.9797)

Exemple (PageIndex{2})

La durée, en heures, qu'il faut à un groupe de "plus de 40" pour jouer un match de football est normalement répartie avec un moyenne de deux heures et un écart type de 0,5 heure. UNE échantillon de taille (n = 50) est tiré au hasard dans la population. Trouver la probabilité que le moyenne de l'échantillon est comprise entre 1,8 heures et 2,3 heures.

Répondre

Soit (X =) le temps, en heures, qu'il faut pour jouer un match de football.

La question de probabilité vous demande de trouver une probabilité pour le temps moyen de l'échantillon, en heures, il faut pour jouer un match de football.

Soit (ar{X} =) le temps moyen, en heures, qu'il faut pour jouer un match de football.

Si (mu_{x} =) _________, (sigma_{x} =) __________, et (n =) ___________, alors (X sim N)(______, ______) par le théorème central limite pour les moyennes.

(mu_{x} = 2, sigma_{x} = 0.5, n = 50), et (X sim N left(2, dfrac{0.5}{sqrt{50}} ight ))

Trouvez (P(1.8 < ar{x} < 2.3)). Tracez un graphique.

(P(1.8 < ar{x} < 2.3) = 0.9977)

normalcdf(gauche(1.8,2.3,2,dfrac{.5}{sqrt{50}}droit) = 0.9977)

La probabilité que le temps moyen soit compris entre 1,8 heures et 2,3 heures est de 0,9977.

Exercice (PageIndex{2})

La durée du temps passé au SAT pour un groupe d'étudiants est normalement distribuée avec une moyenne de 2,5 heures et un écart type de 0,25 heures. Une taille d'échantillon de (n = 60) est tirée au hasard dans la population. Trouvez la probabilité que la moyenne de l'échantillon se situe entre deux heures et trois heures.

Répondre

[P(2 < ar{x} < 3) = ext{normalcdf}left(2, 3, 2.5, dfrac{0.25}{sqrt{60}} ight) = 1 onumber]

Compétences en calculatrice

Pour trouver les centiles des moyennes sur la calculatrice, procédez comme suit.

  • 2sd DIStR
  • 3:invNorm

(k = ext{invNorm} left( ext{zone à gauche de} k, ext{mean}, dfrac{ ext{écart-type}}{sqrt{taille de l'échantillon}} ight) )

où:

  • (k) = le (k)e centile
  • moyenne est la moyenne de la distribution originale
  • écart-type est l'écart type de la distribution d'origine
  • taille de l'échantillon = (n)

Exemple (PageIndex{3})

Dans une étude récente publiée le 29 octobre 2012 sur le blog Flurry, l'âge moyen des utilisateurs de tablettes est de 34 ans. Supposons que l'écart type soit de 15 ans. Prenez un échantillon de taille (n = 100).

  1. Quels sont la moyenne et l'écart type des âges moyens de l'échantillon des utilisateurs de tablettes ?
  2. A quoi ressemble la répartition ?
  3. Trouvez la probabilité que l'âge moyen de l'échantillon soit supérieur à 30 ans (l'âge moyen signalé des utilisateurs de tablettes dans cette étude particulière).
  4. Trouvez le 95e centile pour l'âge moyen de l'échantillon (à une décimale près).

Répondre

  1. Puisque la moyenne de l'échantillon tend à cibler la moyenne de la population, nous avons (mu_{x} = mu = 34). L'écart type de l'échantillon est donné par : [sigma_{x} = dfrac{sigma}{sqrt{n}} = dfrac{15}{sqrt{100}} = dfrac{15}{10 } = 1.5 aucunnombre]
  2. Le théorème central limite stipule que pour les échantillons de grande taille ((n)), la distribution d'échantillonnage sera approximativement normale.
  3. La probabilité que l'âge moyen de l'échantillon soit supérieur à 30 ans est donnée par : [P(Χ > 30) = ext{normalcdf}(30,E99,34,1.5) = 0.9962 onumber]
  4. Soit (k) = le 95e centile. [k = ext{invNorm}left(0.95, 34, dfrac{15}{sqrt{100}} ight) = 36.5 onumber]

Exercice (PageIndex{3})

Dans un article sur Flurry Blog, un écart de marketing de jeu pour les hommes âgés de 30 à 40 ans est identifié. Vous recherchez un jeu de démarrage destiné aux personnes de 35 ans. Votre idée est de développer un jeu de stratégie auquel les hommes peuvent jouer de la fin de la vingtaine à la fin de la trentaine. Sur la base des données de l'article, les recherches de l'industrie montrent que le joueur de stratégie moyen a 28 ans avec un écart type de 4,8 ans. Vous prenez un échantillon de 100 joueurs sélectionnés au hasard. Si votre cible est les 29-35 ans, devez-vous poursuivre votre stratégie de développement ?

Répondre

Vous devez déterminer la probabilité pour les hommes dont l'âge moyen est compris entre 29 et 35 ans de vouloir jouer à un jeu de stratégie.

[P(29 < ar{x} < 35) = ext{normalcdf} left(29, 35, 28,dfrac{4.8}{sqrt{100}} ight) = 0.0186]

Vous pouvez conclure qu'il y a environ 1,9% de chances que votre jeu soit joué par des hommes dont l'âge moyen se situe entre 29 et 35 ans.

Exemple (PageIndex{4})

Le nombre moyen de minutes pour l'engagement d'une application par un utilisateur de tablette est de 8,2 minutes. Supposons que l'écart type soit d'une minute. Prenez un échantillon de 60.

  1. Quels sont la moyenne et l'écart type du nombre moyen d'interactions avec l'application par un utilisateur de tablette ?
  2. Quelle est l'erreur standard de la moyenne ?
  3. Trouvez le 90e centile pour l'échantillon de temps moyen pour l'engagement de l'application pour un utilisateur de tablette. Interprétez cette valeur dans une phrase complète.
  4. Trouvez la probabilité que la moyenne de l'échantillon se situe entre huit minutes et 8,5 minutes.

Répondre

  1. (mu = mu = 8.2 sigma_{ar{x}} = dfrac{sigma}{sqrt{n}} = dfrac{1}{sqrt{60}} = 0.13)
  2. Cela nous permet de calculer la probabilité des moyennes d'échantillon d'une distance particulière de la moyenne, dans des échantillons répétés de taille 60.
  3. Soit (k) = le 90e centile
    (k = ext{invNorm}left(0.90, 8.2, dfrac{1}{sqrt{60}} ight) = 8.37). Ces valeurs indiquent que 90 % du temps d'engagement moyen de l'application pour les utilisateurs de la table est inférieur à 8,37 minutes.
  4. (P(8 < ar{x} < 8.5) = ext{normalcdf}left(8, 8.5, 8.2, dfrac{1}{sqrt{60}} ight) = 0.9293)

Exercice (PageIndex{4})

Les canettes d'une boisson au cola prétendent contenir 16 onces. Les quantités dans un échantillon sont mesurées et les statistiques sont (n = 34), (ar{x} = 16,01) onces. Si les boîtes sont remplies de telle sorte que (mu = 16,00) onces (comme indiqué) et (sigma = 0,143) onces, trouvez la probabilité qu'un échantillon de 34 boîtes ait une quantité moyenne supérieure à 16,01 onces. Les résultats suggèrent-ils que les canettes sont remplies d'une quantité supérieure à 16 onces ?

Répondre

On a (P(ar{x} > 16.01) = ext{normalcdf} left(16.01,E99,16, dfrac{0.143}{sqrt{34}} ight) = 0.3417). Puisqu'il y a une probabilité de 34,17 % que le poids moyen de l'échantillon soit supérieur à 16,01 onces, nous devrions être sceptiques quant au volume revendiqué par l'entreprise. Si je suis un consommateur, je serais heureux de recevoir probablement du cola gratuit. Si je suis le fabricant, je dois déterminer si mes processus d'embouteillage sont en dehors des limites acceptables.

Résumé

Dans une population dont la distribution peut être connue ou inconnue, si la taille ((n)) des échantillons est suffisamment grande, la distribution des moyennes de l'échantillon sera approximativement normale. La moyenne des moyennes de l'échantillon sera égale à la moyenne de la population. L'écart type de la distribution des moyennes de l'échantillon, appelé erreur type de la moyenne, est égal à l'écart type de la population divisé par la racine carrée de la taille de l'échantillon ((n)).

Examen de la formule

  • Le théorème central limite pour les moyennes d'échantillon : [ar{X} sim Nleft(mu_{x}, dfrac{sigma_{x}}{sqrt{n}} ight) onumber]
  • La moyenne (ar{X} : sigma_{x})
  • Théorème central limite pour les moyennes d'échantillons z-score et erreur standard de la moyenne : [z = dfrac{ar{x}-mu_{x}}{left(dfrac{sigma_{x}}{ sqrt{n}} ight)} onumber]
  • Erreur standard de la moyenne (écart-type ((ar{X}))) : [dfrac{sigma_{x}}{sqrt{n}} onumber]

Glossaire

Moyenne
un nombre qui décrit la tendance centrale des données ; il existe un certain nombre de moyennes spécialisées, notamment la moyenne arithmétique, la moyenne pondérée, la médiane, le mode et la moyenne géométrique.
Théorème central limite
Étant donné une variable aléatoire (VR) de moyenne connue (mu) et d'écart type connu, (sigma), nous échantillonnons avec la taille (n), et nous nous intéressons à deux nouvelles VR : l'échantillon signifie, (ar{X}), et la somme de l'échantillon, (sum X). Si la taille ((n)) de l'échantillon est suffisamment grande, alors (ar{X} sim Nleft(mu, dfrac{sigma}{sqrt{n}} ight) ) et (sum X sim N(nmu, (sqrt{n})(sigma))). Si la taille ((n)) de l'échantillon est suffisamment grande, alors la distribution des moyennes d'échantillon et la distribution des sommes d'échantillon se rapprocheront d'une distribution normale quelle que soit la forme de la population. La moyenne des moyennes de l'échantillon sera égale à la moyenne de la population et la moyenne des sommes de l'échantillon sera égale à (n) fois la moyenne de la population. L'écart type de la distribution des moyennes de l'échantillon, (dfrac{sigma}{sqrt{n}}), est appelé l'erreur type de la moyenne.
Distribution normale
une variable aléatoire continue (VR) avec pdf (f(x) = dfrac{1}{sigma sqrt{2 pi}}e^{dfrac{-(x-mu)^{2}} {2 sigma^{2}}}), où (mu) est la moyenne de la distribution et (sigma) est l'écart type ; notation : (X sim N(mu, sigma)). Si (mu = 0) et (sigma = 1), le RV est appelé un la norme distribution normale.
Erreur standard de la moyenne
l'écart type de la distribution des moyennes de l'échantillon, ou (dfrac{sigma}{sqrt{n}}).


Voir la vidéo: 2020 TCL C715 QLED TV KUTU AÇILIŞI VE İNCELEME (Octobre 2021).