Definition der Normalverteilung

\( \) \( \) \( \) \( \) \( \)

Die Wahrscheinlichkeitsdichtefunktion der Normalverteilung und ihre Eigenschaften werden beginnend mit dargestellt die Wahrscheinlichkeitshistogramme . Zur Hervorhebung wird ein normalverteilter Datensatz mit Mittelwert \( \mu = 3,5 \) und einer Standardabweichung \( \sigma = 1 \) verwendet die Verbindung zwischen dem Wahrscheinlichkeitshistogramm der Daten und der Normaldichtefunktion, die zur Definition der Normalverteilung führt.
Diagramme von Normalverteilungen werden dargestellt, um die Auswirkungen des Mittelwerts \( \mu \) und der Standardabweichung \( \sigma \) auf die hervorzuheben Normalverteilung. Die Eigenschaften der Normalverteilungen werden vorgestellt. Die Standardnormalverteilung wird definiert und die Schritte werden verwendet, um von Normalverteilungen zur Standardnormalverteilung unter Verwendung des Z-Scores werden dargestellt. Beispiele für Berechnungen von Wahrscheinlichkeiten von Normalverteilungen sind enthalten.
Eine PDF-Tabelle sowie ein Google-Sheet für Standardnormalverteilungsflächenwerte sind enthalten und beide können heruntergeladen und in Berechnungen verwendet werden.


Wahrscheinlichkeitshistogramme der Datenverteilung

In Abbildung 1 sind die Wahrscheinlichkeitshistogramme von drei Daten dargestellt Sätze. Die Daten im Histogramm A sind links stärker konzentriert. Die Daten im Histogramm B sind rechts stärker konzentriert; und die Daten im Histogramm C werden verteilt.
Wahrscheinlichkeitshistogramm mehrerer Datenverteilungen

Abbildung 1


Abbildung 2 zeigt ein symmetrisches Wahrscheinlichkeitshistogramm, dessen Daten in der Mitte konzentriert sind. Der Mittelwert \( \mu \) und der Median dieser Daten liegen sehr nahe beieinander und betragen ungefähr \( 3,5 \).

\( \mu \approx 3,5 \) , Median \( \approx 3,5 \)

Symmetric Probability Histogram

Abbildung 2

Die Verteilung ist symmetrisch und wird weiter unten genauer besprochen.


Normalerweise verteilte Daten

Das Wahrscheinlichkeitshistogramm eines Datensatzes mit 2560 Datenwerten in einer Google-Tabelle Datendatei (1) wird unten angezeigt. Die Daten in dieser Datei können heruntergeladen und für weitere Übungen verwendet werden.
Berechnungen des Mittelwerts, des Medians und der Standardabweichung dieser Daten, die mithilfe von Google-Tabellen durchgeführt wurden, werden unten angezeigt. Auf das nächste Zehntel gerundet ist der Mittelwert dieses Datensatzes \( \mu \) gleich \( 3,5 \) und seine Standardabweichung stdev ist gleich \( 1 \). Beachten Sie auch, dass der Mittelwert und der Median sehr nahe beieinander liegen.

Mittelwert, Median und Standardabweichung

Abbildung 3


Frequenzen und entsprechende Wahrscheinlichkeiten

Abbildung 4


In Abbildung 5 unten sehen wir das Wahrscheinlichkeitshistogramm und den Graphen der Funktion \( f_{X}(x) \), gegeben durch \[ f_{X}(x) = \dfrac{1}{\sqrt{2 \; \pi }} \; e^{-\frac{1}{2} (x-3,5)^2 } \]
Normalverteilung von Daten

Abbildung 5


Wir verwenden nun numerische Werte, um den Zusammenhang zwischen der Fläche unter den Rechtecken, aus denen das Histogramm besteht, und der Fläche zwischen der Kurve der Funktion \( f_X(x) = \dfrac{1}{\sqrt{2 \; \pi }} zu erklären. \; e^{-\frac{1}{2} (x-3.5)^2 }\) und die x-Achse.

Sei \( P( 3 \le X \le 5) \) die Wahrscheinlichkeit, dass ein zufällig aus dem Datensatz ausgewählter Datenwert \( X \) größer oder gleich \( 3 \) und kleiner als oder ist gleich \( 5 \). Gemäß den Klassen [3-4] und [4-5] und ihren entsprechenden Wahrscheinlichkeiten in Abbildung 4 haben wir
\( \qquad P( 3 \le X \le 5) \ approx 0,377+0,229 = 0,606 \qquad (A) \)

Wir verwenden jetzt die Wahrscheinlichkeitsdichtefunktion \( f_{X}(x) \). Die Fläche zwischen der Kurve von \( f_{X}(x) \), der x-Achse und \( x = 3 \) und \( x = 5 \) ist gegeben durch:
\( \displaystyle \qquad P( 3 \le X \le 5) = \int_3^5 \; f_{X} (x) \; dx \)

Ersetzen Sie \( f_{X}(x) \) durch \( \dfrac{1}{\sqrt{2 \; \pi }} \; e^{-\frac{1}{2} (x-3,5) ^2 } \)
\( \displaystyle \qquad P( 3 \le X \le 5) = \dfrac{1}{\sqrt{2 \; \pi }} \int_3^5 \; \; e^{-\frac{1} {2} (x-3,5)^2 } \; dx \)
Verwenden Sie zur Berechnung einen Taschenrechner
\( \displaystyle \qquad P( 3 \le X \le 5) \ca. 0,62465 \qquad (B) \)

Wenn wir die oben gefundenen Ergebnisse der Wahrscheinlichkeiten in \( (A) \) und \( (B) \) vergleichen, kommen wir zu dem Schluss, dass es möglich ist, \( f_{X}(x) \) als die Wahrscheinlichkeitsdichtefunktion zu definieren, deren Die Fläche kann zur Bestimmung von Wahrscheinlichkeiten verwendet werden.

Funktion \[ f_X(x) = \dfrac{1}{\sqrt{2 \; \pi }} \; e^{-\frac{1}{2} (x-3,5)^2 }\] ist definiert als eine Normalverteilung mit Mittelwert \( \mu = 3,5 \) und Standardabweichung \( \sigma = 1 \)

Im Folgenden verallgemeinern wir die Definition einer Normalverteilung und ihre Eigenschaften.


Wahrscheinlichkeitsdichtefunktion einer Normalverteilung

Die Wahrscheinlichkeitsdichtefunktion einer Normalverteilung mit Mittelwert \( \mu \) und Standardabweichung \( \sigma \) ist definiert durch \[ \boxed {\displaystyle f_X(x) = \dfrac{1}{ \sigma \sqrt{2 \; \pi }} \; e^{-\frac{1}{2} \left( \dfrac{x - \mu}{\sigma} \right)^2 } } \] wobei \( X \) die normalverteilte Zufallsvariable ist.


Diagramme der Dichtefunktion einer Normalverteilung

In Abbildung 6 unten sind normale Wahrscheinlichkeitsdichtefunktionen mit der gleichen Standardabweichung \( \sigma = 2 \) und unterschiedlichen Mittelwerten dargestellt.

Normalverteilungen mit Verschiedene Mittel

Abbildung 6


In Abbildung 7 unten sind normale Wahrscheinlichkeitsdichtefunktionen mit demselben Mittelwert \( \mu = 4 \) und unterschiedlichen Standardabweichungen \( \sigma \) dargestellt.

Normalverteilungen mit Unterschiedliche Standardabweichung

Abbildung 7


Aus dem Obigen geht hervor, dass der Mittelwert \( \mu \) die horizontale Verschiebung von \( f_X(x) \) angibt und \( \sigma \) angibt, wie Daten um den Mittelwert gruppiert sind. Bei hochkonzentrierten Daten ist \( \sigma \) um den Mittelwert herum klein.

Eigenschaften von Normalverteilungen

1-Die Normalverteilung konzentriert sich auf den Mittelwert. Dies ist in den Abbildungen 6 und 7 deutlich zu erkennen.
2 - Der Mittelwert und der Median einer Normalverteilung liegen sehr nahe beieinander (theoretisch gleich).
3 – Die Gesamtfläche unter der Kurve einer Normalverteilung ist gleich \( 1 \). \[ \displaystyle \dfrac{1}{ \sigma \sqrt{2 \; \pi }} \int_{-\infty}^{\infty} \; e^{-\frac{1}{2} \left( \dfrac{x - \mu}{\sigma} \right)^2 } dx = 1 \] 4 – Die Datenverteilung ist wie folgt
a) Ungefähr \( 68\% \) der Daten liegen innerhalb einer Standardabweichung vom Mittelwert. \[ \displaystyle \frac{1}{\sigma\sqrt{2\pi}} \int _{\mu-\sigma}^{\mu+\sigma}\:e^{-0.5\left(\frac{x-mu}{\sigma}\right)^2}dx \approx 0,68268\]

Area Within Mean Plus oder minus eine Standardabweichung

Abbildung 8

b) Ungefähr \( 95\% \) der Daten liegen innerhalb von 2 Standardabweichungen vom Mittelwert. \[ \frac{1}{\sigma\sqrt{2\pi \:}}\: \int _{\mu-2\sigma}^{\mu+2\sigma}\:e^{-0.5\left(\frac{x-mu}{\sigma}\right)^2}dx \approx 0,95449 \]

Area Within Mean Plus oder minus zwei Standardabweichungen

Abbildung 9

c) Ungefähr \( 99\% \) der Daten liegen innerhalb von 3 Standardabweichungen vom Mittelwert. \[ \frac{1}{\sigma\sqrt{2\pi \:}}\: \int _{\mu-3\sigma}^{\mu+3\sigma}\:e^{-0.5\left(\frac{x-mu}{\sigma}\right)^2}dx \approx 0,99730 \]

Area Within Mean Plus oder minus drei Standardabweichungen

Abbildung 10


Standardnormalverteilung und ihre kumulative Wahrscheinlichkeit

Die Normalverteilung mit Mittelwert \( \mu = 0 \) und Standardabweichung \( \sigma = 1 \) wird Standardnormalverteilung genannt und ihre Wahrscheinlichkeitsdichtefunktion ist gegeben durch \[ f_X(x) = \dfrac{1}{ \sqrt{2 \; \pi }} \; e^{-\frac{1}{2} x^2 } \] Die kumulative Wahrscheinlichkeitsverteilung der Standardnormalverteilung wird definiert durch \[ \displaystyle F_{X} (x) = \dfrac{1}{ \sqrt{2 \; \pi }} \int_{-\infty}^{x} \; e^{-\frac{1}{2} t^2} \; dt \] und wird verwendet, um Wahrscheinlichkeiten der Form zu finden \[ P( X \le a) = F_{X} (a) \] Cumulative Wahrscheinlichkeit der Standardnormalverteilung

Abbildung 11

Somit \( P( X \le a) \) ist gegeben durch die Fläche zwischen der x-Achse, der Kurve der Standardnormalverteilung und \( x = a \)
Das Integral, das die kumulative Wahrscheinlichkeit der Standardnormalverteilung definiert, wird nicht in geschlossener Form angegeben und kann daher entweder mit einem normaler Wahrscheinlichkeitsrechner oder Tabellen und möglicherweise heruntergeladen für den persönlichen Gebrauch. wie in den unten gezeigten Google-Tabellen.


Die kumulative Wahrscheinlichkeit kann auch mithilfe von Google Sheets und der Funktion „=NORM.S.DIST(a)“ berechnet werden, wie unten gezeigt.
Kumulative Wahrscheinlichkeit der Standardnormalverteilung in Google Sheets

Abbildung 12


Von der Normalverteilung zur Standardnormalverteilung

Die Normalverteilung des Mittelwerts \( \mu \) und der Standardabweichung \( \sigma \) ist gegeben durch \[ \displaystyle f_{X}(x) = \frac{1}{\sigma\sqrt{2\pi \:}}\:e^{-\frac{1}{2}\left(\frac{ x-\mu}{\sigma}\right)^2} \] Die Wahrscheinlichkeit \( P( X \le a) \) ist durch die Fläche zwischen der x-Achse, der Kurve der Normalverteilung und \( x = a \) gegeben und beträgt \[ \displaystyle P( X \le a) = F_{X} (a) = \frac{1}{\sigma \sqrt{2\pi \:}}\:\int_{-\infty}^{a} \; e^{- \frac{1}{2} \left(\frac{t - \mu}{\sigma}\right)^2} \; dt \] Lassen Sie uns die Substitution im Integral verwenden \( z = \frac{t - \mu}{\sigma} \), was \( \dfrac{dz}{dt} = \dfrac{1}{\sigma} \) ergibt und in das obige Integral einsetzt \[ \displaystyle P( X \le a) = F_{X} (a) = \frac{1}{\sqrt{2\pi \:}}\:\int_{-\infty}^{\frac{a - \mu}{\sigma}} \; e^{- \frac{1}{2} z^2} \; dz \] Wir befassen uns nun mit dem Integral der Standardnormalverteilung und dem z-Score gegeben durch. \[ z = \frac{a - \mu}{\sigma} \]
Das obige Ergebnis zeigt uns, dass Sie nur das Integral der Standardnormalverteilung kennen müssen, um die Wahrscheinlichkeit im Zusammenhang mit einer Normalverteilung zu berechnen, und zwar unter Verwendung des oben definierten Z-Scores.
Das Integral \[ \frac{1}{\sqrt{2\pi \:}}\:\int_{-\infty}^{z_0} \; e^{- \frac{1}{2} z^2} \; dz \] kann mithilfe von Google-Tabellen berechnet werden, die für den persönlichen Gebrauch heruntergeladen werden können. und wird auch in der Form angegeben Tabelle der Normalverteilung im PDF-Format kann sein heruntergeladen und verwendet werden.


Beispiele für Wahrscheinlichkeiten im Zusammenhang mit Normalverteilungen

Beispiel 1
Eine Zufallsvariable \( X \) wird normalerweise mit einem Mittelwert \( \mu = 2,2 \) und einer Standardabweichung \( \sigma = 2,5 \) verteilt. Finden Sie die Wahrscheinlichkeit
a) \( \qquad P( X \le 1.2) \)
Lösung zu Beispiel 1

In diesem Beispiel haben wir \( \mu = 2,2 \) und \( \sigma = 2,5 \), daher ist der oben definierte z-Score gegeben durch \[ z = \frac{1,2 - 2,2}{2,5} \approx -0,4 \] Verschiedene Möglichkeiten, das Integral zu berechnen
a) Mit einem Taschenrechner wird die Wahrscheinlichkeit angegeben durch \[ P( X \le 1.2) = \frac{1}{\sqrt{2\pi \:}}\:\int_{-\infty}^{-0.4} \; e^{- \frac{1}{2} z^2} \; dz \approx 0,34457 \] b) Verwenden Sie eine Wertetabelle für die Wahrscheinlichkeit einer Standardnormalverteilung, die möglicherweise vorliegt
heruntergeladen für den persönlichen Gebrauch.
Tabelle des Standards Normalverteilung

Abbildung 13

HINWEIS a Tabelle der Normalverteilung im PDF-Format kann heruntergeladen und verwendet werden.

Beispiel 2
Eine Zufallsvariable \( X \) wird normalerweise mit einem Mittelwert \( \mu = -2,5 \) und einer Standardabweichung \( \sigma = 2 \) verteilt. Finden Sie die folgenden Wahrscheinlichkeiten
a) \( \qquad P( 0.5 \le X \le 3.1) \)
b) \( \qquad P( X \ge 0,8) \)
Lösung für Beispiel 2
a)
\( P( 0,5 \le X \le 3,1) \) ist die Fläche zwischen der x-Achse, der Kurve des Normalverteilungsmittelwerts \( \mu = -2,5 \) und einer Standardabweichung \( \sigma = 2 \) und \( x = 0,5 \) und \( x = 3,1 \)
Somit
\( P( 0,5 \le X \le 3,1) = P( X \le 3,1) - P( X \le 0,5) \)

Sei \( z_1 = \dfrac{0,5 - (-2,5)}{2} = 1,5 \) und \( z_2 = \dfrac{3,1 - (-2,5)}{2} = 2,8 \)

Wir schreiben die Wahrscheinlichkeiten mit dem Z-Score und verwenden die Tabelle Tabelle der Normalverteilung , um Folgendes zu erhalten:
\( P( X \le 3,1) = P( Z_1 \le 2,8) = 0,9974448697 \)
\( P( X \le 0,5) = P( Z_2 \le 1,5) = 0,9331927987 \)
\( P( 0,5 \le X \le 3,1) = 0,9974448697 - 0,9331927987 = 0,064252071 \)

HINWEIS, dass Sie auch den Normalwahrscheinlichkeitsrechner verwenden können um die Antwort zu überprüfen.
b)
\( P( X \ge 0,8) = 1 - P( X \le 0,8) \)
Sei \( z_3 = \dfrac{0,8 - (-2,5)}{2} = 1,65 \)

Wir schreiben die Wahrscheinlichkeiten mit dem Z-Score und verwenden die Tabelle Tabelle der Normalverteilung , um Folgendes zu erhalten:
\( P( X \le 0,8) = P( Z_3 \le 1,65) = 0,950528532 \)
\( P( X \ge 0,8) = 1 - 0,950528532 = 0,049471468 \)

HINWEIS, dass Sie auch den Normalwahrscheinlichkeitsrechner verwenden können um die Antwort zu überprüfen.
Weitere Normalverteilungsprobleme mit Lösungen finden Sie auf dieser Website.



Weitere Referenzen und Links

  1. Wahrscheinlichkeitsdichte für kontinuierliche Variable
  2. Einführung in Wahrscheinlichkeiten
  3. Häufigkeitsverteilung und Histogramm mit Google Sheets
  4. Normalwahrscheinlichkeitsrechner
  5. Histogramme für gruppierte Daten
  6. Integrale
  7. Inverser Normalwahrscheinlichkeitsrechner.
  8. Normalverteilungsprobleme mit Lösungen
  9. Tutorials und Probleme zu elementarer Statistik und Wahrscheinlichkeitstheorie
  10. Statistikrechner, -löser und -grafiker
  11. Tabelle der Normalverteilung