Definición de distribución normal

\( \) \( \) \( \) \( \) \( \) \( \) \( \) \( \)

La función de densidad de probabilidad de la distribución normal y sus propiedades se presentan a partir de los histogramas de probabilidad . Se utiliza un conjunto de datos distribuido normalmente con media \( \mu = 3,5 \) y una desviación estándar \( \sigma = 1 \) para resaltar el vínculo entre el histograma de probabilidad de los datos y la función de densidad normal que conduce a la definición de distribución normal .
Gráficas de distribuciones normales se presentan para resaltar los efectos de la media \( \mu \) y la desviación estándar \( \sigma \) en la distribución normal. Se presentan las propiedades de las distribuciones normales. Se define la distribución normal estándar y se siguen los pasos para pasar de Se presentan distribuciones normales a distribución normal estándar utilizando el puntaje z . Se incluyen Ejemplos de cálculos de probabilidades de distribuciones normales.
Se incluyen una tabla PDF así como una hoja de Google para valores de área de distribución normal estándar. y ambos pueden descargarse y usarse en cálculos.


Histogramas de probabilidad de distribución de datos

En la figura 1, se muestran los histogramas de probabilidad de 3 datos conjuntos. Los datos del histograma A están más concentrados hacia la izquierda. Los datos del histograma B están más concentrados hacia la derecha; y los datos del histograma C están dispersos.
Histograma de probabilidad de varias distribuciones de datos

Figura 1


La Figura 2 muestra un histograma de probabilidad simétrico cuyos datos se concentran en el medio. La media \( \mu \) y la mediana de estos datos son muy cercanas y aproximadamente iguales a \( 3,5 \).

\( \mu \approx 3.5 \) , mediana \( \approx 3.5 \)

Histograma de probabilidad simétrica

Figura 2

La distribución es simétrica y se analizará con más detalle a continuación.


Datos normalmente distribuidos

El histograma de probabilidad de un conjunto de datos de 2560 valores de datos en un archivo de datos de se muestra a continuación. Los datos de este archivo se pueden descargar y utilizar para practicar más.
A continuación se muestran los cálculos, realizados utilizando hojas de Google, de la media, la mediana y la desviación estándar de estos datos. Redondeada a la décima más cercana, la media de este conjunto de datos \( \mu \) es igual a \( 3.5 \) y su desviación estándar stdev es igual a \( 1 \). Tenga en cuenta también que la media y la mediana están muy cerca.

Media, mediana y desviación estándar

Figura 3


Frecuencias y probabilidades correspondientes

Figure 4


En la figura 5 a continuación, tenemos el histograma de probabilidad y la gráfica de la función \( f_{X}(x) \) dada por \[ f_{X}(x) = \dfrac{1}{\sqrt{2 \; \pi }} \; e^{-\frac{1}{2} (x-3.5)^2 } \]
Distribución normal de datos

Figure 5


Ahora usamos valores numéricos para explicar el vínculo entre el área debajo de los rectángulos que forman el histograma y el área entre la curva de la función \( f_X(x) = \dfrac{1}{\sqrt{2 \; \pi }} \; e^{-\frac{1}{2} (x-3.5)^2 }\) y el eje x.

Sea \( P( 3 \le X \le 5) \) la probabilidad de que un valor de dato \( X \), seleccionado aleatoriamente del conjunto de datos, sea mayor o igual que \( 3 \) y menor que o igual a \( 5 \). Según las clases [3-4] y [4-5] y sus correspondientes probabilidades en la Figura 4, tenemos
\( \qquad P( 3 \le X \le 5) \approx 0.377+0.229 = 0.606 \qquad (A) \)

Ahora usamos la función de densidad de probabilidad \( f_{X}(x) \). El área entre la curva de \( f_{X}(x) \), el eje x y \( x = 3 \) y \( x = 5 \) viene dada por:
\( \displaystyle \qquad P( 3 \le X \le 5) = \int_3^5 \; f_{X} (x) \; dx \)

Sustituta \( f_{X}(x) \) by \( \dfrac{1}{\sqrt{2 \; \pi }} \; e^{-\frac{1}{2} (x-3.5)^2 } \)
\( \displaystyle \qquad P( 3 \le X \le 5) = \dfrac{1}{\sqrt{2 \; \pi }} \int_3^5 \; \; e^{-\frac{1}{2} (x-3.5)^2 } \; dx \)
Utilice una calculadora para obtener
\( \displaystyle \qquad P( 3 \le X \le 5) \approx 0,62465 \qquad (B) \)

Comparando los resultados de las probabilidades en \( (A) \) y \( (B) \) encontradas anteriormente, concluimos que es posible definir \( f_{X}(x) \) como la función de densidad de probabilidad cuya El área puede usarse para determinar probabilidades.

Función \[ f_X(x) = \dfrac{1}{\sqrt{2 \; \pi }} \; e^{-\frac{1}{2} (x-3.5)^2 }\] se define como una distribución normal con media \( \mu = 3.5 \) y desviación estándar \( \sigma = 1 \)

A continuación, generalizaremos la definición de una distribución normal y sus propiedades.


Función de densidad de probabilidad de una distribución normal

La función de densidad de probabilidad de una distribución normal con media \( \mu \) y desviación estándar \( \sigma \) está definida por \[ \boxed {\displaystyle f_X(x) = \dfrac{1}{ \sigma \sqrt{2 \; \pi }} \; e^{-\frac{1}{2} \left( \dfrac{x - \mu}{\sigma} \right)^2 } } \] donde \( X \) es la variable aleatoria distribuida normalmente.


Gráficas de la función de densidad de una distribución normal

En la figura 6 a continuación, se muestran funciones de densidad de probabilidad normal con la misma desviación estándar \( \sigma = 2 \) y diferentes medias.

Distribuciones normales con diferentes medias

Figure 6


En la figura 7 a continuación, se muestran funciones de densidad de probabilidad normal con la misma media \( \mu = 4 \) y diferentes desviaciones estándar \( \sigma \).

Distribuciones normales con diferente desviación estándar

Figure 7


De lo anterior, la media \( \mu \) indica el desplazamiento horizontal de \( f_X(x) \) y \( \sigma \) indica cómo se agrupan los datos alrededor de la media. Para datos muy concentrados, alrededor de la media, \( \sigma \) es pequeño.

Propiedades de las distribuciones normales

1-La distribución normal se centra alrededor de la media; esto se muestra claramente en las figuras 6 y 7.
2 - La media y la mediana de una distribución normal son muy cercanas (iguales en teoría).
3 - El área total bajo la curva de una distribución normal es igual a \( 1 \). \[ \displaystyle \dfrac{1}{ \sigma \sqrt{2 \; \pi }} \int_{-\infty}^{\infty} \; e^{-\frac{1}{2} \left( \dfrac{x - \mu}{\sigma} \right)^2 } dx = 1 \] 4 - La distribución de datos es la siguiente
a) Aproximadamente, \( 68\% \) de los datos se encuentran dentro de 1 desviación estándar de la media. \[ \displaystyle \frac{1}{\sigma\sqrt{2\pi}} \int _{\mu-\sigma}^{\mu+\sigma}\:e^{-0.5\left(\frac{ x-mu}{\sigma}\right)^2}dx \approx 0,68268\]

Área dentro de la media más o menos una desviación estándar

Figure 8

b) Aproximadamente, \( 95\% \) de los datos se encuentran dentro de 2 desviaciones estándar de la media. \[ \frac{1}{\sigma\sqrt{2\pi \:}}\: \int _{\mu-2\sigma}^{\mu+2\sigma}\:e^{-0.5\left(\frac{x-mu}{\sigma}\right)^2}dx \approx 0.95449 \]

Área dentro de la media más o menos dos desviaciones estándar

Figure 9

c) Aproximadamente, \( 99\% \) de los datos se encuentran dentro de 3 desviaciones estándar de la media. \[ \frac{1}{\sigma\sqrt{2\pi \:}}\: \int _{\mu-3\sigma}^{\mu+3\sigma}\:e^{-0.5\left(\frac{x-mu}{\sigma}\right)^2}dx \approx 0.99730 \]

Área dentro de la media más o menos tres desviaciones estándar

Figure 10


Distribución normal estándar y su probabilidad acumulada

La distribución normal con media \( \mu = 0 \) y desviación estándar \( \sigma = 1 \) se llama distribución normal estándar y su función de densidad de probabilidad está dada por \[ f_X(x) = \dfrac{1}{ \sqrt{2 \; \pi }} \; e^{-\frac{1}{2} x^2 } \] La distribución de probabilidad acumulada de la distribución normal estándar está definida por la integral \[ \displaystyle F_{X} (x) = \dfrac{1}{ \sqrt{2 \; \pi }} \int_{-\infty}^{x} \; e^{-\frac{1}{2} t^2} \; dt \] y se utiliza para encontrar probabilidades de la forma \[ P( X \le a) = F_{X} (a) \] Probabilidad acumulada de distribución normal estándar

Figure 11

Por eso \( P( X \le a) \) está dada por el área entre el eje x, la curva de la distribución normal estándar y \( x = a \)
La integral que define la probabilidad acumulada de la distribución normal estándar no se da en forma cerrada y, por lo tanto, se puede hacer usando una calculadora de probabilidad normal o tablas y pueden ser descargado para uso personal. como en las hojas de Google que se muestran a continuación.


La probabilidad acumulada también se puede calcular utilizando hojas de Google y la función "=NORM.S.DIST(a)" como se muestra a continuación.
Probabilidad acumulada de distribución normal estándar en Google Sheets

Figure 12


De la distribución normal a la distribución normal estándar

La distribución normal de la media \( \mu \) y la desviación estándar \( \sigma \) viene dada por \[ \displaystyle f_{X}(x) = \frac{1}{\sigma\sqrt{2\pi \:}}\:e^{-\frac{1}{2}\left(\frac{ x-\mu}{\sigma}\right)^2} \] La probabilidad \( P( X \le a) \) está dada por el área entre el eje x, la curva de la distribución normal y \( x = a \) y está dada por \[ \displaystyle P( X \le a) = F_{X} (a) = \frac{1}{\sigma \sqrt{2\pi \:}}\:\int_{-\infty}^{a } \; e^{- \frac{1}{2} \left(\frac{t - \mu}{\sigma}\right)^2} \; dt\] Usemos la sustitución en la integral. \( z = \frac{t - \mu}{\sigma} \) lo que da \( \dfrac{dz}{dt} = \dfrac{1}{\sigma} \) y sustituye en la integral anterior \[ \displaystyle P( X \le a) = F_{X} (a) = \frac{1}{\sqrt{2\pi \:}}\:\int_{-\infty}^{\frac{ a - \mu}{\sigma}} \; e^{- \frac{1}{2} z^2} \; dz\] Ahora estamos tratando con la integral de la distribución normal estándar y la puntuación z dada por. \[ z = \frac{a - \mu}{\sigma} \]
El resultado anterior nos dice que solo necesita conocer la integral de la distribución normal estándar para calcular cualquier probabilidad relacionada con cualquier distribución normal y eso es utilizando el puntaje z definido anteriormente.
la integral \[ \frac{1}{\sqrt{2\pi \:}}\:\int_{-\infty}^{z_0} \; e^{- \frac{1}{2} z^2} \; dz\] se puede calcular utilizando hojas de Google que se pueden descargar para uso personal. y también se da en forma de Tabla de Distribución Normal en pdf puede ser descargado y utilizado.


Ejemplos de probabilidades relacionadas con distribuciones normales

Ejemplo 1
Una variable aleatoria \( X \) normalmente se distribuye con una media \( \mu = 2.2 \) y una desviación estándar \( \sigma = 2.5 \). Encuentra la probabilidad
a) \( \qquad P( X \le 1.2) \)
Solución al ejemplo 1

En este ejemplo tenemos \( \mu = 2.2 \) y \( \sigma = 2.5 \), por lo tanto, el puntaje z definido anteriormente viene dado por \[ z = \frac{1,2 - 2,2}{2,5} \aprox -0,4 \] Diferentes formas de calcular la integral.
a) Usando una calculadora, la probabilidad está dada por \[ P( X \le 1.2) = \frac{1}{\sqrt{2\pi \:}}\:\int_{-\infty}^{-0.4} \; e^{- \frac{1}{2} z^2} \; dz \aproximadamente 0,34457 \] b) Utilice una tabla de valores de probabilidad de una distribución normal estándar que pueda ser
descargado para uso personal.
Tabla de estándares Distribución normal

Figura 13

NOTA a Tabla de Distribución Normal en pdf se puede descargar y utilizar.

Ejemplo 2
Una variable aleatoria \( X \) normalmente se distribuye con una media \( \mu = -2.5 \) y una desviación estándar \( \sigma = 2 \). Encuentre las siguientes probabilidades
a) \( \qquad P( 0.5 \le X \le 3.1) \)
b) \( \qquad P( X \ge 0.8) \)
Solución al ejemplo 2
a)
\( P( 0.5 \le X \le 3.1) \) es el área entre el eje x, la curva de la distribución normal media \( \mu = -2.5 \) y una desviación estándar \( \sigma = 2 \) y \( x = 0.5 \) y \( x = 3.1 \)
Por eso
\( P( 0.5 \le X \le 3.1) = P( X \le 3.1) - P( X \le 0.5) \)

Sean \( z_1 = \dfrac{0.5 - (-2.5)}{2} = 1.5 \) y \( z_2 = \dfrac{3.1 - (-2.5)}{2} = 2.8 \)

Escribimos las probabilidades usando el puntaje z y usamos la tabla Tabla de Distribución Normal para obtener:
\( P( X \le 3.1) = P( Z_1 \le 2.8) = 0.9974448697 \)
\( P( X \le 0.5) = P( Z_2 \le 1.5) = 0.9331927987 \)
\( P( 0.5 \le X \le 3.1) = 0.9974448697 - 0.9331927987 = 0.064252071 \)

NOTA que también puede utilizar la Calculadora de probabilidad normal para comprobar la respuesta.
b)
\( P( X \ge 0.8) = 1 - P( X \le 0.8) \)
Sea \( z_3 = \dfrac{0,8 - (-2,5)}{2} = 1,65 \)

Escribimos las probabilidades usando el puntaje z y usamos la tabla Tabla de Distribución Normal para obtener:
\( P( X \le 0.8) = P( Z_3 \le 1.65) = 0.950528532 \)
\( P( X \ge 0,8) = 1 - 0,950528532 = 0,049471468 \)

NOTA que también puede utilizar la Calculadora de probabilidad normal para comprobar la respuesta.
En este sitio se incluyen más problemas de distribución normal con soluciones .





Más referencias y enlaces

  1. Densidad de probabilidad para variable continua
  2. Introducción a las probabilidades
  3. Distribución de frecuencia e histograma con Google Sheets
  4. Calculadora de probabilidad normal
  5. Histogramas para datos agrupados
  6. Integrales
  7. Calculadora de probabilidad normal inversa.
  8. Problemas de distribución normal con soluciones
  9. Tutoriales y problemas de estadística elemental y probabilidad
  10. Calculadoras, solucionadores y graficadores estadísticos
  11. Tabla de distribución normal