Distribución Normal: Definición, Propiedades y Aplicaciones

La distribución normal es un concepto fundamental en estadística que describe cómo los datos se agrupan alrededor de una media. Esta guía explica la función de densidad de probabilidad, la distribución normal estándar, las puntuaciones Z y aplicaciones prácticas con ejemplos. Aprenda cómo la media (μ) y la desviación estándar (σ) dan forma a la distribución, calcule probabilidades usando la conversión a forma normal estándar y aplique la regla empírica para el análisis de datos.

Histogramas de Probabilidad y Distribuciones de Datos

Los histogramas de probabilidad visualizan la distribución de datos. La Figura 1 muestra tres distribuciones: A (concentrada a la izquierda), B (concentrada a la derecha) y C (dispersa).

Histograma de Probabilidad de Varias Distribuciones de Datos

Figura 1: Diferentes Tipos de Distribución de Datos

La Figura 2 muestra un histograma simétrico con datos concentrados en el centro. La media (μ) y la mediana son aproximadamente iguales: \[ \mu \approx 3.5 \quad \text{y} \quad \text{mediana} \approx 3.5 \]

Histograma de Probabilidad Simétrico

Figura 2: Distribución Simétrica

Ejemplo de Datos Distribuidos Normalmente

Considere un conjunto de datos con media calculada μ = 3.5 y desviación estándar σ = 1 (Figura 3). La media y la mediana son casi idénticas, indicando simetría.

Cálculo de Media, Mediana y Desviación Estándar

Figura 3: Estadísticas del Conjunto de Datos

Tabla de Frecuencias y Probabilidades

Figura 4: Distribución de Frecuencias y Probabilidades

La Figura 5 compara el histograma de probabilidad con la función de densidad normal: \[ f_X(x) = \frac{1}{\sqrt{2\pi}} e^{-\frac{1}{2}(x-3.5)^2} \]

Distribución Normal Superpuesta en Histograma

Figura 5: Ajuste de la Distribución Normal

Comparación de Probabilidades: Para \( P(3 \leq X \leq 5) \):

  1. Método del histograma: \( 0.377 + 0.229 = 0.606 \)
  2. Integral de la distribución normal: \[ P(3 \leq X \leq 5) = \frac{1}{\sqrt{2\pi}} \int_3^5 e^{-\frac{1}{2}(x-3.5)^2} dx \approx 0.62465 \]
La cercana coincidencia valida el uso de la función de densidad normal para cálculos de probabilidad.

Función de Densidad de Probabilidad de la Distribución Normal

La distribución normal general con media μ y desviación estándar σ tiene la siguiente función de densidad de probabilidad: \[ \boxed{ f_X(x) = \frac{1}{\sigma\sqrt{2\pi}} e^{-\frac{1}{2}\left(\frac{x-\mu}{\sigma}\right)^2} } \] donde \( X \) es la variable aleatoria distribuida normalmente.

Gráficas de Distribuciones Normales

Figura 6: Misma desviación estándar (σ = 2), diferentes medias. Distribuciones Normales con Diferentes Medias
Figura 7: Misma media (μ = 4), diferentes desviaciones estándar. Distribuciones Normales con Diferentes Desviaciones Estándar

La media μ determina la posición horizontal; σ controla la dispersión (σ menor = datos más concentrados).

Propiedades de las Distribuciones Normales

  1. La distribución es simétrica y centrada en la media μ.
  2. Media, mediana y moda son iguales.
  3. El área total bajo la curva es igual a 1: \[ \frac{1}{\sigma\sqrt{2\pi}} \int_{-\infty}^{\infty} e^{-\frac{1}{2}\left(\frac{x-\mu}{\sigma}\right)^2} dx = 1 \]
  4. Regla Empírica (68-95-99.7):
    1. ≈68% de los datos dentro de μ ± σ: \[ \frac{1}{\sigma\sqrt{2\pi}} \int_{\mu-\sigma}^{\mu+\sigma} e^{-\frac{1}{2}\left(\frac{x-\mu}{\sigma}\right)^2} dx \approx 0.68268 \] Área Dentro de Una Desviación Estándar
    2. ≈95% dentro de μ ± 2σ: \[ \frac{1}{\sigma\sqrt{2\pi}} \int_{\mu-2\sigma}^{\mu+2\sigma} e^{-\frac{1}{2}\left(\frac{x-\mu}{\sigma}\right)^2} dx \approx 0.95449 \] Área Dentro de Dos Desviaciones Estándar
    3. ≈99.7% dentro de μ ± 3σ: \[ \frac{1}{\sigma\sqrt{2\pi}} \int_{\mu-3\sigma}^{\mu+3\sigma} e^{-\frac{1}{2}\left(\frac{x-\mu}{\sigma}\right)^2} dx \approx 0.99730 \] Área Dentro de Tres Desviaciones Estándar

Distribución Normal Estándar

Caso especial con μ = 0 y σ = 1: \[ f_X(x) = \frac{1}{\sqrt{2\pi}} e^{-\frac{1}{2}x^2} \] Función de distribución acumulativa: \[ F_X(x) = \frac{1}{\sqrt{2\pi}} \int_{-\infty}^{x} e^{-\frac{1}{2}t^2} dt \] Esto da \( P(X \leq a) = F_X(a) \), representado por el área sombreada en la Figura 11.

Visualización de Probabilidad Acumulativa

Figura 11: Área de Probabilidad Acumulativa

Los valores se calculan usando software estadístico, calculadoras o tablas. Función de Google Sheets: =NORM.S.DIST(a, TRUE).

Ejemplo de Cálculo en Google Sheets

Figura 12: Implementación en Google Sheets

Conversión a Distribución Normal Estándar

Cualquier distribución normal puede transformarse usando la puntuación Z: \[ z = \frac{x - \mu}{\sigma} \] Para la probabilidad \( P(X \leq a) \): \[ P(X \leq a) = \frac{1}{\sigma\sqrt{2\pi}} \int_{-\infty}^{a} e^{-\frac{1}{2}\left(\frac{t-\mu}{\sigma}\right)^2} dt \] Sustituya \( z = \frac{t-\mu}{\sigma} \), \( dz = \frac{dt}{\sigma} \): \[ P(X \leq a) = \frac{1}{\sqrt{2\pi}} \int_{-\infty}^{\frac{a-\mu}{\sigma}} e^{-\frac{1}{2}z^2} dz = F_Z\left(\frac{a-\mu}{\sigma}\right) \] Por lo tanto, solo se necesita la tabla de distribución normal estándar.

Ejemplos de Cálculo de Probabilidad

Ejemplo 1

Dado \( X \sim N(\mu = 2.2, \sigma = 2.5) \), encuentre \( P(X \leq 1.2) \).

Solución:

  1. Calcule la puntuación Z: \[ z = \frac{1.2 - 2.2}{2.5} = -0.4 \]
  2. Usando la tabla normal estándar o calculadora: \[ P(X \leq 1.2) = P(Z \leq -0.4) \approx 0.3446 \]

Ejemplo 2

Dado \( X \sim N(\mu = -2.5, \sigma = 2) \), encuentre:

  1. \( P(0.5 \leq X \leq 3.1) \)
  2. \( P(X \geq 0.8) \)

Solución:

Parte (a):

  1. Convierta a puntuaciones Z: \[ z_1 = \frac{0.5 - (-2.5)}{2} = 1.5, \quad z_2 = \frac{3.1 - (-2.5)}{2} = 2.8 \]
  2. Use la tabla normal estándar: \[ P(Z \leq 2.8) = 0.99744, \quad P(Z \leq 1.5) = 0.93319 \]
  3. Calcule: \[ P(0.5 \leq X \leq 3.1) = 0.99744 - 0.93319 = 0.06425 \]

Parte (b):

  1. Puntuación Z: \[ z_3 = \frac{0.8 - (-2.5)}{2} = 1.65 \]
  2. \( P(X \leq 0.8) = P(Z \leq 1.65) = 0.95053 \)
  3. \( P(X \geq 0.8) = 1 - 0.95053 = 0.04947 \)

Referencias y Recursos

  1. Densidad de Probabilidad para Variables Continuas
  2. Introducción a la Probabilidad
  3. Distribuciones de Frecuencia con Google Sheets
  4. Calculadora de Probabilidad Normal
  5. Problemas de Distribución Normal con Soluciones
  6. Tabla de Distribución Normal Estándar (PDF)