Definição de distribuição normal

\( \) \( \) \( \)

A função de densidade de probabilidade da distribuição normal e suas propriedades são apresentadas a partir de os histogramas de probabilidade . Um conjunto de dados normalmente distribuído com média \( \mu = 3,5 \) e um desvio padrão \( \sigma = 1 \) é usado para destacar a ligação entre o histograma de probabilidade dos dados e a função de densidade normal que leva à definição de distribuição normal .
Gráficos de distribuições normais são apresentados para destacar os efeitos da média \( \mu \) e do desvio padrão \( \sigma \) no distribuição normal. As propriedades das distribuições normais são apresentadas. A distribuição normal padrão é definida e as etapas usadas para ir de são apresentadas distribuições normais para distribuição normal padrão usando o escore z . Exemplos de cálculos de probabilidades de distribuições normais estão incluídos.
Uma tabela PDF e uma planilha do Google para valores padrão da área de distribuição normal estão incluídas e ambos podem ser baixados e usados em cálculos.


Histogramas de probabilidade de distribuição de dados

Na figura 1, são mostrados os histogramas de probabilidade de 3 dados conjuntos. Os dados no histograma A estão mais concentrados à esquerda. Os dados do histograma B estão mais concentrados à direita; e os dados no histograma C estão espalhados.
Histograma de probabilidade de diversas distribuições de dados

Figura 1


A Figura 2 mostra um histograma de probabilidade simétrico cujos dados estão concentrados no meio. A média \( \mu \) e a mediana desses dados são muito próximas e aproximadamente iguais a \( 3,5 \).

\( \mu \approx 3,5 \) , mediana \( \approx 3,5 \)

Histograma de probabilidade simétrica

Figura 2

A distribuição é simétrica e será discutida com mais detalhes abaixo.


Dados normalmente distribuídos

O histograma de probabilidade de um conjunto de dados de 2.560 valores de dados em um arquivo de dados é mostrado abaixo. Os dados neste arquivo podem ser baixados e usados para praticar mais.
Os cálculos, feitos em planilhas do Google, da média, mediana e desvio padrão desses dados são mostrados abaixo. Arredondado para o décimo mais próximo, a média deste conjunto de dados \( \mu \) é igual a \( 3,5 \) e seu desvio padrão stdev é igual a \( 1 \). Observe também que a média e a mediana estão muito próximas.

Média, Mediana e desvio padrão

Figura 3


Frequências e probabilidades correspondentes

Figura 4


Na figura 5 abaixo, temos o histograma de probabilidade e o gráfico da função \( f_{X}(x) \) dado por \[ f_{X}(x) = \dfrac{1}{\sqrt{2 \; \pi }} \; e^{-\dfrac{1}{2} (x-3,5)^2 } \]
Distribuição normal de dados

Figura 5


Agora usamos valores numéricos para explicar a ligação entre a área sob os retângulos que compõem o histograma e a área entre a curva da função \( f_X(x) = \dfrac{1}{\sqrt{2 \; \pi }} \; e^{-\dfrac{1}{2} (x-3.5)^2 }\) e o eixo x.

Seja \( P( 3 \le X \le 5) \) a probabilidade de que um valor de dados \( X \), selecionado aleatoriamente do conjunto de dados, seja maior ou igual a \( 3 \) e menor que ou igual a \( 5 \). De acordo com as classes [3-4] e [4-5] e suas probabilidades correspondentes na Figura 4, temos
\( \qquad P( 3 \le X \le 5) \approx 0,377+0,229 = 0,606 \qquad (A) \)

Agora usamos a função de densidade de probabilidade \( f_{X}(x) \). A área entre a curva de \( f_{X}(x) \), o eixo x e \( x = 3 \) e \( x = 5 \) é dada por:
\( \displaystyle \qquad P( 3 \le X \le 5) = \int_3^5 \; f_{X} (x) \; dx \)

Substitua \( f_{X}(x) \) por \( \dfrac{1}{\sqrt{2 \; \pi }} \; e^{-\dfrac{1}{2} (x-3,5) ^2 } \)
\( \displaystyle \qquad P( 3 \le X \le 5) = \dfrac{1}{\sqrt{2 \; \pi }} \int_3^5 \; \; e^{-\dfrac{1} {2} (x-3,5)^2 } \; dx \)
Use uma calculadora para obter
\( \displaystyle \qquad P( 3 \le X \le 5) \approx 0,62465 \qquad (B) \)

Comparando os resultados das probabilidades em \( (A) \) e \( (B) \) encontrados acima, concluímos que é possível definir \( f_{X}(x) \) como a função densidade de probabilidade cuja área pode ser usada para determinar probabilidades.

Função \[ f_X(x) = \dfrac{1}{\sqrt{2 \; \pi }} \; e^{-\dfrac{1}{2} (x-3,5)^2 }\] é definido como uma distribuição normal com média \( \mu = 3,5 \) e desvio padrão \( \sigma = 1 \)

A seguir, generalizaremos a definição de uma distribuição normal e suas propriedades.


Função de densidade de probabilidade de uma distribuição normal

A função densidade de probabilidade de uma distribuição normal com média \( \mu \) e desvio padrão \( \sigma \) é definida por \[ \boxed {\displaystyle f_X(x) = \dfrac{1}{ \sigma \sqrt{2 \; \pi }} \; e^{-\dfrac{1}{2} \left( \dfrac{x - \mu}{\sigma} \right)^2 } } \] onde \( X \) é a variável aleatória normalmente distribuída.


Gráficos da função densidade de uma distribuição normal

Na figura 6 abaixo, são mostradas funções normais de densidade de probabilidade com o mesmo desvio padrão \( \sigma = 2 \) e médias diferentes.

Distribuições normais com Meios Diferentes

Figura 6


Na figura 7 abaixo, são mostradas funções normais de densidade de probabilidade com a mesma média \( \mu = 4 \) e diferentes desvios padrão \( \sigma \).

Distribuições normais com diferentes desvios padrão

Figura 7


Do exposto acima, a média \( \mu \) indica o deslocamento horizontal de \( f_X(x) \) e \( \sigma \) indica como os dados são agrupados em torno da média. Para dados altamente concentrados, em torno da média, \( \sigma \) é pequeno.

Properties of Normal Distributions

1-The normal distribution is centered around the mean; this is clearly shown in figures 6 and 7.
2 - The mean and median of a normal distribution are very close (equal in theory).
3 - The total area under the curve of a normal distribution is equal to \( 1 \). \[ \displaystyle \dfrac{1}{ \sigma \sqrt{2 \; \pi }} \int_{-\infty}^{\infty} \; e^{-\dfrac{1}{2} \left( \dfrac{x - \mu}{\sigma} \right)^2 } dx = 1 \] 4 - Data Distribution is as follows
a) Approximately, \( 68\% \) of the data lies within 1 standard deviation from the mean. \[ \displaystyle \dfrac{1}{\sigma\sqrt{2\pi}} \int _{\mu-\sigma}^{\mu+\sigma}\:e^{-0.5\left(\dfrac{x-\mu}{\sigma}\right)^2}dx \approx 0.68268\]

Propriedades de distribuições normais

1-A distribuição normal está centrada na média; isso é claramente mostrado nas figuras 6 e 7.
2 - A média e a mediana de uma distribuição normal são muito próximas (iguais em teoria).
3 - A área total sob a curva de uma distribuição normal é igual a \( 1 \). \[ \displaystyle \dfrac{1}{ \sigma \sqrt{2 \; \pi }} \int_{-\infty}^{\infty} \; e^{-\dfrac{1}{2} \left( \dfrac{x - \mu}{\sigma} \right)^2 } dx = 1 \] 4 - A distribuição dos dados é a seguinte
a) Aproximadamente, \(68\% \) dos dados está dentro de 1 desvio padrão da média. \[ \displaystyle \dfrac{1}{\sigma\sqrt{2\pi}} \int _{\mu-\sigma}^{\mu+\sigma}\:e^{-0.5\left(\dfrac{ x-\mu}{\sigma}\right)^2}dx \approx 0,68268\]

Área dentro da média mais ou menos um desvio padrão

Figura 8

b) Aproximadamente, \(95\% \) dos dados estão dentro de 2 desvios padrão da média. \[ \dfrac{1}{\sigma\sqrt{2\pi \:}}\: \int _{\mu-2\sigma}^{\mu+2\sigma}\:e^{-0.5\left(\dfrac{x-\mu}{\sigma}\right)^2}dx \approx 0.95449 \]

Área dentro da média Mais ou menos dois desvios padrão

Figura 9

c) Aproximadamente, \(99\% \) dos dados estão dentro de 3 desvios padrão da média. \[ \dfrac{1}{\sigma\sqrt{2\pi \:}}\: \int _{\mu-3\sigma}^{\mu+3\sigma}\:e^{-0.5\left(\dfrac{x-\mu}{\sigma}\right)^2}dx \approx 0.99730 \]

Área dentro da média Mais ou menos três desvios padrão

Figura 10


Distribuição Normal Padrão e sua Probabilidade Cumulativa

A distribuição normal com média \( \mu = 0 \) e desvio padrão \( \sigma = 1 \) é chamada de distribuição normal padrão e sua função de densidade de probabilidade é dada por \[ f_X(x) = \dfrac{1}{ \sqrt{2 \; \pi }} \; e^{-\dfrac{1}{2} x^2 } \] A distribuição de probabilidade cumulativa da distribuição normal padrão é definida por \[ \displaystyle F_{X} (x) = \dfrac{1}{ \sqrt{2 \; \pi }} \int_{-\infty}^{x} \; e^{-\dfrac{1}{2} t^2} \; dt \] e é usado para encontrar probabilidades da forma \[ P( X \le a) = F_{X} (a) \] Probabilidade cumulativa de distribuição normal padrão

Figura 11

Por isso \( P( X \le a) \) é dado pela área entre o eixo x, a curva da distribuição normal padrão e \( x = a \)
A integral que define a probabilidade cumulativa da distribuição normal padrão não é fornecida de forma fechada e, portanto, pode ser feita usando uma calculadora de probabilidade normal ou tabelas e pode ser baixado para uso pessoal. como nas planilhas do Google mostradas abaixo.


A probabilidade cumulativa também pode ser calculada usando planilhas do Google e a função "=NORM.S.DIST(a)" conforme mostrado abaixo.
Probabilidade cumulativa de distribuição normal padrão no Planilhas Google

Figura 12


DA DISTRIBUIÇÃO NORMAL À DISTRIBUIÇÃO NORMAL PADRÃO

A distribuição normal da média \( \mu \) e desvio padrão \( \sigma \) é dada por \[ \displaystyle f_{X}(x) = \dfrac{1}{\sigma\sqrt{2\pi \:}}\:e^{-\dfrac{1}{2}\left(\dfrac{x-\mu}{\sigma}\right)^2} \] A probabilidade \( P( X \le a) \) é dada pela área entre o eixo x, a curva da distribuição normal e \( x = a \) e é dada por \[ \displaystyle P( X \le a) = F_{X} (a) = \dfrac{1}{\sigma \sqrt{2\pi \:}}\:\int_{-\infty}^{a} \; e^{- \dfrac{1}{2} \left(\dfrac{t - \mu}{\sigma}\right)^2} \; dt \] Vamos usar a substituição na integral \( z = \dfrac{t - \mu}{\sigma} \) que dá \( \dfrac{dz}{dt} = \dfrac{1}{\sigma} \) e substitui na integral acima \[ \displaystyle P( X \le a) = F_{X} (a) = \dfrac{1}{\sqrt{2\pi \:}}\:\int_{-\infty}^{\dfrac{a - \mu}{\sigma}} \; e^{- \dfrac{1}{2} z^2} \; dz \] Agora estamos lidando com a integral da distribuição normal padrão e do z-score dados por. \[ z = \dfrac{a - \mu}{\sigma} \]
O resultado acima nos diz que você só precisa saber a integral da distribuição normal padrão para calcular qualquer probabilidade relacionada a qualquer distribuição normal e isso é usando o escore z definido acima.
A integral \[ \dfrac{1}{\sqrt{2\pi \:}}\:\int_{-\infty}^{z_0} \; e^{- \dfrac{1}{2} z^2} \; dz \] pode ser calculado usando planilhas do Google que podem ser baixadas para uso pessoal. e também é dado na forma de A Tabela de Distribuição Normal em pdf pode ser baixada e utilizada.


Exemplos de probabilidades relacionadas a distribuições normais

Exemplo 1
Uma variável aleatória \( X \) é normalmente distribuída com uma média \( \mu = 2,2 \) e um desvio padrão \( \sigma = 2,5 \). Encontre a probabilidade
a) \( \qquad P( X \le 1.2) \)
Solução para o Exemplo 1

Neste exemplo temos \( \mu = 2,2 \) e \( \sigma = 2,5 \), portanto o z-score definido acima é dado por \[ z = \dfrac{1.2 - 2.2}{2.5} \approx -0.4 \] Diferentes maneiras de calcular a integral
a) Usando uma calculadora, a probabilidade é dada por \[ P( X \le 1.2) = \dfrac{1}{\sqrt{2\pi \:}}\:\int_{-\infty}^{-0.4} \; e^{- \dfrac{1}{2} z^2} \; dz \approx 0.34457 \] b) Use uma tabela de valores da probabilidade de uma distribuição normal padrão que pode ser
baixado para uso pessoal.
Table of Standard Normal Distribution

Figura 13

NOTA a Tabela de Distribuição Normal em pdf pode ser baixada e utilizada.

Exemplo 2
Uma variável aleatória \( X \) é normalmente distribuída com uma média \( \mu = -2,5 \) e um desvio padrão \( \sigma = 2 \). Encontre as seguintes probabilidades
a) \( \qquad P( 0.5 \le X \le 3.1) \)
b) \( \qquad P( X \ge 0.8) \)
Solução do Exemplo 2
a)
\( P( 0,5 \le X \le 3.1) \) é a área entre o eixo x, a curva da média de distribuição normal \( \mu = -2,5 \) e um desvio padrão \( \sigma = 2 \) e \( x = 0,5 \) e \( x = 3,1 \)
Por isso
\( P( 0.5 \le X \le 3.1) = P( X \le 3.1) - P( X \le 0.5) \)

Deixar \( z_1 = \dfrac{0.5 - (-2.5)}{2} = 1.5 \) and \( z_2 = \dfrac{3.1 - (-2.5)}{2} = 2.8 \)

Escrevemos as probabilidades usando o z-score e usamos a tabela Tabela de Distribuição Normal para obter:
\( P( X \le 3.1) = P( Z_1 \le 2.8) = 0.9974448697 \)
\( P( X \le 0.5) = P( Z_2 \le 1.5) = 0.9331927987 \)
\( P( 0.5 \le X \le 3.1) = 0.9974448697 - 0.9331927987 = 0.064252071 \)

NOTA que você também pode usar a calculadora de probabilidade normal para verificar a resposta.
b)
\( P( X \ge 0.8) = 1 - P( X \le 0.8) \)
Deixar \( z_3 = \dfrac{0.8 - (-2.5)}{2} = 1.65 \)

Escrevemos as probabilidades usando o z-score e usamos a tabela Tabela de Distribuição Normal para obter:
\( P( X \le 0.8) = P( Z_3 \le 1.65) = 0.950528532 \)
\( P( X \ge 0.8) = 1 - 0.950528532 = 0.049471468 \)

NOTA que você também pode usar a calculadora de probabilidade normal para verificar a resposta.
Mais problemas de distribuição normal com soluções estão incluídos neste site.


Mais referências e links

  1. Densidade de probabilidade para variável contínua
  2. Introdução às probabilidades
  3. Distribuição de frequência e histograma usando o Planilhas Google
  4. Calculadora de probabilidade normal
  5. Histogramas para dados agrupados
  6. Integrais
  7. Calculadora de probabilidade normal inversa.
  8. Problemas de distribuição normal com soluções
  9. Tutoriais e problemas elementares de estatística e probabilidade
  10. Calculadoras, solucionadores e gráficos estatísticos
  11. Tabela de distribuição normal