Densidade de probabilidade para variável contínua

\( \) \( \) \( \) \( \)

A definição da função de densidade de probabilidade é apresentada a partir de um histograma e, em seguida, um histograma de probabilidade . Exemplos com soluções relacionadas à densidade de probabilidade também estão incluídos.

Histogramas

Usamos 2.560 valores de dados gerados com planilhas do Google para apresentar a ideia de passar do histograma de frequências para um histograma de arquivo de dados (1) da planilha Google, incluindo os dados usados aqui, pode ser baixado e usado para fazer os mesmos histogramas usados nesta página.
O tempo aqui é considerado uma variável aleatória contínua.
O histograma obtido usando o Google Sheets é mostrado abaixo. As classes no eixo horizontal possuem largura igual a 1 e as frequências estão no eixo vertical.
A soma de todas as frequências é igual ao número total de valores de dados que é igual a 2560.

HistogramFigura 1

Dos histogramas à distribuição de probabilidade

Largura da classe igual a 1

Modificamos o histograma acima em um histograma de probabilidade, dividindo cada frequência pelo número total de valores de dados que é 2.560.
O histograma de probabilidade abaixo nos diz que se um valor de dados for escolhido aleatoriamente de um determinado conjunto de dados, por exemplo, a probabilidade de esse valor de dados ser maior que 3 e menor que 4 é igual a 0,378 (arredondado para 3 casas decimais), que é a altura do retângulo cuja largura se estende de x = 3 a x = 4.
A largura de cada retângulo faz com que o histograma de probabilidade seja igual a 1 e portanto a área de cada retângulo é igual à altura multiplicada pela largura que é igual a 1 e é a probabilidade. Portanto, o histograma de probabilidade associa probabilidade e área.
Observe que a soma de todas as probabilidades no histograma abaixo é igual a 1 e, portanto, a área total de todos os retângulos é igual a 1.

Probabilidade Histograma da largura da classe igual a 1Figura 2

Largura da classe igual a 0,5

Como nossos dados são contínuos, podemos usar larguras mais estreitas para as classes.
Agora criamos outro histograma com largura de classe igual a 0,5. Novamente, as alturas fornecem as probabilidades e a soma de todas as probabilidades é igual à área de todos os retângulos e é igual a 1.
Usamos novamente as planilhas do Google para adicionar uma "linha de tendência" (mostrada em vermelho) revelando a tendência geral dos dados com base na altura dos retângulos no histograma de probabilidade. Notamos que a área entre o eixo x e a curva desta função (linha de tendência) está mais próxima da área total sob os retângulos.

Histograma da largura da classe igual a 0,5Figura 3


Largura da classe igual a 0,1

A largura da classe agora é igual a 0,1 e a linha de tendência está ainda mais próxima e a área entre o eixo x e a curva desta função está ainda mais próxima da área sob os retângulos.
Histograma da largura da classe igual a 0,1Figura 4



Probability Density Function (PDF)

Função de densidade de probabilidade (PDF)

Fica claro a partir dos histogramas de probabilidade acima e da linha de tendência, que se tivermos um grande número de valores de dados, que é o caso de uma variável aleatória contínua, à medida que a largura da classe se torna menor, a linha de tendência é uma função que pode ser usada para calcular probabilidades usando a área entre o eixo x e a curva desta função.
Esta função de linha de tendência é chamada de função de densidade de probabilidade.
Se a função \( f_{X}(x) \) é a função de densidade de probabilidade de uma variável aleatória \( X \), então a probabilidade de que \( X \) seja maior ou igual a \( a \) e menor maior ou igual a \( b \) escrito como \( P( a \le X \le b) \)é dado pela área entre o eixo x, a curva e as linhas verticais \( x = a \) e \(x=b\). \[ \displaystyle P(a \le X \le b) = \text{Área entre a curva, o eixo x e x = a até x = b} \]

Função de densidade de probabilidade Figura 5


Propriedades da função densidade de probabilidade

As funções de densidade de probabilidade (PDF) \( f_{X}(x) \) de uma variável aleatória contínua \( X \) tem as seguintes propriedades:
1 - \( f_{X}(x) \ge 0 \)
2 - \( \displaystyle P(-\infty \lt X \lt -\infty) = 1 \), a área total entre a curva de \( f_{X}(x) \) e o eixo x é igual a 1.
Usando integrais em cálculo, podemos escrever
\[ \displaystyle P(a \le X \le b) = \int_a^b f_{X}(x) \; dx\] que é a área entre a curva do PDF, o eixo x e \( x = a \) a \( x = b \).
\[ \displaystyle \int_{-\infty}^{\infty} f_{X}(x) \; dx = 1\] que é a área total entre o eixo x e a curva do PDF



Exemplos de funções de densidade de probabilidade

Função de densidade de probabilidade uniforme

Exemplo 1
Uma variável aleatória \( X \) tem funções de densidade de probabilidade uniforme \( f_{X}(x) \) dadas por
\[ \begin{equation} f_{X}(x) = \left\{ \begin{array}{l l} \dfrac{k}{b-a} & \quad a \le x \le b\\ 0 & \quad x \lt a \text{ or } x \gt b \end{array} \right. \end{equation}\]
onde \( k \) é uma constante positiva.
a - Trace o gráfico de \( f_{X}(x) \).
b - Use o gráfico acima e as propriedades das funções de densidade de probabilidade para encontrar \(k\).
c - Use integrais em cálculo para mostrar que a área total entre o eixo x e a curva é igual a \( 1 \).
d - Sejam \( a = 3 \) e \( b = 8 \), encontre a probabilidade \( P( 4 \le X \le 7) \).

Solução
a-
O gráfico da função de densidade de probabilidade \( f_{X}(x) \) é mostrado abaixo.

Gráfico de uma probabilidade uniforme Função Densidade Figura 6

b-
A propriedade da função de densidade de probabilidade que \( f_{X}(x) \ge 0 \) é satisfeita.
A segunda propriedade da função de densidade de probabilidade é satisfeita se a área total entre a curva de \( f_{X}(x) \) e o eixo x deve ser igual a \( 1 \).
A área \( A \) entre o eixo x e a curva de \( f_{X}(x) \) é igual à área do retângulo de comprimento \( b - a \) e largura \( \dfrac {k}{b-a} \). Por isso
\( \qquad A = (b-a)\left( \dfrac{k}{b-a} \right) \)
Simplificar
\( \qquad A = k \)
A área \( A \) deve ser igual a 1. portanto
\( \qquad k = 1 \)
e
\[ \begin{equation} f_{X}(x) = \left\{ \begin{array}{l l} \dfrac{1}{b-a} & \quad a \le x \le b\\ 0 & \quad x \lt a \text{ or } x \gt b \end{array} \right. \end{equation}\]
c-
A área total \( A \) entre o eixo x e a curva de \( f_{X}(x) \) pode ser calculada usando integrais em cálculo e é dada por
\( \qquad A = \displaystyle \int_{-\infty}^{\infty} f_{X}(x) \; dx \)

Reescreva \( A \) como segue
\( \displaystyle \qquad A = \int_{-\infty}^{a} f_{X}(x) \; dx + \int_{a}^{b} f_{X}(x) \; dx + \int_{b}^{\infty} f_{X}(x) \; dx \)

Observe que \( f_{X}(x) = 0 \) nos inetrvais \( (-\infty , a) \) e \( (b , \infty ) \); portanto, o acima simplifica para
\( \displaystyle \qquad A = \int_{a}^{b} f_{X}(x) \; dx \)

Substitua \( f_{X}(x) \) por \( \dfrac{1}{b-a} \)

\( \displaystyle \qquad A = \int_{a}^{b} \dfrac{1}{b-a} \; dx \)

Avalie a integral
\( \displaystyle \qquad A = \left[ \dfrac{1}{b-a} x \right]_a^b \)

\( \displaystyle \qquad A = \dfrac{1}{b-a} b - \dfrac{1}{b-a} a \)

Simplificar
\( \displaystyle \qquad A = \dfrac{1}{b-a} (b-a) = 1 \)
d-
Use integrais para escrever,
\( \displaystyle P( 4 \le X \le 7) = \int_4^7 \left( \dfrac{1}{b-a} \right) \; dx \)

Substitua \( a = 3 \) e \( b = 8 \) no integrando e escreva
\( \displaystyle P( 4 \le X \le 7) = \int_4^7 \left( \dfrac{1}{5} \right) \; dx \)

Avalie a integral
\( \displaystyle P( 4 \le X \le 7) = \left[ \dfrac{1}{5} x \right]_4^7 \)

\( \displaystyle P( 4 \le X \le 7) = \dfrac{7}{5} - \dfrac{4}{5} = \dfrac{3}{5} = 0,6 \)



Exemplo 2
Uma variável aleatória \( X \) tem funções de densidade de probabilidade uniforme \( f_{X}(x) \) dadas por
\[ \begin{equation} f_{X}(x) = \left\{ \begin{array}{l l} e^{-k x} & \quad x \ge 0\\ 0 & \quad x \lt 0 \end{array} \right. \end{equation}\]
onde \( k \) é uma constante positiva.
a - Encontre \( k \).
b - Encontre \( a \) para que \( P( 0 \le X \le a) = 0,9\) .

Solução
a-
A propriedade da função de densidade de probabilidade que \( f_{X}(x) \ge 0 \) é satisfeita.
Para que a segunda propriedade da função de densidade de probabilidade seja satisfeita, a área total entre a curva de \( f_{X}(x) \) e o eixo x deve ser igual a \( 1 \).
A área \( A \) entre o eixo x e a curva de \( f_{X}(x) \) é dada pela integral
\(\displaystyle \qquad A = \int_{-\infty}^{\infty} f_{X}(x) \; dx \)
Reescreva o acima como
\( \displaystyle\qquad A = \int_{-\infty}^{0} f_{X}(x) \; dx + \int_{0}^{\infty} f_{X}(x) \; dx \)

\( f_{X}(x) = 0 \) no intervalo \( (-\infty , 0 ) \), portanto, o acima simplifica para
\(\displaystyle \qquad A = \int_{0}^{\infty} f_{X}(x) \; dx \)

A integral acima é imprópria e pode ser escrita como
\( \displaystyle \qquad A = \lim_{\; b\to\infty} \int_{0}^{b} f_{X}(x) \; dx \)

Substitua \( f_{X}(x) \) por \( e^{-k x} \) e avalie a integral
\( \displaystyle \qquad A = \lim_{\; b\to\infty} \int_{0}^{b} e^{-k x} \; dx \)

\( \displaystyle \qquad A = \lim_{\; b\to\infty} \left[ -\frac{1}{k}e^{-kx} \right]_0^b \)

\( \displaystyle \qquad A = \lim_{\; b\to\infty} \left[ -\frac{1}{k}e^{-k b} + \frac{1}{k} e^{0} \right] \)

Simplificar
\( \displaystyle \qquad A = - \lim_{\; b\to\infty} \frac{1}{k}e^{-k b} + \frac{1}{k} \)

Como \( k \) é positivo, \( \displaystyle \lim_{\; b\to\infty} \frac{1}{k}e^{-k b} = 0 \) e, portanto,
\( \displaystyle \qquad A = \dfrac{1}{k} \)

A área total \( A = 1 \), daí a equação
\( \qquad \dfrac{1}{k} = 1 \)

Resolva para \( k \) para obter
\( \qquad k = 1 \)

b-
\( \displaystyle \qquad P( 0 \le X \le a) = \int_0^a f_{X}(x) \; dx \)

Como \( k = 1 \), \( f_{X} (x) = e^{- x} \) para \( x \ge 0 \), portanto
\( \displaystyle \qquad P( 0 \le X \le a) = \int_0^a e^{-x} \; dx \)

Avalie a integral acima.

\( \displaystyle \qquad P( 0 \le X \le a) = \left[-e^{-x} \right]_0^a = -e^{-a} + 1 \)

Como \( P( 0 \le X \le a) = 0,9 \) ; escrevemos a equação
\( \qquad -e^{-a} + 1 = 0,9 \)

Resolva para \(uma\)
\( \qquad e^{-a} = 0,1 \)
\( \qquad a = - \ln 0,1 \approx 2,3 \)


Mais referências e links

  1. Introdução às probabilidades
  2. Distribuição de frequência e histograma usando o Planilhas Google
  3. Histogramas para dados agrupados
  4. Integrais