Data Science do zero: Primeiras regras com o Python


Dependência e Independência



Baixar 5.26 Mb.
Pdf preview
Página49/75
Encontro24.07.2022
Tamanho5.26 Mb.
#24344
1   ...   45   46   47   48   49   50   51   52   ...   75
Data Science do zero - Primeiras regras
Dependência e Independência
A grosso modo, dizemos que dois eventos E e F são dependentes se soubermos
algo sobre se E ocorre nos der informações sobre se F ocorre (e vice-versa). Do
contrário, são independentes.
Por exemplo, se jogarmos uma moeda honesta duas vezes, sabendo que a
primeira jogada é coroa, não temos como saber se a segunda jogada vai dar o
mesmo resultado. Esses eventos são independentes. Por outro lado, se
soubéssemos que a primeira jogada fosse coroa, certamente teríamos a
informação sobre se ambas as jogadas seriam cara. (Se a primeira jogada é
coroa, então, definitivamente, não é o caso de que as duas jogadas são cara.)
Esses dois eventos são dependentes.
Matematicamente, dizemos que os dois eventos E e F são independentes se a
probabilidade deles acontecerem é o produto da probabilidade de que cada um
deles aconteça:
P(E,F) =P(E)P(F)
No exemplo anterior, a probabilidade da “primeira jogada ser coroa” é de 1/2, e a
probabilidade de “ambas serem cara” é de 1/4, mas a probabilidade de “a
primeira jogada ser coroa e ambas serem cara” é 0.


1.
2.
Probabilidade Condicional
Quando os dois eventos E e F são independentes, por definição, temos:
P(E,F) =P(E)P(F)
Se não são necessariamente independentes (e a probabilidade de F não for 0),
logo definimos a probabilidade de E “condicionada a F” assim:
P(E|F) =P(E,F)/(P(F)
Você deveria entender isso como a probabilidade de E acontecer uma vez que
sabemos que F acontece.
Geralmente reescrevemos desta forma:
P(E,F) =P(E|F)P(F)
Quando E e F são independentes, você pode verificar que isso resulta em:
P(E|F) =P(E)
que é a maneira matemática de explicar que saber que F ocorreu não nos dá
nenhuma informação adicional sobre se E ocorreu.
Um exemplo comum e traiçoeiro envolve uma família com dois filhos
(desconhecidos).
Se presumirmos que:
É igualmente possível que cada criança seja menino ou menina
O gênero da segunda criança é independente do gênero da primeira, então
o evento “nenhuma menina” tem a probabilidade de 1/4, o evento “uma
menina, um menino” tem a probabilidade de 1/2 e o evento “duas
meninas” tem a probabilidade de 1/4.
Agora, podemos perguntar: qual a probabilidade de o evento “as duas crianças
são meninas” (B) ser condicionado pelo evento “a criança mais velha é uma
menina” (G)? Usando a definição de probabilidade condicional:


P (B | G) =P (B, G) /P (G) =P (B) /P (G) = 1/2
uma vez que o evento B e G (“ambas as crianças são meninas e a criança mais
velha é uma menina”) é apenas o evento B. (Já sabendo que as duas crianças são
meninas, é obrigatoriamente verdade que a criança mais velha seja menina.)
Esse resultado talvez corresponda a sua intuição.
Também poderíamos perguntar sobre a probabilidade do evento “as duas
crianças são meninas” ser condicional ao evento “ao menos uma das crianças é
menina” (L). Surpreendentemente, a resposta é diferente de antes!
Anteriormente, os eventos B e L (“as duas crianças são meninas e ao menos uma
delas é uma menina”) é apenas o evento B. Isso significa que temos:
P (B | L) =P (B, L) /P (L) = P (B) /P (L) = 1/3
Como pode ser esse o caso? Bem, se tudo que você sabe é que ao menos uma
das crianças é menina, então é duas vezes mais provável que a família tenha um
menino e uma menina do que duas meninas.
Podemos verificar isso ao “gerar” várias famílias:

Baixar 5.26 Mb.

Compartilhe com seus amigos:
1   ...   45   46   47   48   49   50   51   52   ...   75




©historiapt.info 2022
enviar mensagem

    Página principal