CAPÍTULO 7
Hipótese e Inferência
É característica de uma pessoa realmente inteligente ser movida pela estatística.
—George
Bernard Shaw
O que faremos com todas essas teorias de estatística e probabilidade? A parte
ciência de data science frequentemente
envolve formar e testar hipóteses sobre
nossos dados e os processos que os geram.
Teste Estatístico de Hipótese
Com frequência, como cientistas de dados,
vamos querer testar se uma
determinada hipótese é verdadeira. Para os nossos propósitos, as hipóteses são
afirmações como “esta é uma moeda honesta” ou “os cientistas de dados
preferem Python a R” ou “seria mais provável que as pessoas saíssem da página
sem ler o conteúdo se nós mostrássemos um anúncio pop-up com um botão de
fechar pequeno e difícil de encontrar” que possam ser traduzidas em estatísticas
sobre dados.
Sob diversas premissas, tais estatísticas podem ser vistas como
observações de variáveis aleatórias a partir de distribuições
conhecidas, o que
permite que façamos declarações sobre as premissas mais prováveis de serem
corretas.
Em uma configuração clássica,
temos a hipótese nula H
0
que representa uma
posição padrão, e alguma hipótese
H
1
com a qual gostaríamos de compará-la.
Usamos a estatística
para decidir se rejeitamos H
0
como falso ou não.
Provavelmente, fará mais sentido por meio de um exemplo.