Data Science do zero: Primeiras regras com o Python



Baixar 5.26 Mb.
Pdf preview
Página9/75
Encontro24.07.2022
Tamanho5.26 Mb.
#24344
1   ...   5   6   7   8   9   10   11   12   ...   75
Data Science do zero - Primeiras regras
CAPÍTULO 1
Introdução
Dados! Dados! Dados!” ele gritou impacientemente. “Não posso fabricar tijolos sem barro.”
—Arthur Conan Doyle


A Ascensão dos Dados
Vivemos em um mundo que está soterrado por dados. Os websites rastreiam
todos os cliques de todos os usuários. Seu smartphone está fazendo um registro
da sua localização e sua velocidade a cada segundo diariamente. Atletas
avaliados usam pedômetros com esteroides que estão sempre registrando suas
batidas do coração, hábitos de movimentos, dieta e padrões do sono. Carros
inteligentes coletam hábitos de direção, casas inteligentes coletam hábitos de
moradia e marqueteiros inteligentes coletam hábitos de compra. A própria
internet representa um diagrama grande de conhecimento que contém (entre
outras coisas) uma enorme enciclopédia de referências cruzadas: bases de dados
específicos de domínio sobre filmes, música, resultados de esportes, máquinas
de pinball, memes e coquetéis; e muitas estatísticas do governo (algumas delas
são verdades!) sobre tantos governos que causariam um nó na sua cabeça.
Soterrados sob esses dados estão as respostas para as inúmeras questões que
ninguém nunca pensou em perguntar. Neste livro, aprenderemos como encontrá-
las.


O Que É Data Science?
Há uma piada que diz que um cientista de dados é alguém que sabe mais sobre
estatística do que um cientista da computação e mais sobre ciência da
computação do que um estatístico (eu não disse que a piada era boa). Na
verdade, alguns cientistas de dados são — para todos os propósitos práticos —
estatísticos, enquanto outros são quase indistinguíveis dos engenheiros de
software. Alguns são experts em aprendizado de máquina, enquanto outros não
conseguiram aprender muita coisa sobre o assunto. Alguns são PhDs com um
impressionante registro de publicações, enquanto outros nunca leram um
trabalho acadêmico (apesar de ser uma vergonha). Resumindo, basicamente não
importa como você define data science, pois você encontrará praticantes para
quem a definição está total e absolutamente errada.
De qualquer forma, não permitiremos que isso nos impeça de tentar. Digamos
que um cientista de dados seja alguém que extrai conhecimento de dados
desorganizados. O mundo de hoje está cheio de pessoas tentando transformar
dados em conhecimento.
Por exemplo, o site de namoro OkCupid pede que seus membros respondam
milhares de perguntas a fim de encontrar as combinações mais adequadas para
eles. Mas também analisa tais resultados para descobrir perguntas aparentemente
inócuas as quais você poderia perguntar para alguém e descobrir qual a
possibilidade de essa pessoa dormir com você no primeiro encontro
(http://bit.ly/1EQU0hI).
O Facebook pede que você adicione sua cidade natal e sua localização atual,
supostamente para facilitar que seus amigos o encontrem e se conectem com
você. Porém, ele também analisa essas localizações para identificar padrões de
migração global (http://on.fb.me/1EQTq3A) e onde vivem os fã-clubes dos times
de futebol (http://on.fb.me/1EQTvnO).
Como uma grande empresa, a Target rastreia suas encomendas e interações,
tanto online como na loja física. Ela usa os dados em um modelo preditivo
(http://nyti.ms/1EQTznL) para saber quais clientes estão grávidas a fim de
melhorar sua oferta de artigos relacionados a bebês.


Em 2012, a campanha do Obama empregou muitos cientistas de dados que
mineraram os dados e experimentaram uma forma de identificar os eleitores que
precisavam de uma atenção extra, otimizar programas e recursos para a captação
de fundos de doadores específicos e focando esforços para votos onde
provavelmente eles teriam sido úteis. Normalmente, é de comum acordo pensar
que esses esforços tiveram um papel importante na reeleição do presidente, o
que significa que é seguro apostar que as campanhas políticas do futuro se
tornarão cada vez mais dependentes de dados, resultando em uma corrida
armamentista sem fim de data science e coleta de dados.
Agora, antes que você se sinta muito exausto: alguns cientistas de dados também
usam suas habilidades para o bem, ocasionalmente — usar os dados para tornar
o governo mais eficiente (http://bit.ly/1EQTGiW), ajudar os desabrigados
(http://bit.ly/1EQTIYl), e melhorar a saúde pública (http://bit.ly/1EQTPTv). Mas,
certamente, não afetará sua carreira se você gosta de encontrar a melhor maneira
de fazer o público clicar em seus anúncios.



Baixar 5.26 Mb.

Compartilhe com seus amigos:
1   ...   5   6   7   8   9   10   11   12   ...   75




©historiapt.info 2022
enviar mensagem

    Página principal