Data Science do zero: Primeiras regras com o Python


Motivação Hipotética: DataSciencester



Baixar 5.26 Mb.
Pdf preview
Página10/75
Encontro24.07.2022
Tamanho5.26 Mb.
#24344
1   ...   6   7   8   9   10   11   12   13   ...   75
Data Science do zero - Primeiras regras
Motivação Hipotética: DataSciencester
Parabéns! Você acabou de ser contratado para liderar os esforços de data science
na DataSciencester, a rede social para cientistas de dados.
Apesar de ser para os cientistas de dados, a DataSciencester nunca investiu em
construir sua própria atividade de data science (na verdade, a DataSciencester
nunca investiu em construir seu próprio produto). Esse será seu trabalho! No
decorrer do livro, aprenderemos sobre os conceitos de data science ao resolver
problemas com os quais você se depara no trabalho. Algumas vezes, olharemos
para os dados explicitamente fornecidos pelo usuário, outras vezes olharemos
para os gerados por suas interações com um site e, às vezes, olharemos para os
dados dos experimentos que projetaremos.
E, devido à DataSciencester possuir uma forte mentalidade de “não-foi-
inventado-aqui”, nós construiremos nossas próprias ferramentas do zero. No
final, você terá um sólido entendimento dos fundamentos de data science. Você
estará pronto para aplicar suas habilidades em sua empresa com uma premissa
menos duvidosa, ou em qualquer outro problema que vier a despertar seu
interesse.
Bem-vindo a bordo e boa sorte! ‘Você pode usar jeans às sextas e o toalete é no
final do corredor à direita.’
Encontrando Conectores-Chave
É seu primeiro dia de trabalho na DataSciencester e o vice-presidente de Rede
(networking) está cheio de perguntas sobre seus usuários. Até agora, ele não teve
ninguém para perguntar, então ele está muito empolgado em ter você aqui.
Particularmente, ele quer que você identifique quem são os “conectores-chave”
entre os cientistas de dados. Para isso, ele lhe dá uma parte de toda a rede da
DataSciencester. Na vida real, você geralmente não recebe os dados de que
precisa. O Capítulo 9 é voltado para a obtenção de dados.
Com o que se parece essa parte dos dados? Ela consiste em uma lista de
usuários, cada um representado por um
dict
que contém um
id
(um número) para


cada usuário ou usuária e um
name
(que por uma das grandes coincidências
cósmicas que rima com o
id
do usuário):
users = [
{ "id": 0, "name": "Hero" },
{ "id": 1, "name": "Dunn" },
{ "id": 2, "name": "Sue" },
{ "id": 3, "name": "Chi" },
{ "id": 4, "name": "Thor" },
{ "id": 5, "name": "Clive" },
{ "id": 6, "name": "Hicks" },
{ "id": 7, "name": "Devin" },
{ "id": 8, "name": "Kate" },
{ "id": 9, "name": "Klein" }
]
Ele também fornece dados “amigáveis”, representados por uma lista de pares de
IDs:
friendships = [(0, 1), (0, 2), (1, 2), (1, 3), (2, 3), (3, 4),
(4, 5), (5, 6), (5, 7), (6, 8), (7, 8), (8, 9)]
Por exemplo, a tupla
(0,1)
indica que o cientista de dados com a
id
0 (Hero) e o
cientista de dados com a
id
1 (Dunn) são amigos. A rede é ilustrada na Figura 1-
1.
Figura 1-1. A rede da DataSciencester
Já que representamos nossos usuários como
dict
s, é fácil de aumentá-los com
dados extras.
Não fique preso aos detalhes do código agora. No Capítulo 2, vamos levá-lo a um
curso intensivo de Python. Por enquanto, tente pegar o sentido geral do que estamos


fazendo.
Por exemplo, talvez nós queiramos adicionar uma lista de amigos para cada
usuário. Primeiro nós configuramos a propriedade
friends
de cada usuário em uma
lista vazia:

Baixar 5.26 Mb.

Compartilhe com seus amigos:
1   ...   6   7   8   9   10   11   12   13   ...   75




©historiapt.info 2022
enviar mensagem

    Página principal