Data Science do zero: Primeiras regras com o Python


Para Mais Esclarecimentos



Baixar 5.26 Mb.
Pdf preview
Página37/75
Encontro24.07.2022
Tamanho5.26 Mb.
#24344
1   ...   33   34   35   36   37   38   39   40   ...   75
Data Science do zero - Primeiras regras
Para Mais Esclarecimentos
seaborn (http://stanford.io/1ycOjdI) é construído no topo de
matplotlib
e
permite que você produza facilmente visualizações mais bonitas (e mais
complexas).
D3.js (http://d3js.org) é uma biblioteca JavaScript que produz
visualizações interativas sofisticadas para a web. Embora não esteja em
Python, é uma tendência e amplamente usada, e vale a pena se familiarizar
com ela.
Bokeh (http://bokeh.pydata.org) é a biblioteca mais nova que traz o estilo
de visualização D3 para Python.
ggplot (http://bit.ly/1ycOk1u) é uma portagem Python da popular
biblioteca
ggplot2
, que é amplamente usada para criar gráficos e diagramas
de “qualidade de publicação”. Provavelmente, é mais interessante se você
já é um usuário voraz de
ggplot2
e um pouco opaco se não é.


CAPÍTULO 4
Álgebra Linear
Existe algo mais inútil ou menos útil que Álgebra?
—Billy Connolly
A Álgebra Linear é o ramo da matemática que lida com espaços vetoriais.
Apesar de eu não achar que vou conseguir ensinar álgebra linear em um capítulo,
ela sustenta um grande número de conceitos e técnicas de data science, o que
significa que eu devo a você, ao menos, uma tentativa. O que aprenderemos
neste capítulo, usaremos excessivamente no decorrer do livro.


Vetores
Abstratamente, os vetores são objetos que podem ser somados juntos (para
formar vetores novos) e que podem ser multiplicados pelos escalares (por
exemplo, números), também para formar vetores novos.
Concretamente (para nós), os vetores são pontos em algum espaço de dimensão
finita. Apesar de você não pensar em seus dados como vetores, eles são uma
ótima maneira de representar dados numéricos.
Por exemplo, se você tiver as alturas, pesos e idades de uma grande quantidade
de pessoas, pode tratar seus dados como vetores tridimensionais (
height
,
weight
,
age
). Se você estiver ensinando uma turma com quatro testes, pode tratar as notas
dos alunos como vetores quadridimensionais (
exam1
,
exam2
,
exam3
,
exam4
).
A abordagem inicial mais simples é representar vetores como listas de números.
Uma lista de três números corresponde a um vetor em um espaço tridimensional,
e vice-versa:
height_weight_age = [70, # polegadas,
170, # quilos,
40 ] # anos
grades = [95, # teste1
80, # teste2
75, # teste3
62 ] # teste4
Um problema com essa abordagem é que queremos realizar aritmética nos
vetores. Como as listas de Python não são vetores (e, portanto, não facilita a
aritmética com o vetor), precisaremos construir essas ferramentas aritméticas nós
mesmos. Então, vamos começar por aí.
Para começar, frequentemente precisaremos de dois vetores. Os vetores se
adicionam componente a componente. Isso significa que, se dois vetores
v
e
w
possuem o mesmo tamanho, sua soma é somente o vetor cujo primeiro elemento
seja
v[0] + w[0]
, cujo segundo elemento seja
v[1] + w[1]
, e assim por diante. (Se eles
não possuírem o mesmo tamanho, então não poderemos somá-los.)
Por exemplo, somar os vetores
[1, 2]
e
[2, 1]
resulta em
[1 + 2, 2 + 1]
ou
[3, 3]
, como


mostra a Figura 4-1.
Figura 4-1. Somando dois vetores
Podemos facilmente implementar isso com vetores
zip
juntos e usar uma
compreensão de lista para adicionar os elementos correspondentes:

Baixar 5.26 Mb.

Compartilhe com seus amigos:
1   ...   33   34   35   36   37   38   39   40   ...   75




©historiapt.info 2023
enviar mensagem

    Página principal