Data Science do zero: Primeiras regras com o Python



Baixar 5.26 Mb.
Pdf preview
Página75/75
Encontro24.07.2022
Tamanho5.26 Mb.
#24344
1   ...   67   68   69   70   71   72   73   74   75
Data Science do zero - Primeiras regras
for row in results:
f.write(",".join(map(str, row))) # talvez tenha muitas vírgulas nele!
f.write("\n") # a linha pode ter newlines também!
Você acabará com um arquivo
csv
que se parece com:
test1,success,Monday
test2,success, kind of,Tuesday
test3,failure, kind of,Wednesday
test4,failure, utter,Thursday
e ninguém mais conseguirá entender.


Extraindo Dados da Internet
Outra maneira de se obter dados é extraindo-os das webpages. Pesquisar páginas
da web é muito fácil; extrair informações estruturadas e significativas não é tão
fácil.
HTML e Sua Subsequente Pesquisa
As páginas na internet são escritas em HTML, na qual o texto (idealmente) é
marcado em elementos e atributos:


</b>A <a href="/professor-prof-ms-claudio-benossi.html">web page</a><b>



id="author">Joel Grus


id="subject">Data Science


Baixar 5.26 Mb.

Compartilhe com seus amigos:
1   ...   67   68   69   70   71   72   73   74   75




©historiapt.info 2023
enviar mensagem

    Página principal