if count > 1:
print word, count
o que fornece o resultado esperado (a menos que você espere que “scikit-learn”
possa
ser dividido em duas palavras, o que não fornecerá o resultado esperado):
learning 3
java 3
python 3
big 3
data 3
hbase 2
regression 2
cassandra 2
statistics 2
probability 2
hadoop 2
networks 2
machine 2
neural 2
scikit-learn 2
r 2
Veremos formas mais aprimoradas de extrair tópicos dos dados no Capítulo 20.
Em Diante
Foi um primeiro dia bem proveitoso! Exausto, você sai do prédio antes que
alguém peça algo mais.
Tenha uma boa noite de sono, porque amanhã será dia de
treinamento para novos funcionários. Sim, você
trabalhou um dia inteiro antes
do treinamento. Culpa do RH.
CAPÍTULO 2
Curso Relâmpago de Python
As pessoas ainda são loucas pelo Python mesmo depois de vinte e cinco anos,
o que é difícil de acreditar.
—Michael Palin
Todos os funcionários novos na DataSciencester são
obrigados a passar pelo
treinamento dos funcionários novos, a parte mais interessante é que contém um
curso intensivo de Python.
Mas não é um tutorial compreensível sobre Python, é
direcionado a destacar as
partes da linguagem que serão mais importantes para nós (algumas delas, em
geral, não são o foco dos tutoriais Python).