Entendendo a visualização de dados



Baixar 125.37 Kb.
Pdf preview
Página1/5
Encontro23.04.2021
Tamanho125.37 Kb.
  1   2   3   4   5


Entendendo  

a visualização  

de dados

Uma perspectiva sobre o processo

pessoas e tecnologia necessários para o 

entendimento e comunicação de dados 

por meio da visualização de dados



2


Introdução

Por que “visualização  

de dados”?

Os dados estão em todos os lugares, e as 

pessoas os reúnem, processam e tentam 

entendê-los desde o começo da nossa 

existência. Afinal, eles nos ajudam a entender 

e a interagir com o mundo. Atualmente, 

muitas empresas estão coletando dados com 

grande velocidade. Seja para fins de 

conformidade, elaboração de relatórios ou 

visualização, a ideia é que essas informações 

podem ser valiosas. Contudo, o real valor 

somente é alcançado após o processamento, 

entendimento e, em última análise, após 

serem tomadas as ações ligadas aos dados. 

Sem essas capacidades, eles não têm sentido. 

Certas características dos dados podem ser 

vistas apenas por uma representação gráfica. 

Assim, o poder da visualização de dados, a arte 

de representá-los visualmente, reside na sua 

capacidade para transformar dados brutos em 

sentido e significado para o entendimento. 

Isso pode dar sentido aos dados e comunicá-

los. Quando executada com sucesso, a 

visualização transforma meros números ou 

palavras em uma história. Para obterem real 

aprendizado com seus dados, as empresas 

precisam adotar a visualização como uma 

nova linguagem comum para a exploração e 

comunicação de dados

1

.



Por que agora?

Diversos avanços na tecnologia tornaram a 

visualização de dados mais aparente do que 

nunca. Quantidades enormes de dados, o que 

é conhecido como "big data”, agora podem ser 

coletadas, armazenadas e acessadas, e esses 

métodos melhoram a cada dia. Existe, de fato, 

um número crescente de fontes de dados 

públicos com dimensões de big data, que 

podem ser utilizados para complementar as 

fontes privadas de dados. Portanto, as 

empresas que optaram por investir em big 

data correm o risco de se perder em uma 

inundação de informações. Nesse caso, a 

visualização torna-se ainda mais valiosa, pois 

permite que as empresas “vejam” e entendam 

os seus dados e comuniquem novos insights.

Muitas empresas já passaram por um avanço 

típico na tecnologia de visualização de dados. 

Primeiro, elas adotavam tabelas e gráficos 

simples feitos à mão, passando depois ao 

Excel, quando este foi lançado. O Excel 

tornou-se a ferramenta preferencial e ainda é 

a mais usada em muitas empresas, devido ao 

seu legado e facilidade relativa de uso. Depois, 

os bancos de dados tornaram-se um modo 

popular para armazenamento e acesso, de 

modo que as empresas investiram em 

plataformas tradicionais de Business 

Intelligence (BI), que alegavam incluir 

integração, infraestrutura, análise e recursos 

de apresentação de dados. Essas capacidades 

de apresentação começaram como relatórios e 

foram seguidas por dashboards, que se 

tornavam cada vez mais interativos. Na era do 

big data, contudo, quando recursos de 

descoberta, análise e visualização de dados 

são ainda mais pertinentes, as ferramentas 

tradicionais de BI já não são suficientes.

No intuito de aumentar o insight sobre 

datasets grandes e complexos, o mercado  

de visualização aumentou significativamente 

nos últimos anos e continua crescendo. 

Ferramentas leves para descoberta de dados 

são umas áreas de BI com crescimento mais 

rápido, e as ferramentas de BI mais 

tradicionais estão reformulando suas ofertas 

para adequarem-se a isso

2

. Além disso, com 



meios como computadores, tablets e celulares 

presentes em todos os lugares, as pessoas 

agora podem interagir com seus dados 

imediatamente, como nunca antes. Com 

rápidos aprimoramentos nas ferramentas 

atuais e novas ferramentas sendo lançadas 

todos os dias, é difícil reconhecer quais são as 

mais adequadas e eficazes para usos e 

necessidades específicas. Essa questão será 

discutida na seção de Tecnologia deste 

documento.

Recursos de visualização de dados 

proporcionam mais facilidade de interação e 

entendimento dos dados, o que se torna cada 

vez mais importante na era do big data. Tendo 

em vista esse cenário e o crescente mercado 

de visualização de dados, as empresas têm 

grande facilidade para começar sem uma base 

sólida. Mas para que a visualização de dados 

seja adotada com sucesso como a linguagem 

comum para a exploração e comunicação de 

dados, precisamos, primeiro, investir em 

processos, pessoas e tecnologia.

1) Adam Bly, “Gaining Understanding from Data Visualization,” World Economic Forum, 2011. http://www. weforum.org/content/gaining- understanding-data-visualization-0

2) Dan Sommer, Rita L. Sallam, James Richardson, “Emerging Technology Analysis: Visualization-Based Data Discovery Tools,” Gartner, June 17, 2011.

3



Visão geral

Definição

A visualização de dados é a representação 

visual dos dados destinados a permitir que as 

pessoas entendam e comuniquem informações 

por meios gráficos

3

. Os infográficos são um 



subconjunto de visualização de dados exposto 

ao público por meios como jornais. 

Infográficos tendem a ser criados para um 

conjunto de dados específico, tendo como 

objetivo expressar uma opinião editorial. 

Embora este artigo aborde os infográficos, seu 

maior foco estará em outros tipos de 

visualizações de dados, mais passíveis de 

repetição e mais objetivos, sendo assim mais 

apropriados às empresas.

A definição de visualização de dados remete 

aos seus dois objetivos: compreensão e 

comunicação; ela também pode ser chamada 

de visualização exploratória e explanatória de 

dados, respectivamente. Essa distinção é 

ignorada com frequência, mas é 

extremamente crítica no processo de criação 

de uma visualização de dados bem-sucedida. 

Se a motivação é explorar e entender os 

dados, então a visualização deve ser de 

natureza exploratória. No entanto, se a análise 

dos dados foi concluída, e a visualização 

destina-se a explicar e comunicar uma 

conclusão, então devemos usar uma 

visualização explanatória de dados ou um 

infográfico. Sem o conhecimento das 

motivações e objetivos para a visualização de 

dados de alguém, o processo pode ser 

ineficiente, equivocado ou completamente 

sem êxito.

Vantagem visual

A visualização de dados é especialmente 

eficaz, porque as pessoas são extremamente 

bem adaptadas para a análise visual. As 

pessoas são muito competentes para combinar 

padrões e organizar o que veem, para poderem 

entender. Visualizações de dados bem-

sucedidas usam diferenças em propriedades 

como tamanho, cor e forma, a fim de tirarem 

proveito do processamento visual que ocorre 

antes que tenhamos consciência do que 

vemos. Na verdade, "[o cérebro humano] tem 

uma afinidade particular por combinar 

padrões, algo que computadores não 

executam com facilidade

4

”. Além disso, as 



visualizações de dados podem consolidar 

diversas informações em um só lugar, 

permitindo que as pessoas entendam os dados 

com maior facilidade e profundidade.

O quarteto de Anscombe é um exemplo muito 

famoso do quanto a visualização de dados 

pode ser eficaz (ver figura 1), especialmente 

em um caso em que o uso de estatísticas 

simples não basta. Ele consiste em quatro 

conjuntos de dados, mostrados e comparados 

primeiro em formato tabular e, em seguida, 

após a realização de uma análise simples. É 

muito difícil encontrar um sentido na tabela 

de números em si, e a média, variância, 

correlação e regressão linear dos números 

também são praticamente idênticos. Os 

padrões se tornam imediatamente aparentes 

apenas depois que os conjuntos de dados são 

transformados em gráficos.

3) Vitaly Friedman, “Data Visualization and Infographics,” Smashing Magazine, July 9, 2012. http://www. smashingmagazine.com/2008/01/14/ 

monday-inspiration-data- visualization-and-infographics/

4) Erich Vieth, “The Brain is not a Computer,” May 18, 2006. http://dangerousintersection. org/2006/05/18/the-brain-is-not-a- computer/

5) Andy Kirk, “Discussion: Can visualization influence people? Can we prove it?” April 13, 2011. http://www.visualisingdata.com/

index.php/2011/04/discussion-can- visualisation-influence-people-can- we-prove-it/

6) Hans Rosling, “Hans Rosling: Let my dataset change your mindset,” TED, June 2009. http://www.ted.com/talks/ hans_rosling_at_state.html

7) Duncan Swain, Telephone Interview, July 18, 2012.

Influência

Infelizmente, são escassas as pesquisas sobre a 

exata influência que a visualização de dados 

tem sobre os tomadores de decisões. 

Certamente, isso depende da eficácia da 

própria visualização de dados, mas muitos 

outros fatores também são importantes. 

Variáveis como o conhecimento prévio ou o 

humor das pessoas podem, com frequência, ter 

um efeito ilógico ou contraintuitivo sobre o 

processo de tomada de decisões

5

. Hans 



Rosling, líder na área de visualização de dados 

que defende uma visão baseada em fatos, 

afirmou que as pessoas não precisam de mais 

dados, mas sim de uma nova mentalidade, 

uma nova maneira de pensar e aceitar dados e 

o insight que proporcionam

6

. Embora isso 



possa dar a impressão de reduzir a 

importância da visualização de dados, a 

verdade é que salienta a importância do 

contexto envolvendo os dados apresentados. 

Duncan Swain, o parceiro criativo da empresa 

Information is Beautiful, diz que eles sempre 

começam com “a história, o contexto, e o que 

estão tentando dizer ao seu público

7

".

4




Figura 1: Quarteto de Anscombe nas formas tabular e gráfica

8

Quarteto de Anscombe



I

II

III



IV

x

y



x

y

x



y

x

y



10.0

8.04


10.0

9.14


10.0

7.46


8.0

6.58


8.0

6.95


8.0

8.14


8.0

6.77


8.0

5.76


13.0

7.58


13.0

8.74


13.0

12.74


8.0

7.71


9.0

8.81


9.0

8.77


9.0

7.11


8.0

8.84


11.0

8.33


11.0

9.26


11.0

7.81


8.0

8.47


14.0

9.94


14.0

8.10


14.0

8.84


8.0

7.04


6.0

7.24


6.0

6.13


6.0

6.08


8.0

5.25


4.0

4.26


4.0

3.10


4.0

5.39


19.0

12.50


12.0

10.84


12.0

9.13


12.0

8.15


8.0

5.56


7.0

4.82


7.0

7.26


7.0

6.42


8.0

7.91


5.0

5.68


5.0

4.74


5.0

5.73


8.0

6.89


Propriedade

Média de x

Variância de x

Média de y

Variância de y

Correlação

Regressão linear

Valor


9

11

7,50



4,122 ou 4,127

0,816


Y= 3,00 + 0,500x

12

10



8

6

4



4

6

8



10

y

1



14

16

18



x

1

12



12

10

8



6

4

4



6

8

10



y

1

14



16

18

x



1

12

12



10

8

6



4

4

6



8

10

y



1

14

16



18

x

1



12

12

10



8

6

4



4

6

8



10

y

1



14

16

18



x

1

12



8) “Anscombe’s quartet” Wikipedia, May 3, 2013. http://en.wikipedia.org/wiki/ Anscombe’s_quartet

5



Processo

O processo de criação de uma visualização de 

dados ou um infográfico é multidisciplinar e 

inclui uma grande variedade de subprocessos, 

que devem ser bem integrados para que se 

tenha êxito (figura 2). A etapa mais crucial do 

processo é a definição de um objetivo desde o 

início; é importante ter-se um claro 

entendimento do público alvo a quem a 

visualização dos dados serve, assim como de 

sua finalidade. Sem essas informações, as 

empresas correm o risco de desperdiçar tempo 

e energia, produzindo uma visualização de 

dados ineficaz.

A etapa Representar também é muito 

importante, porque é aí que ocorre o processo 

de design da visualização de dados. O uso de 

práticas inovadoras para a seleção de uma 

forma eficaz, e não necessariamente gritante, 

para exibir e comunicar os dados é 

fundamental. Embora este documento não 

discuta os princípios de design de visualização 

de dados em detalhes, existem numerosos 

livros abordando detalhadamente esse tópico 

(os autores incluem Edward Tufte, Colin Ware, 

Noah Illinsky e Julie Steele).

Para a criação de uma visualização de dados 

eficaz, cada etapa deve ser concluída antes da 

próxima. Isso não implica que o processo seja 

perfeitamente linear. Uma etapa pode parecer 

concluída, mas posteriormente surgir a 

necessidade de reexaminá-la; partes do 

processo podem ser bastante iterativos. Porém, 

o problema surge quando as empresas não 

estão conscientes do processo ou pulam 

etapas, presumindo que são desnecessárias ou 

excessivamente demoradas. Isso resulta em 

um produto final inferior, ou em ineficiências 

por todo o processo quando etapas precisam 

ser totalmente refeitas. Portanto, a execução 

do processo é absolutamente crítica.

Figura 2: Resumo do processo de visualização de dados (a referência A mostra o fluxo detalhado de trabalho)

Processo

Habilidade

Resumo

Entender a motivação e definir um objetivo final apropriado. Esta etapa é



fundamental para o êxito da visualização. Depois, com base no status

atual, determinar a etapa do processo a partir da qual é apropriado iniciar.

Ciência da

computação

Adquirir os dados relevantes e garantir que sejam tão completos e

precisos quanto possível. Se relevante, complementar com dados públicos.

Analisar e formatar os dados adquiridos em uma forma passível de uso.

Se existem diversos conjuntos de dados, garantir que estejam integrados.

Statistics and

data mining

Filtrar os dados, de modo que o conjunto de dados inclua apenas os

dados necessários.

Selecionar a(s) ferramenta(s) apropriada(s) para a análise. Depois,

realizar data mining, modelar e analisar os dados. Utilizar visualização

exploratória de dados, se apropriado. Se outros interagirão com os

dados, continuar no processo. De outro modo, esta é a última etapa;

reiterar as etapas acima, se aplicável.

Designer gráfico

Selecionar a(s) ferramenta(s) apropriada(s) para representar a visualização

de dados. Depois, projetar e criar a visualização de dados ou infográfico.

Refinar a visualização de dados ou infográfico, de modo a se

adequarem ao público-alvo.

Interação

homem-máquina

Publicar, implantar e interagir com a visualização de dados. Se o produto

final for insatisfatório, determinar a etapa do processo à qual retornar e

então repetir as etapas seguir. De outro modo, se o objetivo foi

alcançado, o processo terminou.

Ciência da

computação

Estatística e

data mining

Designer gráfico

Exploratória ou

explanatória

Definir


objetivo

Adquirir


Formatar

Filt r


ra

Analisar


Representar

Refinar


Interagir

Exploratória

6



Pessoas

As pessoas estão estreitamente relacionadas 

ao processo, de modo que uma ampla 

variedade de habilidades torna-se necessária 

para a criação de uma visualização de dados 

bem-sucedida. As habilidades vêm das 

disciplinas de ciência da computação, 

estatística e data mining, design gráfico e 

interação homem-máquina

9

. As empresas mais 



avançadas de análise e visualização de dados 

utilizam equipes formadas por especialistas e 

alguns generalistas. O fator “x” que torna 

essas equipes tão eficientes é a sua 

capacidade para o trabalho em conjunto, 

apesar da tendência dos especialistas de 

permanecerem isolados e envolvidos em suas 

áreas de estudo

10

.

Atualmente, a ciência de dados e as 



habilidades de visualização de dados são 

altamente técnicas e requerem muita 

codificação. Infelizmente, esses conjuntos de 

habilidades também estão em alta demanda. 

Enrico Bertini, um importante pesquisador na 

área, acredita que “o maior problema no 

momento é treinar pessoas ou encontrar 

profissionais experientes em visualização...  

O gargalo na visualização não está 

necessariamente nas ferramentas, mas tem 

mais a ver com as habilidades certas para a 

execução de visualização de dados de alta 

qualidade

11

”. Ao mesmo tempo, isso representa 



uma oportunidade para que a tecnologia 

recorra a pessoas menos técnicas e reduza 

efetivamente seu uso de especialistas em 

visualização de dados.

Se a análise e a visualização avançada de 

dados são parte do foco central de uma 

empresa (The New York Times, LinkedIn, 

Trulia), então ela deve investir na criação de 

equipes de especialistas. Diante da dificuldade 

de contratar pessoas com essas habilidades, já 

que estão em alta demanda, talvez seja 

melhor para as empresas desenvolver alguns 

desses conjuntos de habilidades também 

internamente

12

.

Para aquelas empresas cujos processos 



centrais não incluem a visualização de dados, 

recomendamos que decidam quão avançadas 

devem ser suas visualizações. Se tudo o que 

precisam é de relatórios simples no dia a dia, 

elas devem investir em ensinar aos seus 

funcionários técnicas básicas de visualização 

de dados.  Contudo, para visualizações mais 

avançadas, essas empresas devem buscar 

ajuda externa. Dado o número de especialistas 

necessários, não faz sentido desperdiçar tempo 

e esforço contratando novos funcionários em 

tempo integral ou retirar funcionários de suas 

funções, arriscando-se também a um 

treinamento deficiente, devido à falta de 

orientação adequada. Para a criação de 

visualização de dados passível de repetição ou 

de um aplicativo de visualização, a ajuda 

externa tende a ser necessária. Para 

infográficos mais específicos usados apenas 

uma vez para marketing, por exemplo, 

empresas de design gráfico devem ser 

empregadas.

9) Ben Fry, “Computational Information Design,” April 2004. http://benfry. com/phd/dissertation-110323c.pdf

10) Gil Press, “Mok Oh: To Do Data Science, You Need a Team of Specialists,” Smart Data Collective, June 15, 2012. http://smartdatacollective.com/ 

gilpress/52052/mok-oh-do-data- science-you-need-team-specialists

11) Enrico Bertini, Telephone Interview, July 11, 2012.

12) Dan Woods, “LinkedIn’s Monica Rogati On “What Is A Data Scientist?” Forbes, November 11, 2011. http://www.forbes.com/sites/ 

danwoods/2011/11/27/linkedins- monica-rogati-on-what-is-a-data scientist/

7



Tecnologia

Embora os especialistas em visualização de dados frequentemente apontem 

para o Tableau como a principal ferramenta nessa área, muitos também 

acreditam que uma ferramenta ideal ainda não existe. Na verdade, pode ser 

impossível criar-se uma ferramenta única que atenda a cada necessidade 

possível de seus usuários. Portanto, muitas pessoas que produzem visualizações 

de dados altamente exclusivas e personalizáveis utilizam, com frequência, uma 

variedade de ferramentas, enquanto outras que utilizam soluções mais 

padronizadas podem focar-se em apenas uma.

8



Ainda existe muito espaço para melhorias nas 

ferramentas existentes, particularmente em 

certas áreas, como coleta e limpeza de dados, 

integração dos dados e visualização dos dados 

em tempo real.

Uma dessas deficiências que pode ser ignorada 

com frequência é que ainda é muito difícil 

integrar dados de diversas origens e explorá-

los pela visualização de dados. Embora as 

ferramentas de Business Intelligence possam 

ter maior integração back-end, elas carecem 

da exploração de front-end e de sofisticação 

da apresentação final.

Por outro lado, ferramentas mais leves de 

visualização de dados podem ter as 

capacidades de front-end, mas ainda não 

conseguirem conectar facilmente fontes 

diferentes de dados no back-end. O software 

mais capaz de executar isso primeiro estará 

bem posicionado no mercado para o futuro.

9






Compartilhe com seus amigos:
  1   2   3   4   5


©historiapt.info 2019
enviar mensagem

    Página principal