Março 8, 2020

Visualização de Dados

A visualização de dados é responsável por responder perguntas simples ou complexas –, de maneira visual, com clareza e objetividade. Ou seja, sabe aquela planilha de Excel, com várias colunas e muitas linhas, onde você precisa gastar um tempo analisando os dados para entendê-los? A visualização de dados facilita, e muito, esse processo! Ela resumirá essas informações em uma, ou algumas imagens, e tornará evidente o significado dos dados, até mesmo para quem não os conhece em detalhes.

Visualização de dados

Exemplo Prático

Imagine que você precise conhecer e entender o comportamento dos alunos de um curso online na plataforma de ensino utilizada. Para essa finalidade, você precisará dos dados de acessos desses alunos, de maneira individual; mas a análise a ser realizada precisa agrupar esses alunos, de maneira que possamos entender o comportamento geral existente. Se tivermos acesso a estes dados em sua forma bruta, teremos uma relação de logs (registros) de acesso à plataforma, contendo cada clique de um aluno dentro da plataforma, com diferentes informações sobre o clique em questão: como horário exato do clique, localização geográfica do aluno neste momento, curso acessado, aula, módulo, tarefa/vídeo/chat, dispositivo utilizado pelo aluno, entre muitas outras possibilidades.

Grande base de dados

Dependendo do número de alunos, cursos, disciplinas e informações registradas, essa base de dados poderá ser consideravelmente grande, com milhões de registros, ou até mesmo fazer parte de um Big Data. Qualquer análise a ser realizada será complexa, podendo envolver até mesmo modelos de machine learning e, provavelmente, o melhor caminho para conhecer o comportamento desses alunos será a visualização de dados.

Dashboards

Caso quiséssemos apenas saber a quantidade média de horas que cada aluno passa na plataforma por dia, um único valor de resultado resolveria, como por exemplo, “1 hora”. Neste caso, nem teríamos por que envolver a visualização de dados na análise. Porém, quando buscamos entender o comportamento geral dos alunos, estamos pensando em uma grande quantidade de variáveis, que muitas vezes só farão sentido quando analisadas e visualizadas juntamente com as demais. Desta forma, uma resposta simples não será suficiente, e um Dashboard (painel) poderá ser um importante aliado.

O Dashboard irá agrupar em um único visual várias respostas, de maneira que possamos responder a perguntas complexas com apenas uma tela de informações, muito bem resumidas e organizadas. Possivelmente teremos uma combinação de diferentes tipos de gráficos, respostas absolutas como “Sim” ou “Não”, valores entre 0 e 100, e o que mais possamos precisar para transmitir a informação de maneira clara e objetiva, inclusive para quem não tem familiaridade com os dados em questão.

Voltando ao nosso exemplo, poderíamos responder à pergunta inicial com um dashboard semelhante a este:

Dashboard de exemplo
Dashboard com dados fictícios

Neste dashboard (ou apenas “dash”) encontramos, de maneira rápida e simples, respostas para diversas perguntas que podem ser feitas sobre o comportamento dos alunos e, certamente, podemos traçar alguns perfis de alunos para resolver, de maneira efetiva, o problema inicial.

Por exemplo, uma análise superficial do dash nos dirá que mulheres acessam mais a plataforma do que os homens; o horário em que as pessoas estão mais ativas é às 19 horas; segunda-feira é o dia da semana com mais acessos. Comparando os gráficos relativos à idade, percebemos que não parece existir relação entre a idade dos alunos e a quantidade de acessos, e mais da metade dos alunos realizam seus acessos através de um dispositivo móvel. Estas são apenas algumas das respostas possíveis, e  poderíamos ainda filtrar os dados apresentados, por exemplo, selecionando dados apenas dos homens, ou apenas de dispositivos móveis, ou do curso “abc”; e, instantaneamente, este dash seria atualizado de acordo com o filtro aplicado, nos levando a uma série de novas repostas possíveis, cada vez mais específicas.

Clareza das informações

Precisão

Em nosso exemplo estamos utilizando dados aleatórios, que não refletem uma realidade. Com isso, é provável que ao analisarmos o comportamento desses alunos de maneira mais detalhada, algumas conclusões não façam muito sentido, como por exemplo, 370 alunos que tiveram acesso, contra 15 que ainda não acessaram, totalizando 385 alunos; sendo que o valor total de alunos indicados é 418. Em uma análise real, este tipo de situação não deve ocorrer. Primeiramente é preciso garantir a veracidade das informações apresentadas, e nos casos onde a apresentação leva a mais dúvidas do que respostas, deve-se acrescentar informações, ou mesmo retirar, de maneira que a pessoa que analisa essas informações não precise de informações complementares para seu entendimento.

Há casos em que será muito difícil chegar a este objetivo. Por mais que as informações estejam corretas, a complexidade em suas relações pode levar à necessidade de observações pontuais em texto, ou mesmo de se criar um relatório complementar, com explicações detalhadas.

Análise exploratória de dados

Muitas perguntas

A análise exploratória de dados acontece quando estamos conhecendo uma nova base de dados, e precisamos entender cada uma das variáveis envolvidas, seu significado e/ou relação com as demais, para compreender como estes dados podem ser apresentados. É importante observamos que nem sempre poderemos saber o significado das variáveis envolvidas. Existem casos onde podemos trabalhar com informações sensíveis, cada dia mais suscetíveis à regulações rígidas, ou mesmo definições de negócios, que impedem o conhecimento dos dados específicos ou, inclusive, o significado de algumas variáveis envolvidas. Nessas situações, teremos que utilizar apenas o relacionamento dessas variáveis com as demais para entender seu impacto no todo.

Esta análise pode acontecer quando não sabemos ao certo o que pretendemos descobrir com os dados analisados. Estamos buscando ideias, insights, que nos digam que caminho seguir, e como utilizar os dados na tomada de decisão. Neste momento, a visualização de dados pode ser uma importante aliada, simplificando a análise e levando a importantes descobertas, de maneira simples e efetiva. Ainda não estaremos preocupados em criar um dashboard para que outras pessoas analisem. Portanto, a visualização não será um fim em si mesma, mas servirá como apoio da análise, facilitando as conclusões, e servindo como base das mesmas. Porém, nada impede que visuais criados nesse momento façam parte de um relatório sobre o processo, ou mesmo, sejam utilizados em uma visualização final para pessoas que não estão envolvidas na exploração.

Importância da definição do problema

Na situação acima, o foco não está na visualização de dados em si, pois não estamos buscando uma resposta específica. Mas, quando buscamos por uma ou mais respostas pré-estabelecidas, é fundamental que as perguntas tenham sido bem definidas. O problema a ser resolvido precisa estar correto, com total alinhamento de expectativas entre todos os envolvidos. Um dashboard excelente pode perder totalmente seu valor caso ele não resolva o problema para o qual foi solicitado.

Levantamento de Requisitos

Normalmente a visualização de dados será a última etapa de um projeto de Business Intelligence ou Ciência de Dados. Mas para além dos pontos já mencionados, para que ela alcance todo seu potencial, finalizando o projeto com perfeição, é indispensável que o problema tenha sido bem definido, conforme vimos anteriormente, e que os requisitos tenham sido corretamente levantados e conferidos.

Levantamento de Requisitos

Estes requisitos dizem respeito aos dados e ferramentas necessárias para que o problema definido possa ser realmente solucionado. Será uma grande perda de tempo e energia iniciar uma análise de dados complexa, com diferentes etapas, para, em determinado momento, descobrir que determinados dados históricos não existem, ou que um software necessário ao projeto não poderá ser adquirido.

No dashboard que vimos anteriormente, existia um mapa com a localização dos alunos no momento do acesso. Se esse fosse um requisito desta análise, mas os logs de acesso não registrassem essa informação, seria impossível visualizá-la. Podemos estabelecer que, a partir de hoje, tais dados passem a ser armazenados e, no futuro, possamos enxergar essa informação. Ou, ainda, caso não fosse possível este armazenamento de maneira imediata, poderíamos deixar a análise pronta para quando estes dados estivessem disponíveis. É importante observarmos que, em ambas as situações, o dashboard resultante desta primeira análise não traria essa informação, e esta definição precisaria estar registrada no levantamento dos requisitos.

Inteligência Artificial e a Visualização de Dados

Dashboards e Inteligência Artificial

No começo deste artigo definimos que a visualização de dados responde perguntas com clareza e objetividade. Isto é fundamental na solução de qualquer problema, mas hoje isto já não é mais suficiente; nossas respostas precisam ir além.
Uma das áreas responsáveis por esta evolução é a Inteligência Artificial, que utiliza tecnologias de ponta como o Machine Learning, as Redes Neurais, Deep Learning, e Visão Computacional; descobrindo relações complexas nos dados, que dificilmente conseguiríamos encontrar sem este auxílio, prevendo situações desconhecidas, e reconhecendo imagens de maneira precisa. Sem dúvida, esta é uma revolução na análise de dados, e a visualização de dados precisa estar pronta para estas novidades.

Power BI

Uma das principais ferramentas para a visualização de dados atuais é o Microsoft Power BI, que possui amplo suporte para integração com diferentes fontes dados, modelagem dos dados, e a criação de dashboards de maneira simples e efetiva, com poucos cliques. Além destes pontos, o Power BI já permite sua integração com as linguagens de programação R e Python – linguagens mais utilizadas na Ciência de Dados –, as quais nos possibilitam análises robustas, utilizando, inclusive, as tecnologias da Inteligência Artificial.

Para continuar seu aprendizado em Visualização de Dados, Inteligência Artificial e Ciência de Dados, confira nossos cursos nesta página. Temos muitas opções, inclusive gratuitas, sempre focando no aprendizado do aluno, com didática e simplicidade, mesmo nos conceitos e tecnologias mais complexos.