O que é gráfico de dispersão
O gráfico de dispersão é significativo na estatística porque pode demonstrar a magnitude da correlação, se houver, entre variáveis ou fenômenos observados (chamados fatores).
Se não houver correlação entre as variáveis, os pontos parecem aleatoriamente espalhados no plano de coordenadas. Veja abaixo:
Se existe uma grande correlação, os pontos se concentram perto de uma linha reta. Gráficos de dispersão são ferramentas úteis de visualização de dados para ilustrar uma tendência.
Além de mostrar a extensão da correlação, um gráfico de dispersão revela o sentido do significado:
Quando a variável perpendicular (ou eixo y) aumenta porque a variável horizontal (ou eixo x) aumenta, a correlação é positiva.
Se o fator do eixo y diminui à medida que a variável do eixo x aumenta ou vice-versa, a correlação é negativa.
A correlação negativa potencial máxima é -1 ou -100%, em cujo caso todos os pontos ficam exatamente ao longo de uma linha reta com um declive negativo.
A correlação é frequentemente confundida com a causação, seja de forma não intencional (como resultado de hipóteses falsas ou não provadas) ou intencionalmente (com intenção de enganar).
No entanto, no sentido mais puro, embora um gráfico de dispersão possa revelar o caráter e o grau de correlação, ele não diz nada sobre causação.
O gráfico de dispersão também é chamado: gráfico de dispersão, gráfico X – Y e diagrama de dispersão.
O diagrama de dispersão grava pares de informações numéricas, com um fator em cada eixo, para procurar uma conexão entre eles.
Se os fatores estiverem conectados, os pontos cairão em uma curva ou linha. Quanto maior o significado, mais apertados os pontos irão se concentrar ao redor da linha.
Histórico do Gráfico de Dispersão
De todos os tipos de gráficos significativos, eles são, sem dúvida, os mais fortes. Eles nos permitem entender rapidamente relacionamentos que seriam quase impossíveis de reconhecer em uma mesa ou outro tipo de gráfico.
Tente por exemplo enxergar a visualização da relação entre religiosidade e riqueza da nação, por exemplo: seria quase impossível sem esta ferramenta!
Michael Denis e Daniel Denis, historiadores e psicólogos de gráficos, chamam o gráfico de dispersão como a:
“inovação mais prática na história dos gráficos estatísticos”.
As origens desta invenção inestimável, no entanto, não são inteiramente claras.
Originalmente referidos como diagramas de dispersão, eles normalmente plotam pontos no sistema de coordenadas cartesianas criado por René Descartes no século XVII, usando linhas perpendiculares representando os dois eixos.
Prevemos o horizontal no eixo x e o vertical no eixo y – o uso dessas letras decorre de seu papel na álgebra.
Descartes desenvolveu seu método de coordenadas para demonstrar a conexão entre geometria e álgebra, e ele provavelmente não imaginava que seria usado para traçar a relação entre objetos do mundo real.
Procedimento do Diagrama de Dispersão
Para ilustrar o gráfico de dispersão, veja o exemplo abaixo onde foram coletados dados de nota média de cada disciplina e em qual período eram lecionadas.
Para fazer o gráfico abaixo é muito simples, basta colocar um ponto ou outra marcação na intersecção entre o eixo Y (pontuação média) e o eixo X (período) para cada par de dado.
Por exemplo: veja que o primeiro ponto verde, da esquerda para a direita, representa a intersecção entre pontuação média (Y) = 95 e período (X) = 1.
Com base no gráfico acima podemos notar que não há correlação entre pontuação média e período.
Vamos ver mais um exemplo. Abaixo temos a quantidade vendida de carros de acordo com dada mês do ano.
Podemos notar claramente que há uma correlação positiva entre mês e quantidade vendida de carros.
Como fazer no EXCEL e no MINITAB
Vantagens do Gráfico de Dispersão:
- Os Diagramas de Dispersão são simples de desenhar.
- Mantém um valor de dados preciso no gráfico.
- A correlação gráfica negativa e positiva são facilmente observadas.
- O gráfico é simples para monitorar.
- Pode ser prontamente entendido e interpretado.
Desvantagens
- O método não é aplicável para mostrar a relação de mais de duas variáveis.
- Esses diagramas são incapazes de medir o grau preciso de correlação.
Quem usa o Gráfico de Dispersão?
Engenheiros de Produção
Os engenheiros de produção usam com muita frequência estes gráficos para encontrar correlações entre variáveis de processo e produção, como por exemplo verificar a correlação entre um defeito e a quantidade de óleo usada sob o material durante a fabricação.
É importante destacar que o engenheiro usa esta ferramenta como uma análise inicial e gráfica do que esta sendo estudado, e o aprofundamento normalmente é feito com ferramentas como análise de regressão, 2 sample t, etc.
Pesquisa médica
Gráficos de dispersão podem ser usados para mostrar como a informação está conectada, ou como um par de datas depende do outro.
Na pesquisa médica, os gráficos de dispersão podem ser úteis para verificar se as informações podem ter um relacionamento.
Sempre que houver uma correlação entre dois conjuntos de informações, os pontos em um gráfico de dispersão tenderão a se agrupar em torno de uma linha como falado, e isto é especialmente útil para determinar se uma ocorrência médica pesquisada – como morte ou distúrbio – foi causada por uma doença específica.
Censos
O Census Bureau dos EUA reúne informações demográficas e econômicas nacionais, e é a principal fonte de informações para dados sobre a população dos Estados Unidos.
Os funcionários do departamento de recenseamento utilizam gráficos estatísticos, tais como gráficos de remoção, para obter um instantâneo da população e fazer inferências sobre os agrupamentos de dados.
Por exemplo, para pesquisar se existe uma correlação entre famílias de baixa renda e famílias monoparentais, os funcionários do Census Bureau poderiam usar um gráfico de dispersão para visualizar as informações.
O mesmo se aplica no Brasil com entidades como IBGE, Datafolha, IBOPE, dentre outras.
Economia
Os economistas conduzem estudos e examinam tendências sobre uma vasta gama de fenômenos econômicos, como custos, emprego, produção, inflação e ciclos econômicos.
O Bureau de Estatísticas do Trabalho dos EUA, por exemplo, aponta que preparar relatórios é uma parte cada vez mais significativa do trabalho, e que os economistas devem apresentar teorias econômicas complexas de uma maneira que os não-economistas, como os formuladores de políticas do governo, possam compreender.
Gráficos de dispersão ajudam a ilustrar visualmente conexões entre dois fenômenos econômicos, como produção e emprego, inflação e vendas no varejo, e impostos e desenvolvimento econômico.
Analista de Pesquisa Operacional
Os líderes corporativos e as agências governamentais freqüentemente dependem de analistas de pesquisa operacional para analisar problemas complexos de negócios e fornecer informações que ajudem a solucionar problemas.
Os analistas de pesquisa operacional utilizam uma ampla gama de métodos de análise estatística e matemática para interpretar grandes quantidades de informação.
Os analistas podem usar gráficos de dispersão em análise exploratória de dados para analisar visualmente problemas relacionados a operações de agência ou negócios antes de empregar técnicas quantitativas como programação linear e análise de regressão para analisar as informações em maior profundidade.
Analistas de Gestão
Analistas de gestão, também conhecidos como consultores de gestão, aconselham corporações, organizações sem fins lucrativos e agências governamentais sobre a melhor forma de aumentar os lucros, os custos de gestão, agilizar as operações e aumentar a eficiência.
Desenvolver soluções para esses problemas envolve a análise de dados relevantes, como despesas, ganhos ou processos.
O Bureau of Labor Statistics do Canadá informa que os analistas gerenciais frequentemente entendem os problemas de um cliente corporativo criando um modelo matemático que examina, por exemplo, como os estoques de mercadorias afetam os preços ou os prazos de entrega.
Gráficos de dispersão representam visualmente esses fenômenos para supervisores corporativos e de agências, que podem utilizar essas informações e colaborar com os analistas para desenvolver soluções viáveis.
O estudo de mercado envolve a realização de pesquisas com clientes e grupos focais, além de coletar e analisar informações sobre preços, distribuição e vendas.
Frequentemente, os pesquisadores examinam dados sobre vendas passadas para projetar receitas futuras. Pesquisas de mercado freqüentemente envolvem a elaboração de relatórios que incluem gráficos estatísticos que relatam ganhos anteriores e preveem ganhos futuros.
Esses gráficos podem incluir gráficos de dispersão, que podem ilustrar, por exemplo, a relação entre procedimentos de publicidade e ganhos.
Essa informação ajuda as empresas a desenvolver novas abordagens de marketing e refinar as atuais.
Geotecnologia
Geotecnologia envolve o uso de engenharia e ciência para gerenciar com sucesso recursos naturais.
Gráficos de dispersão são usados em muitos ambientes geo tecnológicos diferentes. Por exemplo, um geo tecnólogo pode querer investigar a correlação entre a altitude da superfície de um reservatório e a pressão do fluido em um ponto específico.
Um gráfico de dispersão pode ser usado para plotar os dados e uma investigação adicional pode ser realizada no gráfico para descobrir se existe uma relação de causa e efeito entre os dois fatores.
Pesquisadores educacionais exploram tendências na educação e fazem recomendações para melhorias.
Pesquisadores educacionais trabalham para governos federais e estaduais, distritos escolares e entidades privadas. Gráficos de dispersão são freqüentemente usados em pesquisas educacionais para traçar tendências como a correlação entre um GPA e uma pontuação em uma avaliação padronizada.
Os mesmos diagramas de dispersão também podem ser usados para traçar diferenças raciais ou diferenças na posição socioeconômica para ver se há uma tendência.
Considerações sobre Diagrama de Dispersão
Aqui estão alguns exemplos de cenários em que você pode empregar um diagrama de dispersão:
- A variável A é a temperatura de uma resposta após 15 minutos. O fator B mede a cor do produto. Você suspeita que uma temperatura maior torna o item mais escuro. Plotar cor e temperatura em um diagrama de dispersão.
- O fator A é a quantidade de defeitos na pintura de uma geladeira, e a variável B é quantidade de solvente usada na mistura da cor. Você suspeita que a quantidade de solvente é a responsável pela quantidade maior de defeitos. Montar um gráfico de dispersão com defeito e quantidade de solvente.
- O fator A é o rendimento do carro (km por litros) e o fator B é a velocidade. Você suspeita que quanto mais velocidade menor o rendimento do carro, e para isto vai plotar um gráfico de dispersão.
- O fator A é a nota de satisfação que o cliente de um banco registra, e o fator B é o tempo em que o cliente ficou esperando para ser atendido. Você suspeita que quanto mais o cliente espera mais a nota de satisfação cai. Use o gráfico de dispersão para comprovar.
Mesmo quando o diagrama de dispersão indica um relacionamento, não presuma que uma variável causou outra.
Ambos podem ser influenciados por um terceiro fator, o que reforça nosso comentário inicial de que é preciso usar outras ferramentas de análise.
Quando os dados são plotados, quanto mais o diagrama se assemelhar a uma linha direta, mais forte será a conexão.
Quando o diagrama de dispersão indica que não há relação entre os fatores, considere se os dados podem ser estratificados.
Se o diagrama não indicar nenhuma conexão, considere se o fator independente (eixo x) foi amplamente variado.
Às vezes, uma conexão não é aparente porque os dados não cobrem um intervalo amplo o suficiente.
Pense de forma criativa sobre como usar diagramas de dispersão para encontrar uma causa raiz.
Desenhar um diagrama de dispersão é o primeiro passo para procurar uma relação entre variáveis.
Conheça mais sobre o Black Belt: https://www.laboneconsultoria.com.br/treinamentos/master-black-belt/