Correlação e Regressão – Ferramentas estatísticas para análise de dados
Entenda bem o que é correlação e regressão linear simples – veja nosso vídeo! Cadastre-se e tenha acesso ao vídeo!
Mais sobre esse material
O que vem a ser Correlação?
Correlação é uma medida estatística da relação entre dois fatores. Correlações potenciais variam de +1 a -1. Uma correlação zero sugere que não há relação entre as variáveis.
Quanto mais próxima de 1 ou -1 (correlação positiva e negativa) a correlação é mais forte.
O que é regressão?
A análise de regressão é um poderoso método estatístico que permite examinar a conexão entre dois ou mais fatores ou variáveis de interesse.
Embora existam muitos tipos de análise de regressão, basicamente todas examinam o efeito de algumas variáveis independentes sob uma variável dependente.
Por exemplo: qual a correlação entre a variável independente velocidade, como a variável dependente consumo?
A análise de regressão oferece uma visão detalhada que pode ser implementada para melhorar ainda mais os produtos e serviços.
O que é Regressão Linear?
A regressão linear é uma forma fundamental e comumente usada em análise de dados.
Essas estimativas de regressão são usadas para explicar a relação entre uma única variável dependente e uma ou mais variáveis independentes.
Veja mais: Conheça mais sobre a Regressão Linear em nosso Curso Green Belt!
O tipo mais fácil da equação de regressão com uma variável dependente e uma variável independente é caracterizado pela fórmula y = c + b * x, onde y = pontuação dependente do fator projetado, c = constante, b = coeficiente de regressão e x = variável individual.
Boas Práticas
Abaixo relacionamos algumas boas práticas recomendadas no uso da correlação e regressão:
1 – Tenha certeza que o sistema de medição (R&R) foi validado, e que o erro causado pelo fator humano e equipamento esta dentro do aceitável.
2 – É importante conhecer a origem dos dados e como foram coletados, pois pode haver causas especiais agindo no processo, o que pode distorcer as análises.
3 – Não use o modelo matemático da regressão para fazer previsões fora do range da variável de entrada, ou seja, se o range da variável de entrada velocidade era de 10 à 100, você não deve usar o modelo com valores acima de 100 e nem abaixo de 10.