7 Métricas de Avaliação
Avaliar o desempenho de um modelo de regressão linear é crucial para garantir sua eficácia em previsões. As métricas de avaliação permitem quantificar a precisão do modelo e identificar áreas de melhoria. Este capítulo detalha as principais métricas utilizadas para avaliar modelos de regressão.
7.1 Coeficiente de Determinação R2
O coeficiente de determinação, \(R^2\), é uma métrica que indica a proporção da variabilidade na variável dependente que é explicada pelas variáveis independentes no modelo.
Cálculo
\(R^2\) é calculado como:
\[R^2 = 1 - \frac{\textit{Soma dos Quadrados dos Resíduos (SSR)}}{\textit{Soma Total dos Quadrados (SST)}}\]
Onde:
SSR é a soma dos quadrados das diferenças entre os valores observados e previstos.
SST é a soma dos quadrados das diferenças entre os valores observados e a média dos valores observados.
Interpretação
Um \(R^2\) de 1 indica um ajuste perfeito, enquanto um \(R^2\) de 0 indica que o modelo não explica nenhuma variabilidade nos dados. Contudo, um \(R^2\) alto nem sempre indica um bom modelo, especialmente em modelos de regressão múltipla, onde pode haver overfitting.
7.2 Erro Quadrático Médio (MSE)
O erro quadrático médio (MSE) é uma métrica que calcula a média dos quadrados dos erros, ou diferenças, entre os valores observados e previstos.
Cálculo
O MSE é dado por:
\[MSE = \frac{1}{n} \sum_{i=1}^{n} (y_i - \hat{y}_i)^2\]
Onde \(y_i\) são os valores observados e \(\hat{y}_i\) são os valores previstos.
Interpretação
Um MSE menor indica que o modelo tem um ajuste melhor aos dados. No entanto, o MSE é sensível a outliers, pois os erros são elevados ao quadrado.
7.3 Raiz do Erro Quadrático Médio (RMSE)
A raiz do erro quadrático médio (RMSE) é a raiz quadrada do MSE e fornece uma medida da magnitude dos erros de previsão.
Cálculo
O RMSE é calculado como:
\[RMSE = \sqrt{\frac{1}{n} \sum_{i=1}^{n} (y_i - \hat{y}_i)^2}\]
Interpretação
O RMSE está na mesma unidade da variável dependente, facilitando a interpretação. Assim como o MSE, o RMSE é sensível a outliers, mas é frequentemente preferido devido à sua interpretabilidade direta.
7.4 Erro Absoluto Médio (MAE)
O erro absoluto médio (MAE) é a média dos valores absolutos das diferenças entre os valores observados e previstos, fornecendo uma medida clara do erro médio do modelo.
Cálculo
O MAE é dado por:
\[MAE = \frac{1}{n} \sum_{i=1}^{n} |y_i - \hat{y}_i|\]
Interpretação
O MAE é menos sensível a outliers do que o MSE ou RMSE, pois não eleva os erros ao quadrado. É útil para entender o erro médio em unidades do valor previsto.
7.5 Escolha de Métrica
A escolha da métrica de avaliação depende do contexto e das características do conjunto de dados. Em cenários onde outliers são comuns, o MAE pode ser mais apropriado, enquanto o RMSE pode ser preferido quando grandes erros são particularmente indesejáveis.
7.6 Comparação de Modelos
Usar várias métricas em conjunto pode fornecer uma visão mais completa sobre o desempenho do modelo. Isso ajuda a equilibrar entre ajuste aos dados (bias) e complexidade do modelo (variance).
7.7 Exercícios
Versão on-line destes exercícios
https://forms.gle/VUKgBj4SV4wnMBUv7
O que mede o coeficiente de determinação (\(R^2\)) em um modelo de regressão linear?
A correlação entre as variáveis independentes.
A proporção da variabilidade na variável dependente explicada pelas variáveis independentes.
A diferença média entre os valores observados e previstos.
A soma dos quadrados dos resíduos.
Qual é a principal diferença entre o Erro Quadrático Médio (MSE) e a Raiz do Erro Quadrático Médio (RMSE)?
MSE mede a variância dos resíduos, enquanto RMSE mede a média dos resíduos.
MSE é a soma dos resíduos, enquanto RMSE é a raiz quadrada do MSE, tornando-o mais interpretável na unidade original da variável dependente.
MSE é usado para dados categóricos, enquanto RMSE é usado para dados contínuos.
Não há diferença significativa entre MSE e RMSE.
Qual métrica de avaliação é menos sensível a outliers?
Coeficiente de Determinação R2
Erro Quadrático Médio (MSE)
Erro Absoluto Médio (MAE)
Raiz do Erro Quadrático Médio (RMSE)
O que indica um valor de \(R^2\) próximo a 1?
Que o modelo de regressão não é adequado para os dados.
Que as variáveis independentes não têm relação com a variável dependente.
Que o modelo de regressão fornece um ajuste perfeito aos dados.
Que a variabilidade da variável dependente é amplamente explicada pelas variáveis independentes.
Por que é importante usar várias métricas de avaliação para julgar o desempenho de um modelo de regressão?
Porque cada métrica mede um aspecto diferente do modelo e pode revelar diferentes fraquezas e pontos fortes.
Porque as métricas de avaliação não são necessárias e o desempenho do modelo pode ser julgado apenas visualmente.
Porque as métricas de avaliação fornecem geralmente resultados idênticos, então é melhor confirmar a consistência.
Porque mais métricas sempre garantem um melhor desempenho do modelo.