Se requiere realizar un análisis de regresión lineal simple utilizando el método de mínimos cuadrados en Power BI. Tiene un conjunto de datos con 30 observaciones que consisten en años de experiencia de las personas y sus salarios anuales.
La regresión lineal es una herramienta que combina la estadística y la economía para medir la relación entre una variable independiente (en este caso, los años de experiencia) y una variable dependiente (los salarios). Se utiliza el método de mínimos cuadrados para obtener la mejor línea de ajuste que se acerque a los puntos de datos.
Para esto se puede utilizar un gráfico de dispersión para visualizar la relación entre las variables. Cuanto más cercanos estén los puntos en una línea, indica una relación más fuerte. Además, se menciona el coeficiente de Pearson, que varía entre -1 y 1 y cuantifica la fuerza y la dirección de la relación.
En Power BI, se crea una tabla llamada "línea" utilizando la función "Lines" para obtener los resultados de la regresión lineal. Se muestra un gráfico de dispersión y se obtiene un coeficiente de determinación de 0.96, lo que indica que el 96% de la variabilidad en los salarios puede ser explicada por los años de experiencia.
Además, se estima la ecuación de la recta de regresión, donde el intercepto es de 27,792 y el coeficiente es de 9,449. Esto significa que el salario estimado se calcula multiplicando los años de experiencia por 9,449 y sumándole 27,792.
En resumen, el análisis realizado en Power BI muestra una relación fuerte entre los años de experiencia y los salarios. Los resultados obtenidos mediante la regresión lineal indican que los salarios tienden a aumentar a medida que aumenta la experiencia laboral.
Correlación entre dos variables
Concepto de Regresión Lineal Simple
Regresión Lineal Simple con DAX
Relacion entre la produccion de trigo y el precio de la harina
Análisis e interpretación de los resultados:
El objetivo es encontrar la línea de regresión que mejor se ajuste a los datos. La línea de regresión tiene la forma y = mx + b, donde "m" es la pendiente de la línea y "b" es el término de intersección.
Para calcular la pendiente (m) y el término de intersección (b), utilizamos las siguientes fórmulas:
m = (N * Σ(X * Y) - Σ(X) * Σ(Y)) / (N * Σ(X^2) - (Σ(X))^2)
b = (Σ(Y) - m * Σ(X)) / N
Donde:
N es el número total de observaciones.
Σ(X) representa la suma de los valores de YearsExperience.
Σ(Y) representa la suma de los valores de Salary.
Σ(X * Y) representa la suma de los productos de YearsExperience y Salary.
Σ(X^2) representa la suma de los cuadrados de YearsExperience.
Calculamos los valores necesarios:
N = 30
Σ(X) = 189.9
Σ(Y) = 1692300
Σ(X * Y) = 12113966
Σ(X^2) = 1047.71
Calculamos la pendiente (m):
m = (30 * 12113966 - 189.9 * 1692300) / (30 * 1047.71 - (189.9)^2)
m ≈ 9449.96
Calculamos el término de intersección (b):
b = (1692300 - 9449.96 * 189.9) / 30
b ≈ 25792.2
La línea de regresión resultante es:
Salary ≈ 9449.96 * YearsExperience + 25792.2
Cálculo del coeficiente de correlación de Pearson:
El coeficiente de correlación de Pearson (r) nos indica la fuerza y dirección de la relación lineal entre las variables YearsExperience y Salary. Su valor oscila entre -1 y 1, donde -1 indica una correlación negativa perfecta, 1 indica una correlación positiva perfecta y 0 indica que no hay correlación lineal.
La fórmula para calcular el coeficiente de correlación de Pearson es:
r = (N * Σ(X * Y) - Σ(X) * Σ(Y)) / sqrt((N * Σ(X^2) - (Σ(X))^2) * (N * Σ(Y^2) - (Σ(Y))^2))
Calculamos los valores necesarios:
Σ(Y^2) = 2.5724e+10
Calculamos el coeficiente de correlación de Pearson (r):
r = (30 * 12113966 - 189.9 * 1692300) / sqrt((30 * 1047.71 - (189.9)^2) * (30 * 2.5724e+10 - (1692300)^2))
r ≈ 0.978
El coeficiente de correlación de Pearson (r) aproximado es 0.978, lo que indica una fuerte correlación positiva entre YearsExperience y Salary.
Conclusiones:
La línea de regresión obtenida, Salary ≈ 9449.96 * YearsExperience + 25792.2, muestra que hay una relación positiva entre los años de experiencia y el salario. Cada aumento de 1 año de experiencia se asocia, en promedio, con un aumento de aproximadamente $9449.96 en el salario.
El coeficiente de correlación de Pearson (r ≈ 0.978) confirma la fuerte correlación positiva entre YearsExperience y Salary, lo que indica que los años de experiencia son un buen predictor del salario.
Es importante tener en cuenta que este análisis se basa en los datos proporcionados y asume una relación lineal entre las variables. Otros factores no considerados en este análisis pueden influir en el salario. Por lo tanto, es fundamental interpretar estos resultados dentro del contexto específico de los datos y considerar otros factores relevantes en un análisis más completo.
No hay comentarios:
Publicar un comentario