Mostrando entradas con la etiqueta Estadística. Mostrar todas las entradas
Mostrando entradas con la etiqueta Estadística. Mostrar todas las entradas

lunes, 30 de octubre de 2023

Importancia de los Datos para la Toma de Decisiones

  • Capacita a los oficiales y gerentes para tomar mejores decisiones: un analista de datos trabaja con un banco para analizar los patrones de transacciones y predecir el riesgo crediticio de los clientes. Esto permite a la alta dirección tomar decisiones más informadas sobre la aprobación de préstamos y reducir el riesgo de incumplimiento.
  • Dirige la acción basada en tendencias que ayudarán a definir objetivos: Un minorista utiliza análisis de datos para identificar que ciertos productos tienen un aumento en la demanda durante las temporadas de vacaciones. Como resultado, la empresa ajusta su estrategia de inventario y marketing para capitalizar en estas tendencias estacionales.
  • Desafía al personal a utilizar las mejores prácticas y centrarse en problemas importantes:  En una organización de atención médica, un analista de datos entrena al personal en el uso de análisis de datos para mejorar la eficiencia en la programación de citas y el seguimiento de pacientes, lo que permite al personal médico concentrarse en casos críticos.
  • Identificar oportunidades:  Una empresa de comercio electrónico utiliza análisis de datos para identificar que los clientes que compran productos de electrónica a menudo también compran productos relacionados con tecnología. Esto lleva a la creación de paquetes de productos recomendados para aumentar las ventas cruzadas.
  • Tomar decisiones basadas en evidencia cuantificable y respaldadas por datos: Un fabricante de automóviles utiliza datos de pruebas de seguridad y retroalimentación del cliente para tomar decisiones informadas sobre las características de diseño y la seguridad de sus vehículos, lo que mejora la confianza del consumidor en la marca.
  • Los científicos de datos prueban las decisiones de gestión: Después de implementar un nuevo sistema de gestión de inventario, una empresa utiliza análisis de datos para medir la eficiencia y la rentabilidad del nuevo proceso, lo que les permite ajustar su enfoque según los resultados.
  • Identificar y refinar audiencias objetivo: Una empresa de medios sociales utiliza análisis de datos para identificar a su audiencia objetivo y personalizar las recomendaciones de contenido para diferentes segmentos demográficos, lo que aumenta la participación del usuario.
  • Ayudan a reclutar el mejor talento para la organización:  Una empresa de tecnología utiliza análisis de datos para analizar los currículums y las redes de candidatos, lo que les permite identificar rápidamente a los candidatos más calificados y adecuados para sus vacantes de empleo.

martes, 21 de febrero de 2023

Ejercicio de Regresión Lineal Simple: Producción de Trigo y precio de la harina

Como científico de datos, se te ha encomendado realizar un análisis para determinar la relación entre la producción de trigo (variable X) y el precio de la harina (variable Y). Esta información es importante para comprender cómo la oferta de trigo afecta el precio de la harina en el mercado, lo que podría tener implicaciones significativas para la toma de decisiones empresariales.













Análisis:

Los resultados del análisis muestran los siguientes valores:

Coeficiente de correlación múltiple: -0.8471402
Este valor indica la fuerza y la dirección de la relación entre la producción de trigo y el precio. Un coeficiente de correlación múltiple de -0.8471402 sugiere una correlación negativa moderada a fuerte entre estas dos variables. Esto implica que a medida que la producción de trigo aumenta, es probable que el precio desminuye, y viceversa. Sin embargo, ten en cuenta que este coeficiente de correlación múltiple también tiene en cuenta otras variables predictoras (si las hubiera) en el modelo, además de la producción de trigo.

Intercepción: 74.11511789
La intercepción representa el valor esperado del precio cuando la producción de trigo es igual a cero. En este caso, cuando la producción de trigo es nula, el modelo predice un precio de aproximadamente 74.11511789.

Producción de trigo (coeficiente): -1.353675451
El coeficiente de la producción de trigo indica cuánto se espera que varíe el precio en respuesta a un cambio unitario en la producción de trigo. En este caso, se sugiere que, en promedio, por cada unidad de aumento en la producción de trigo, el precio disminuirá aproximadamente 1.353675451.

En resumen, el análisis de regresión lineal múltiple indica que existe una correlación positiva moderada a fuerte entre la producción de trigo y el precio. A medida que la producción de trigo aumenta, es probable que el precio también aumente. Sin embargo, ten en cuenta que estos resultados son específicos para el modelo y los datos proporcionados, y es importante considerar otras variables y posibles factores adicionales que puedan influir en el precio de la harina en un contexto más amplio.



sábado, 18 de febrero de 2023

Ejercicio de Regresión Lineal Simple: Años de experiencia y Salario

Se requiere realizar un análisis de regresión lineal simple utilizando el método de mínimos cuadrados en Power BI. Tiene un conjunto de datos con 30 observaciones que consisten en años de experiencia de las personas y sus salarios anuales.

La regresión lineal es una herramienta que combina la estadística y la economía para medir la relación entre una variable independiente (en este caso, los años de experiencia) y una variable dependiente (los salarios). Se utiliza el método de mínimos cuadrados para obtener la mejor línea de ajuste que se acerque a los puntos de datos.

Para esto se puede utilizar un gráfico de dispersión para visualizar la relación entre las variables. Cuanto más cercanos estén los puntos en una línea, indica una relación más fuerte. Además, se menciona el coeficiente de Pearson, que varía entre -1 y 1 y cuantifica la fuerza y la dirección de la relación.

En Power BI, se crea una tabla llamada "línea" utilizando la función "Lines" para obtener los resultados de la regresión lineal. Se muestra un gráfico de dispersión y se obtiene un coeficiente de determinación de 0.96, lo que indica que el 96% de la variabilidad en los salarios puede ser explicada por los años de experiencia.

Además, se estima la ecuación de la recta de regresión, donde el intercepto es de 27,792 y el coeficiente es de 9,449. Esto significa que el salario estimado se calcula multiplicando los años de experiencia por 9,449 y sumándole 27,792.

En resumen, el análisis realizado en Power BI muestra una relación fuerte entre los años de experiencia y los salarios. Los resultados obtenidos mediante la regresión lineal indican que los salarios tienden a aumentar a medida que aumenta la experiencia laboral.

 


Concepto de Econometría

Correlación entre dos variables

Concepto de Regresión Lineal Simple

Regresión Lineal Simple con DAX

Relacion entre la produccion de trigo y el precio de la harina


Análisis e interpretación de los resultados:

El objetivo es encontrar la línea de regresión que mejor se ajuste a los datos. La línea de regresión tiene la forma y = mx + b, donde "m" es la pendiente de la línea y "b" es el término de intersección.

Para calcular la pendiente (m) y el término de intersección (b), utilizamos las siguientes fórmulas:

m = (N * Σ(X * Y) - Σ(X) * Σ(Y)) / (N * Σ(X^2) - (Σ(X))^2)

b = (Σ(Y) - m * Σ(X)) / N

Donde:

N es el número total de observaciones.

Σ(X) representa la suma de los valores de YearsExperience.

Σ(Y) representa la suma de los valores de Salary.

Σ(X * Y) representa la suma de los productos de YearsExperience y Salary.

Σ(X^2) representa la suma de los cuadrados de YearsExperience.

Calculamos los valores necesarios:

N = 30

Σ(X) = 189.9

Σ(Y) = 1692300

Σ(X * Y) = 12113966

Σ(X^2) = 1047.71

Calculamos la pendiente (m):

m = (30 * 12113966 - 189.9 * 1692300) / (30 * 1047.71 - (189.9)^2)

m ≈ 9449.96

Calculamos el término de intersección (b):

b = (1692300 - 9449.96 * 189.9) / 30

b ≈ 25792.2

La línea de regresión resultante es: 

Salary ≈ 9449.96 * YearsExperience + 25792.2

Cálculo del coeficiente de correlación de Pearson:

El coeficiente de correlación de Pearson (r) nos indica la fuerza y dirección de la relación lineal entre las variables YearsExperience y Salary. Su valor oscila entre -1 y 1, donde -1 indica una correlación negativa perfecta, 1 indica una correlación positiva perfecta y 0 indica que no hay correlación lineal.

La fórmula para calcular el coeficiente de correlación de Pearson es:

r = (N * Σ(X * Y) - Σ(X) * Σ(Y)) / sqrt((N * Σ(X^2) - (Σ(X))^2) * (N * Σ(Y^2) - (Σ(Y))^2))

Calculamos los valores necesarios:

Σ(Y^2) = 2.5724e+10

Calculamos el coeficiente de correlación de Pearson (r):

r = (30 * 12113966 - 189.9 * 1692300) / sqrt((30 * 1047.71 - (189.9)^2) * (30 * 2.5724e+10 - (1692300)^2))

r ≈ 0.978

El coeficiente de correlación de Pearson (r) aproximado es 0.978, lo que indica una fuerte correlación positiva entre YearsExperience y Salary.

Conclusiones:

La línea de regresión obtenida, Salary ≈ 9449.96 * YearsExperience + 25792.2, muestra que hay una relación positiva entre los años de experiencia y el salario. Cada aumento de 1 año de experiencia se asocia, en promedio, con un aumento de aproximadamente $9449.96 en el salario.

El coeficiente de correlación de Pearson (r ≈ 0.978) confirma la fuerte correlación positiva entre YearsExperience y Salary, lo que indica que los años de experiencia son un buen predictor del salario.

Es importante tener en cuenta que este análisis se basa en los datos proporcionados y asume una relación lineal entre las variables. Otros factores no considerados en este análisis pueden influir en el salario. Por lo tanto, es fundamental interpretar estos resultados dentro del contexto específico de los datos y considerar otros factores relevantes en un análisis más completo.









sábado, 27 de marzo de 2021

Estadística Descriptiva

En el dinámico mundo del análisis de datos, aprovechar las capacidades de Power BI puede proporcionar conocimientos invaluables. En esta entrada del blog, nos sumergimos en un convincente tutorial en video donde el enfoque está en extraer estadísticas descriptivas para desentrañar la historia detrás de los precios de las acciones.

Creación de Tablas:

El primer paso implica la creación de una tabla para estudiar el precio de una acción, abarcando varios aspectos como ventas, compras, exportaciones y más. El narrador nos guía sin problemas a través del proceso de transformar datos sin procesar en un formato estructurado dentro de Power BI.

Métricas Estadísticas Clave:

El video luego destaca la extracción de métricas estadísticas esenciales. 

  • Promedio (Media): El narrador demuestra cómo obtener el precio promedio, brindando una visión integral de todas las observaciones.
  • Valores Mínimos y Máximos: Yendo más allá del promedio, el tutorial cubre la extracción de los valores mínimo y máximo, ofreciendo información sobre el rango de precios de las acciones durante el período especificado.
  • Recuento (Número de Observaciones): Comprender el tamaño del conjunto de datos se vuelve crucial. La función de recuento nos permite determinar el número de observaciones, una métrica fundamental en el análisis de datos.
  • Desviación Estándar y Varianza: Adentrándonos en la variabilidad de los precios de las acciones, el tutorial explora la extracción de la desviación estándar y la varianza, proporcionando una comprensión más profunda de la dispersión de datos.
  • Mediana: El tutorial concluye extrayendo la mediana, una medida importante que complementa la media para comprender la tendencia central del conjunto de datos.

Utilizando Herramientas Analíticas:

Enfatizando que estas métricas son herramientas analíticas poderosas, te alentamos a explorar y analizar segmentos específicos o períodos de tiempo. Este enfoque permite un examen detallado de los indicadores, fomentando una comprensión matizada de la dinámica de los precios de las acciones.

Conclusión:

Aunque breve, el tutorial en video tiene un impacto al impartir habilidades esenciales para aprovechar Power BI en la extracción y comprensión de estadísticas descriptivas. Como comparte el creador del tutorial, Ricardo Contreras, estos siete valores clave: promedio, mínimo, máximo, número de observaciones, desviación estándar, varianza y mediana, forman una sólida base para un análisis de datos perspicaz.

Reflexiones Finales:

Al concluir este resumen, extendemos nuestro agradecimiento por acompañarnos en este viaje al mundo de Power BI y las estadísticas descriptivas. Siéntete libre de compartir, suscribirte y estar atento a más información del mundo impulsado por datos. Tu amigo en datos, Ricardo Contreras, envía sus cálidos saludos. ¡Feliz análisis!