Mostrando entradas con la etiqueta Estadistica. Mostrar todas las entradas
Mostrando entradas con la etiqueta Estadistica. Mostrar todas las entradas

sábado, 7 de enero de 2023

Concepto de Estadística

La estadística es el conjunto de técnicas y procedimientos para recopilar, organizar, analizar y presentar datos numéricos para fines concretos. Esta disciplina se utiliza para descubrir patrones y tendencias, así como para predecir el comportamiento futuro. Asimismo, la estadística es una herramienta esencial para la toma de decisiones en ciencias, tecnología, economía, negocios, salud, ciencias sociales, y muchas otras áreas.

La estadística es una herramienta importante para tomar decisiones informadas. Proporciona información valiosa sobre patrones, tendencias y relaciones entre variables. Esto permite a los profesionales y líderes tomar decisiones basadas en datos, en lugar de asumir. Esta información también puede ayudar a las organizaciones a comprender mejor el comportamiento de los clientes, el rendimiento de los productos y los resultados de los procesos, y puede ayudar a optimizar el uso de los recursos, mejorar la calidad y controlar los costos. Por lo tanto, la estadística es una herramienta invaluable para tomar decisiones informadas en muchos ámbitos.

Recopilar datos en estadística consiste en recopilar información y observaciones relevantes para un tema en particular. Esta información se recopila para entender mejor un tema y generar conocimiento útil. Los datos recopilados pueden ser estructurados o no estructurados, según el tema a tratar. Los datos estructurados se refieren a los datos organizados y se pueden guardar en una base de datos. Por otro lado, los datos no estructurados son mucho más difíciles de analizar ya que no están organizados. Esta información se recoge de diversas fuentes, como encuestas, entrevistas, archivos, bases de datos, etc. Estos datos se analizan para extraer conclusiones y descubrir patrones y tendencias. Esto ayuda a los investigadores a comprender mejor el tema y a tomar decisiones informadas.

Organizar los datos en estadística consiste en clasificar, agrupar y contar los datos para obtener información útil. Esto puede incluir la separación de los datos en diferentes categorías, la organización de los datos en tablas, el cálculo de estadísticas descriptivas como la media, mediana, moda y rango, o la creación de gráficos y diagramas para facilitar la interpretación de los datos.

Para analizar  e interpretar los datos la estadística cuenta  con las tablas, gráficos, estadísticas descriptivas, pruebas de hipótesis, regresiones lineales y análisis de correlación. Estas herramientas permiten a los usuarios identificar patrones y relaciones en los datos, descubrir tendencias y predecir resultados futuros. Los usuarios también pueden descubrir qué variables afectan a los resultados y cuáles son los factores clave para el éxito. Esta información puede utilizarse para tomar decisiones informadas y mejorar los resultados de la organización.

Tipos de datos

  • Variables Cuantitativas: Estas variables miden cantidades numéricas, como el número de personas en una población, el salario anual promedio, el índice de desempleo, etc.
  • Variables Cualitativas: Estas variables describen características cualitativas, como la edad, el género, el país de origen, el nivel educativo, etc.
  • Variables Dicotómicas: Estas variables toman solo dos posibles valores, como si/no, verdadero/falso, etc.
  • Variables de Rango: Estas variables miden el rango de una característica, como el nivel de escolaridad, el estado civil, etc.
  • Variables Nominales: Estas variables toman valores nominales, como el nombre, la dirección, el número de teléfono, etc.
Así entonces concluimos que la estadística es una herramienta invaluable para comprender y analizar los datos. Es una forma de organizar datos que permite obtener información significativa y poder tomar decisiones informadas. Para obtener resultados significativos, es importante interpretar los datos de la forma correcta para obtener las conclusiones adecuadas. La estadística puede ayudar a comprender la tendencia de una situación y predecir el futuro. En conclusión, la estadística juega un papel fundamental en la toma de decisiones y la construcción de conocimiento basado en datos.





lunes, 24 de octubre de 2022

Concepto de Econometría

La econometría es el uso del conocimiento de economía y estadística matemática para el estudio de verificar o no una hipótesis relacionada a temas económicos como el PIB, la inversion, el desempleo, inflación, consumo, demanda, etc. Tambien, la econometría se aplica a estudios en el areas de finanzas, negocios, marketing, etc. (Gujarati y Porter, 2009).

En la econometría se utilizan modelos de regresión lineal y no lineal. Cuando hablamos de modelos de regresión lineal se esta analizando la relación lineal entre dos variables o también llamado modelo univariado. Cuando hablamos de un modelo de regresión lineal con mas variables se lo llama modelo de regresión multiple.

Lo que se busca es identificar la dirección de dicha relación, si es positiva o negativa, el grado de asociación entre las variables y su significancia estadística.

Tambien la econometría sirve para analizar la relación entre variables no lineales, es decir tipo exponencial y polinomial.

Además de estimar la relación entre variables. La econometría también nos permite utilizar los resultados para realizar pronósticos. Por ejemplo, en economía podríamos estar interesados en pronosticar el crecimiento económico, tipo de cambio, tasa de desempleo, etc.

La econometría es una herramienta para toma de decisiones que permite identificar tendencias, patrones en los principales temas económicos y de la empresa.

Correlación entre dos variables

Concepto de Regresión Lineal Simple

Regresión Lineal Simple con DAX

lunes, 16 de agosto de 2021

Correlación entre dos variables

 En el análisis de datos es muy probable que necesitemos entrar en el análisis de la relacion existente entre dos variables. Por ejemplo, nos gustaría conocer la relacion existente entre el comer un tipo de alimento y saber si es provechoso para la saludo o no.

  • También, nos podría interesar saber si asistir a una escuela X mejora las calificaciones de los estudiantes?.
  • La cantidad de alimento ingerido y el peso de las personas?.
  • La relacion entre la altura de las personas y el peso.
  • Si existe una relacion entre los niveles de criminalidad y el desempleo.

Al hacer una grafica de dispersión entre las dos variables podemos ver gráficamente el tipo de relacion. 



Por ejemplo, en el caso de la relacion entre el consumo de helado y la temperatura promedio, podríamos hablar una correlación positiva. Esto significa que cuando una variable incrementa, la otra variable también aumenta. 

Aunque también podemos tener una correlación negativa. Esto significa que cuando una variable aumenta, la otra disminuye. 

También podemos encontrar que no existe correlación alguna entre las variables. Es decir no hay correlación alguna al aumento o disminución de una, no tiene ningún efecto en la otra.

Como medir esa correlación?

La manera mas común para cuantificar es mediante el coeficiente de Pearson (R2). Y este es un numero que va entre +1 a -1.

Un valor positivo (+1), significa que la relacion es positiva y un valor negativo significa que la relacion es negativa.

Mientras mas cerca el valor a +1 o -1, nos dice que la correlación es mas fuerte. Y un valor cercado a CERO significa que no existe o es muy baja la relacion entre las variables.

Por ejemplo, un resultado del coeficiente de Pearson igual a 0.78. Este resultado nos dice que existe una fuerte relacion lineal y positiva entre el consumo de helado y la temperatura media. 

Eso podría llevarnos a concluir que un clima caluroso podría causar un mayor consumo de helado en ese día. Pero es aquí donde debemos tener cuidado, porque aunque tenemos una alta correlación, no significa que exista una fuerte causalidad entre la temperatura y el consumo de helado.

Así que solo podemos concluir que existe una correlación fuerte y positiva entre las dos variables.


Tipos de correlación

Tenemos primero donde no existe correlación alguna. Por ejemplo, la relacion entre la edad de las personas y el tener mascota. El grafico muestra que estas dos variables no tienen ningún tipo de relacion entre si.




Si existiere relacion entre dos variables, esta relacion puede ser lineal o no lineal. Una relacion lineal sucede cuando una variable incrementa o decrece a medida que una variable aumenta o disminuye. 

Un ejemplo de una relacion lineal podría ser entre el consumo de chocolate con el aumento del peso corporal. Cuando vemos el grafico de dispersión, la relacion lineal se la observa por la formación de los puntos y estos siguen una forma de linea recta.

Los dos gráficos de dispersión muestran las opciones de relacion lineal positiva y negativa.



Tambien puede existir relaciones NO lineales. Naturalmente, las relaciones no lineales pueden tener diferentes patrones o formas. 

Un ejemplo puede ser la relacion entre la distancia recorrida de una bola y el tiempo de que fue lanzada. La distancia incrementara mas rapidamente al inicio, pero despues disminuira su recorrida y se detendra.

Las dos graficas de dispersion muestran dos tipos de relaciones no lineales. 





Fuerza de la correlación

Correlacion va mucho mas es decir si hay relacion entre dos variables. Ademas, es una medicion que nos dice que tan fuerte is esa relacion.

Cuando la correlacion es fuerte entre dos variables, los puntos en el grafico de dispersion estan muy cercanos y formando una linea recta muy acentuada. 

Mientras que la relacion es debil, los puntos en el grafico de dispersion estan alejados de linea recta. 

Los graficos a continuacion muestran:

Izq: fuerte correlacion positiva.  Centro: fuerte correlacion negativa.  Derecha: no hay correlacion