La Media (promedio aritmético)
La Media es la medida más común de tendencia central. La Media = Suma de valores divididos por el número de valores. Es afectada por valores extremos (atípicos).
La Media es el promedio aritmético de los valores de los datos.
La Mediana
Para obtener la mediana, ordenar los n valores (datos) de menor a mayor. El conjunto de datos ordenados es llamado arreglo ordenado de datos.
Encontrar el valor en la ubicación, el valor central que divide a los datos en 2. i = (1/2)n. La i ubicación es el Punto de la Mediana.
Si i no es un entero, redondear hacia arriba
Si i es un entero, la mediana es el promedio de los valores en las ubicaciones “i ” e “i + 1”
La Moda
La Moda es una medida de ubicación. Es el valor que ocurre con mayor frecuencia. No está afectado por valores extremos.
Es utilizada para datos numéricos y categóricos. En los datos podría NO haber Moda e incluso podrían haber mas de dos Modas (2 modas = bimodal).
Qué medida de ubicación es la “mejor”?
La media es generalmente usada, a menos que existan valores extremos (atípicos).
Luego la mediana es a menudo usada, desde que la mediana no es sensible a valores extremos.
Mientras que la moda es buena para determinar lo más probable a ocurrir.
El Rango
A pesar de tener una MEDIA es posible que tengamos variabilidad en la información, en los datos con respecto a la media.
El mas directo para medir la variabilidad en un conjunto de datos es el uso simple del RANGO. El rango es la diferencia entre el valor mas alto menos el valor mas pequeño.
Con la medida de dispersión, podemos evaluar la CONFIABILIDAD del promedio que se esta utilizando.
Una dispersión pequeña significa que los datos se encuentran acumulados cercanamente. Por tanto, la media es representativa de los datos, la media es un promedio confiable.
Una dispersión grande significa que los datos NO se encuentran acumulados cercanamente. Por tanto, la media no es representativa de los datos. Es decir, la media no es un promedio confiable.
Varianza
Hay otras dos mediciones de variabilidad de los datos: la varianza y la desviacion estandard.
Estas medidas nos dicen que tan alejados estan los diferentes datos de la media. Las dos medidas estan muy relacionadas. La varianza y la desviacion estandard son las dos mediciones mas utilizadas por los cientificos de datos.
No hay comentarios:
Publicar un comentario