Diferencia entre la desviación estándar y la media

Desviación estándar vs media

En las estadísticas descriptivas e inferenciales, se utilizan varios índices para describir un conjunto de datos correspondiente a su tendencia central, dispersión y asimetría. En la inferencia estadística, estos se conocen comúnmente como estimadores, ya que estiman los valores de los parámetros de la población..

La tendencia central se refiere y ubica el centro de la distribución de valores. La media, el modo y la mediana son los índices más utilizados para describir la tendencia central de un conjunto de datos. Dispersión es la cantidad de difusión de datos desde el centro de la distribución. El rango y la desviación estándar son las medidas de dispersión más utilizadas. Los coeficientes de sesgo de Pearson se utilizan para describir el sesgo de una distribución de datos. Aquí, la asimetría se refiere a si el conjunto de datos es simétrico sobre el centro o no, y si no es así, qué tan sesgado está.

Que significa?

La media es el índice de tendencia central más utilizado. Dado un conjunto de datos, la media se calcula tomando la suma de todos los valores de los datos y luego dividiéndola por el número de datos. Por ejemplo, los pesos de 10 personas (en kilogramos) se miden en 70, 62, 65, 72, 80, 70, 63, 72, 77 y 79. Entonces, el peso medio de las diez personas (en kilogramos) puede ser calculado de la siguiente manera. La suma de los pesos es 70 + 62 + 65 + 72 + 80 + 70 + 63 + 72 + 77 + 79 = 710. Media = (suma) / (número de datos) = 710/10 = 71 (en kilogramos).

Como en este ejemplo particular, el valor medio de un conjunto de datos puede no ser un punto de datos del conjunto, pero será único para un conjunto de datos determinado. La media tendrá las mismas unidades que los datos originales. Por lo tanto, se puede marcar en el mismo eje que los datos y se puede usar en las comparaciones. Además, no hay restricción de signo para la media de un conjunto de datos. Puede ser negativo, cero o positivo, ya que la suma del conjunto de datos puede ser negativa, cero o positiva.

¿Qué es la desviación estándar??

La desviación estándar es el índice de dispersión más utilizado. Para calcular la desviación estándar, primero se calculan las desviaciones de los valores de los datos de la media. La media cuadrática de las desviaciones se llama desviación estándar..

En el ejemplo anterior, las desviaciones respectivas de la media son (70 - 71) = -1, (62-71) = -9, (65-71) = -6, (72-71) = 1, (80- 71) = 9, (70-71) = -1, (63-71) = -8, (72-71) = 1, (77-71) = 6 y (79-71) = 8. La suma de cuadrados de desviación es (-1) 2+ (-9)2+ (-6)2+ 12+92+ (-1)2+ (-8)2+ 12+ 62 + 82 = 366. La desviación estándar es √ (366/10) = 6.05 (en kilogramos). A partir de esto, se puede concluir que la mayoría de los datos está en el intervalo de 71 ± 6.05, siempre que el conjunto de datos no esté muy sesgado, y de hecho lo es en este ejemplo particular.

Como la desviación estándar tiene las mismas unidades que los datos originales, nos da una medida de cuán desviados están los datos del centro; Cuanto mayor es la desviación estándar mayor es la dispersión. Además, la desviación estándar será un valor no negativo independientemente de la naturaleza de los datos en el conjunto de datos.

¿Cuál es la diferencia entre la desviación estándar y la media??

• La desviación estándar es una medida de la dispersión desde el centro, mientras que la media mide la ubicación del centro de un conjunto de datos.

• La desviación estándar siempre es un valor no negativo, pero la media puede tomar cualquier valor real.