La desviación estándar es la tendencia de los datos a diferir de la media y entre sí. La media, la mediana y la moda estiman el punto medio de los datos, pero la desviación estándar indica cuánto se dispersan los datos.
Nuestro objetivo es encontrar una manera de medir la tendencia de los datos a divergir. Podríamos haber tomado simplemente la media de las diferencias entre la media y cada número, pero su comportamiento no es el que queremos. Considere 3, −2, −1 cuya media de diferencias es 0. Si usamos valores absolutos, puede dar el mismo resultado para múltiples conjuntos de datos que pueden no estar igualmente divergentes.
Si usamos el cuadrado de las diferencias. Tiene dos beneficios.
- x 2 sigue siendo positivo para todos los valores. (función par)
- El valor de x 2 aumenta más rápido para valores mayores. Por tanto, si los datos tienen más puntos en los extremos, la media de x 2 será mayor.
La media de las diferencias al cuadrado se llama varianza y el valor de la varianza puede ir más allá del rango de los datos. Entonces, tomamos la raíz cuadrada de la varianza que nos da la desviación estándar cuyo valor permanece en el rango.
Fórmula y Cálculo
La desviación estándar es la raíz cuadrada de la varianza.
$$ \sigma=\ \sqrt{\frac{\sum _ {\text{i}=\text{1}}^{\text{n}}{(\text{x} _ \text{i}- \ \mu)}^\text{2}}{\text{n}}} $$
Donde μ es la media y n es el número de valores.
Desglosando la fórmula, la desviación estándar se puede calcular en los siguientes pasos.
- Calcular la media.
- Averigüe el cuadrado de las diferencias entre los números y la media. (x yo – μ) 2
- Encuentre la varianza que es la media de (x i − μ) 2 para todos los valores.
- Averigüe la desviación estándar tomando la raíz cuadrada de la varianza.
Desviación estándar de la muestra frente a la población
Hay dos tipos de desviación estándar que son el resultado de las precauciones al trabajar con datos de muestra. Los tipos son Muestra y Desviación estándar de población. Para la desviación estándar de la muestra, usamos n-1 o n-2 en lugar de n al dividir la media de las diferencias. Esto aumenta el valor de la desviación estándar, lo cual es bueno mientras se trabaja en una parte de los datos originales.
Ejemplo de fórmula de desviación estándar:
$$ \sigma=\ \sqrt{\frac{\sum _ {\text{i}=\text{1}}^{\text{n}}{(\text{x} _ \text{i}- \ \mu)}^\text{2}}{\text{n}-\text{1}}} $$
o
$$ \sigma=\ \sqrt{\frac{\sum _ {\text{i}=\text{1}}^{\text{n}}{(\text{x} _ \text{i}- \ \mu)}^\text{2}}{\text{n}-\text{2}}} $$
Ejemplo
La siguiente tabla muestra el precio de las acciones de Google. Calculemos la desviación estándar del precio de la acción para saber cuánto puede variar.
Fecha | Precio de las acciones ($) |
Retorno (%) |
Diferencia (x i −μ) |
Diferencias al cuadrado (x i −μ) 2 |
---|---|---|---|---|
01/01/2017 | 796.79 | 0.03 | -150.32 | 22.596,34 |
02/01/2017 | 823.21 | 0.01 | -123.90 | 15.351,40 |
03/01/2017 | 829.56 | 0.09 | -117.55 | 13.818,18 |
04/01/2017 | 905.96 | 0.07 | -41.15 | 1.693,38 |
05/01/2017 | 964.86 | -0.06 | 17.75 | 315.03 |
01/06/2017 | 908.73 | 0.02 | -38.38 | 1,473.08 |
07/01/2017 | 930.50 | 0.01 | -16.61 | 275.92 |
01/08/2017 | 939.33 | 0.02 | -7.78 | 60.54 |
09/01/2017 | 959.11 | 0.06 | 12.00 | 143.98 |
01/10/2017 | 1,016.64 | 0.00 | 69.53 | 4,834.32 |
01/11/2017 | 1,021.41 | 0.02 | 74.30 | 5.520,37 |
01/12/2017 | 1,046.40 | 0.12 | 99.29 | 9,858.36 |
01/01/2018 | 1,169.94 | 222.83 | 49.652,87 |
Paso 1: Media del precio de las acciones = 947,11
Paso 2: Calcular (xi−μ) 2
Paso 3: Media de las diferencias al cuadrado (x i −μ) 2 también conocida como varianza = 9661
Paso 4: Desviación estándar (raíz cuadrada de la varianza) = 98,29
Entonces dice que el precio de las acciones puede variar hasta $ 98.29 desde la media. Puede ver que la varianza no se puede usar como $ 9661 ya que su valor no está en el rango de los datos y no se puede analizar fácilmente.
Considerando los datos anteriores como una muestra, la desviación estándar será 102.3.
Temas relacionados
- Diferencia