6/6/15

VARIANZA Y DESVIACION ESTANDAR



Varianza

La varianza es una medida de dispersión relativa a algún punto de referencia. Ese punto de referencia es la media aritmética de la distribución. Más específicamente, la varianza es una medida de que tan cerca, o que tan lejos están los diferentes valores de su propia media aritmética. Cuando más lejos están las Xi de su propia media aritmética, mayor es la varianza; cuando más cerca estén las Xi a su media menos es la varianza. Dado un conjunto de observaciones, tales como X1, X2, …, Xn, la varianza denotada usualmente por la letra minúscula griega σ (sigma) elevada al cuadrado (σ²)y en otros casos S².

La varianza mide qué tan estrecha o ampliamente dispersos están los números alrededor del promedio. De esta manera, una varianza grande significa que los datos están más alejados del promedio, y una varianza más reducida significa que están agrupados más cerca alrededor del promedio. La varianza es el promedio de las diferencias cuadradas (o desviaciones) de cada número con respecto al promedio.

Desviación estándar

La desviación estándar (σ) mide cuánto se separan los datos. Es una medida de la cantidad típica en la que los valores del conjunto de datos difieren de la media. Es la medida de dispersión más utilizada, se le llama también desviación típica. La desviación estándar siempre se calcula con respecto a la media y es un mínimo cuando se estima con respecto a este valor.
Se calcula de forma sencilla, si se conoce la varianza, por cuanto que es la raíz cuadrada positiva de esta. A la desviación se le representa por la letra minúscula griega "sigma" (σ), o por la letra S

La desviación estándar es una especie de índice de variabilidad, porque es proporcional a la dispersión de los datos. Entre más diversa sea la distribución (es decir, cuando los datos están dispersos más ampliamente), más grande será la desviación estándar, mientras que entre menos diversa sea la distribución (es decir, cuando los datos están agrupados o muy juntos), más pequeña será la desviación estándar. La desviación estándar es muy útil para entender el grado de dispersión de una variable. Para la mayoría de los datos distribuidos normalmente, generalmente casi todos los valores estarán dentro de tres desviaciones estándar del promedio, a esto algunas veces se le conoce como la regla del 68-95-99.7, cerca del 68.27% de los valores están dentro de 1 desviación estándar del promedio (la media) De manera similar, aproximadamente el 95.45% de los valores se encuentran dentro de 2 desviaciones estándar de la media. Casi todos (99.73%) los valores están dentro de 3 desviaciones estándar de la media.

En la  siguiente tabla se pueden identificar la definición de varianza y desviación estándar para poblaciones y muestras:




Ejemplos: 1, 2, 3, 4.

Fuentes: 1, 2, 3, 4, 5.

No hay comentarios:

Publicar un comentario