Varianza es una medida de dispersión. El término viene etimológicamente del vocablo latín variantia, que le da significado a la cualidad de cambiar. Sus raíces son las palabras variare, que se interpreta como cambiar y el sufijo –ia, que da idea de cualidad.

Se trata de un dato que es utilizado en Estadística y en Teoría de la probabilidad y que se logra al elevar al cuadrado una desviación estándar

Varianza, teoría de la probabilidad.
Varianza pertenece al ámbito de la teoría de la probabilidad.

Fue el matemático de Inglaterra Ronald Fisher el encargado de acuñar esta noción, cuando logró dar con la fórmula con la que se puede obtener el resultado de las desviaciones cuadráticas de una variable.

Medidas de dispersión.

La medida de dispersión, dentro de los ámbitos de estudio competentes a la Estadística y la Teoría de la Probabilidad, se entiende como el espectro en el que están distribuidos los datos analizados. Estos datos pueden estar comprimidos o estirados.

Existen varias medidas de dispersión, pero todas se caracterizan por ser números reales no negativos. Además, se entiende que el valor de la medida de dispersión siempre será cero cuando los datos analizados tengan el mismo valor.

Desviación estándar.

La desviación estándar, también conocida como desviación atípica, es un grado de dispersión de los datos en relación al promedio obtenido como resultado. Se trata de un dato importante, pues lo que permite es que podamos obtener de diversos datos el mismo valor promedio.

Un ejemplo de la medida de dispersión, para ayudar a comprenderla mejor:

Edades de un grupo de amigos

  • Grupo 1) 15 16 17 17 18 19 X̅=17
  • Grupo 2) 14 15 15 18 19 21 X̅=17
  • Grupo 3) 13 14 15 17 20 23 X̅=17

Existen 3 grupos de amigos, cada uno de ellos compuesto por 6 personas. Al hacer un relevo sobre el promedio de edad de los tres conjuntos, en todos los casos se coincide en que el promedio es de 17 años. 

Varianza, ejemplos.
Aunque el promedio de las edades sea el mismo, esto no significa que necesariamente todos los datos sean iguales.

Sin embargo, los tres grupos cuentan con diversas características, y es que en todos el grado de dispersión de datos, en este caso la edad, es diverso.

En el grupo 1 el grado de dispersión es menor y el amigo más joven tiene 15 y el más grande 19. En el grupo 2 el grado de dispersión aumenta y vemos al menor con 14 y al mayor con 21, mientras que en el grupo 3 el grado de dispersión es tal que el menor tiene 13 años mientras que el mayor tiene 23.

Los tres grupos poseen el mismo promedio, pero la medida de dispersión de datos revela que son muy diferentes entre sí.

Fórmula para obtener la varianza.

La fórmula para obtener la varianza requiere todos los datos de la población o la muestra. Tomando en cuenta que se simboliza con S cuando se trata de una muestra y con σ (la letra griega sigma en minúscula) cuando se trata de una población, la fórmula para obtener la varianza es la siguiente:

  • S2= ∈(x-X̅)2/n-1 si se trata de una muestra
  • σ2= ∈(x-X̅)2/n si se trata de una población

Esto es leído de la siguiente forma: la muestra al cuadrado es igual a la suma de todos los resultados del cuadrado de los datos, más el promedio dividido el número de datos, menos 1.

En caso de ser una población es la misma fórmula, sin restar 1 al número de datos.

Para lograr resolver este cálculo es importante considerar que la fórmula de promedio es igual a la suma de todos los datos dividida por el número de datos.

La fórmula del promedio, según lo dicho, se ve así: X̅=∈x/n

Fórmula para obtener la desviación estándar.

La fórmula para obtener la desviación estándar surge luego de encontrar el resultado de la varianza.

Varianza, fórmula, desviación estándar.
La fórmula de desviación estándar requiere obtener primero el resultado de la varianza.

Para esto, simplemente se debe pasar el cuadrado del resultado de S (si estamos trabajando con una muestra) o σ (si trabajamos con una población) como raíz.

Al hacer la raíz del resultado de varianza obtenemos el resultado de la desviación estándar.

Otros tipos de medidas.

Otros tipos de medidas, además de la varianza y la desviación estándar, se pueden encontrar en los ámbitos relativos al estudio de la Estadística y la Teoría de la Probabilidad.

En casi todos los casos, el resultado de la medida de dispersión es el mismo tipo de unidad que el dato. Esto quiere decir que si el dato es, como en nuestro ejemplo, las edades dentro de un grupo de amigos, la medida de dispersión será la diferencia de años entre esos jóvenes.

Dentro de las medidas de dispersión se incluyen:

  • El rango;
  • el rango intercuartil
  • la diferencia absoluta de Gini
  • la mediana desviación absoluta
  • la desviación media absoluta

Citar este artículo

Krause, G. (23 de marzo de 2023). Definición de varianza. Medida de dispersión, desviación estándar. Definicion.com. https://definicion.com/varianza/