Media, Mediana y Moda de un Conjunto de Datos

Se presentan ejemplos con soluciones detalladas sobre cómo encontrar la media, mediana y moda de conjuntos de números reales. La media, la mediana y la moda son medidas estadísticas de tendencia central que, en un conjunto de datos bien distribuido, resumen todo el conjunto con un solo valor. Estas tres medidas son fáciles de entender y usar para comparar conjuntos de datos.
También se definen y discuten los valores atípicos (outliers) y sus efectos en la media, mediana y moda a través de ejemplos con soluciones.
Se incluyen calculadoras en línea para calcular la Media, la Mediana y la Moda.


Media de un Conjunto de Datos

La media aritmética (o promedio) de un conjunto de datos se define como la suma de todos los valores del conjunto dividida por el número de valores. Si x1, x2, x3 ... xN son los valores en un conjunto de datos, la media μ está dada por la fórmula:
  \[ \mu = \frac{\sum_{i=1}^{N} x_i}{N} \]
Ejemplo 1
En un examen de matemáticas, los estudiantes de la clase A obtuvieron las siguientes puntuaciones: 55, 72, 96, 92, 87, 52, 92, 45, 58, 77, 86, 80 y los estudiantes de la clase B obtuvieron: 55, 67, 75, 95, 82, 86, 38, 90, 42, 56, 82, 96. ¿Cuál es la puntuación media (promedio) de cada clase? Usa las dos medias para comparar el rendimiento de las dos clases.
Solución del Ejemplo 1
Hay 12 puntuaciones en la clase A, por lo tanto N = 12. Usa la fórmula para calcular la media de la clase A de la siguiente manera:
  \[ \mu_A = \frac{55 + 72 + 96 + 92 + 87 + 52 + 92 + 45 + 58 + 77 + 86 + 80}{12} = 74.3 \] Hay 12 puntuaciones en la clase B, por lo tanto N = 12. Usa la fórmula para calcular la media de la clase B de la siguiente manera:
  \[ \mu_B = \frac{55 + 67 + 75 + 95 + 82 + 86 + 38 + 90 + 42 + 56 + 82 + 96}{12} = 72 \] La media (promedio) de la clase A es más alta que la media de la clase B. En promedio, la clase A "rindió" mejor que la clase B, pero si examinamos los dos conjuntos de puntuaciones, no todos los estudiantes de la clase A obtuvieron una puntuación más alta que todos los estudiantes de la clase B.
Para cualquier conjunto de datos, la media es mayor que el valor más pequeño y menor que el valor más grande. En la clase A, la puntuación más baja es 55 y la más alta es 96, y la media es 74.3. En la clase B, la media es 72 y las puntuaciones más baja y más alta son 55 y 96, respectivamente.


Mediana de un Conjunto de Datos

La mediana de un conjunto de datos es el valor del medio después de ordenar los datos dados. Si el número N de valores de datos es impar, la mediana es el valor del medio, y si N es par, la mediana es el promedio de los dos valores del medio.

Ejemplo 2
Las alturas, en centímetros, de un grupo de 11 niños de diferentes edades son las siguientes: 110, 105, 126, 65, 134, 102, 78, 80, 119, 67, 88. ¿Cuál es la altura mediana de este grupo de niños?
Solución del Ejemplo 2
Primero ordenamos los datos dados de menor a mayor altura.
65, 67, 78, 80, 88, 102, 105, 110, 119, 126, 134
Hay un total de 11 valores de datos y el del medio es la mediana, que es igual a 102. Aproximadamente el 50% de los valores de datos son menores que la mediana (102) y cerca del 50% son mayores que la mediana.

Ejemplo 3
Los pesos, en kilogramos, de un grupo de 12 hombres son los siguientes: 110, 82, 99, 70, 77, 87, 78, 80, 102, 79, 88, 95. ¿Cuál es el peso mediano de este grupo de hombres?
Solución del Ejemplo 3
Primero ordenamos los datos dados de menor a mayor peso.
70, 77, 78, 79, 80, 82, 87, 88, 95, 99, 102, 110
Hay un total de 12 valores de datos y el promedio de los dos valores del medio, 82 y 87, es la mediana, que es igual a (82 + 87) / 2 = 84.5. Exactamente el 50% de los valores de datos son menores que la mediana (84.5) y el 50% son mayores que la mediana.


Moda de un Conjunto de Datos

La moda de un conjunto de datos es el valor que ocurre con la mayor frecuencia.

Ejemplo 4
En un examen, los estudiantes de una clase obtuvieron las siguientes puntuaciones: 45, 67, 95, 89, 88, 40, 90, 88, 56, 78, 88, 76. ¿Cuál es la moda de las puntuaciones dadas?
Solución del Ejemplo 4
Primero ordenamos las puntuaciones dadas de menor a mayor.
40, 45, 56, 67, 76, 78, 88, 88, 88, 89, 90, 95
Buscamos el valor que ocurre con más frecuencia, que en este ejemplo es 88.


Ejemplo 5
Se preguntó a un grupo de personas sobre el número de hermanos y hermanas que tenían y respondieron lo siguiente: 2, 3, 3, 4, 4, 3, 2, 3, 4, 5, 2, 4, 2. ¿Cuál es la moda de este conjunto de datos?
Solución del Ejemplo 5
Primero ordenamos los datos dados de menor a mayor.
2, 2, 2, 2, 3, 3, 3, 3, 4, 4, 4, 4, 5
Hay tres valores de datos que ocurren cuatro veces cada uno y, por lo tanto, tienen la misma frecuencia de ocurrencia. Este conjunto de datos tiene 3 modas: 2, 3 y 4.


La Media, Mediana y Moda son Medidas de Tendencia Central

La Media, Mediana y Moda son cantidades de un solo valor que tienden a describir el centro de un conjunto de datos. Para un conjunto de datos donde los valores están cerca unos de otros, las tres cantidades tienden a estar cerca en valor y describen el valor central típico.

Ejemplo 6
Un estudiante obtuvo las siguientes puntuaciones en sus cuestionarios de matemáticas: 89, 90, 92, 96, 91, 93 y 92. Encuentra la media, mediana y moda de estas puntuaciones.
Solución del Ejemplo 6

Media \[ \text{media} = \frac{89 + 90 + 92 + 96 + 91 + 93 + 92}{7} = 91.9 \] Mediana
Ordenamos los datos de menor a mayor:
89, 90, 91, 92, 92, 93, 96
La mediana es el valor ubicado en el medio y es igual a 92.
Moda
89, 90, 91, 92, 92, 93, 96
La moda es el valor que más se repite y es igual a 92.
Para este conjunto de datos, podemos usar cualquiera de las tres medidas de tendencia central (media, mediana o moda) para describir un valor central típico porque están cerca en valor. Sin embargo, este no es siempre el caso. Los conjuntos de datos con valores atípicos pueden tener sus tendencias centrales afectadas, como veremos en los siguientes ejemplos.


Valores Atípicos y sus Efectos en las Medidas de Tendencia Central

Los valores atípicos (outliers) son valores extremadamente bajos o extremadamente altos en un conjunto de datos. Pueden afectar a la media, mediana o moda.

Ejemplo 7
Un estudiante obtuvo las siguientes puntuaciones en sus cuestionarios de matemáticas: 0, 90, 88, 96, 92, 88 y 95. Responde las siguientes preguntas:
a) ¿Qué puntuación puede considerarse un valor atípico?
b) Calcula la media, mediana y moda con y sin el valor atípico y decide qué medida de tendencia central describe mejor una puntuación central típica.
Solución del Ejemplo 7
a) La puntuación más baja, 0, puede considerarse un valor atípico porque es mucho más baja que la siguiente puntuación más alta de 88.
b) Con el valor atípico 0, las puntuaciones son: 0, 90, 88, 96, 92, 88, 95
media = 78.4, mediana = 90, moda = 88
Sin el valor atípico 0, las puntuaciones son: 90, 88, 96, 92, 88, 95
media = 91.5, mediana = 91, moda = 88
El valor atípico 0 tiende a afectar a la media, ya que la diferencia entre las medias con (78.4) y sin (91.5) el valor atípico es relativamente grande. Por lo tanto, la mediana y la moda describirían mejor una puntuación típica de este estudiante.


Dispersión de Datos y sus Efectos en las Medidas de Tendencia Central

Los datos pueden considerarse dispersos si los valores están lejos del valor promedio (media) de todo el conjunto. Las medidas de tendencia central pueden no ser suficientes o incluso a veces adecuadas para describir un valor central típico.

Ejemplo 8
Una clase obtuvo las siguientes puntuaciones en un examen: 96, 20, 20, 45, 40, 32, 97, 100, 98, 45, 90, 35, 91.
Calcula la media, mediana y moda, y decide qué medida de tendencia central describe mejor la puntuación central típica.
Solución del Ejemplo 8
media = 62.2, mediana = 45, moda = 20
Las puntuaciones están muy dispersas, con algunas puntuaciones mucho más bajas que la media y otras más altas que la media. Esto ha afectado mucho a la moda y, en cierta medida, a la mediana. La media, mediana y moda difieren en valor porque las puntuaciones están dispersas, con la puntuación más baja de 20 y la más alta de 100. La media puede, en esta situación, usarse como medida de tendencia central, pero la moda de 20 definitivamente no es una puntuación central típica.
La desviación estándar es una medida de la dispersión de los valores de datos alrededor de la media.


Más Enlaces y Referencias