Medidas de Centralización

Teoría Ejercicios

Introducción a las Medidas de Centralización

Las medidas de centralización, también llamadas medidas de tendencia central, son valores numéricos que intentan describir el punto alrededor del cual se agrupan los datos en un conjunto. Indican un valor "típico" o "central" de la distribución. Las más comunes son la moda, la mediana y la media aritmética.

Moda (Mo)

La moda es el valor que aparece con mayor frecuencia en un conjunto de datos.

Un conjunto de datos puede ser amodal (sin moda), unimodal (una moda), bimodal (dos modas), o multimodal (varias modas).
Es la única medida de centralización que se puede utilizar para datos cualitativos nominales.
No se ve afectada por valores extremos.

Ejemplo (datos no agrupados):

Para el conjunto {"{2, 3, 3, 4, 5, 5, 5, 6}"}, la moda es 5, ya que es el valor que más se repite.

Para el conjunto {"{rojo, azul, verde, azul, rojo, azul}"}, la moda es azul.

Cálculo para datos agrupados:

Para datos agrupados en intervalos, la moda se encuentra en el intervalo con la mayor frecuencia (intervalo modal). Se puede estimar con la fórmula:

\(Mo = L_i + \left( \frac{f_i - f_{i-1}}{(f_i - f_{i-1}) + (f_i - f_{i+1})} \right) \cdot A_i\)

Donde:

\(L_i\) = Límite inferior del intervalo modal.
\(f_i\) = Frecuencia absoluta del intervalo modal.
\(f_{i-1}\) = Frecuencia absoluta del intervalo anterior al modal.
\(f_{i+1}\) = Frecuencia absoluta del intervalo posterior al modal.
\(A_i\) = Amplitud del intervalo modal.

Mediana (Me)

La mediana es el valor que ocupa la posición central cuando los datos están ordenados de menor a mayor (o viceversa). Divide el conjunto de datos en dos partes iguales: el 50% de los datos son menores o iguales a la mediana, y el otro 50% son mayores o iguales.

Para calcularla, primero se deben ordenar los datos.
Si el número de datos (n) es impar, la mediana es el valor que se encuentra exactamente en el centro: \( \text{Posición} = \frac{n+1}{2}\).
Si el número de datos (n) es par, la mediana es el promedio de los dos valores centrales: \( \text{Posiciones} = \frac{n}{2} \text{ y } \frac{n}{2} + 1\).
La mediana es menos sensible a valores extremos (outliers) que la media.

Ejemplo (datos no agrupados):

Para el conjunto {"{7, 2, 5, 1, 9}:"}

Ordenamos: {"{1, 2, 4, 5, 7, 9}"}
n = 5 (impar). Posición = (5+1)/2 = 3. La mediana es el 3er valor: 5.

Para el conjunto {"{7, 2, 5, 1, 9, 4}:"}

Ordenamos: {"{1, 2, 4, 5, 7, 9}"}
n = 6 (par). Posiciones = 6/2=3 y 6/2+1=4. La mediana es el promedio del 3er y 4º valor: (4+5)/2 = 4.5.

Cálculo para datos agrupados:

Primero se identifica el intervalo mediano (donde la frecuencia acumulada alcanza o supera N/2). Luego se aplica la fórmula:

\(Me = L_i + \left( \frac{ \frac{N}{2} - F_{i-1}}{f_i} \right) \cdot A_i\)

Donde:

\(L_i\) = Límite inferior del intervalo mediano.
\(N\) = Número total de datos.
\(F_{i-1}\) = Frecuencia acumulada del intervalo anterior al mediano.
\(f_i\) = Frecuencia absoluta del intervalo mediano.
\(A_i\) = Amplitud del intervalo mediano.

Media Aritmética \(\bar{x}\)

La media aritmética, comúnmente llamada promedio, es la suma de todos los valores dividida por el número total de valores.

\(\bar{x} = \frac{\sum_{i=1}^{n} x_i}{n} = \frac{x_1 + x_2 + ... + x_n}{n}\)

Es la medida de centralización más utilizada.
Utiliza todos los valores del conjunto de datos en su cálculo.
Es sensible a valores extremos (outliers), ya que un valor muy alto o muy bajo puede influir significativamente en el resultado.

Ejemplo (datos no agrupados):

Para el conjunto {"{2, 4, 6, 8}:"}

\(\bar{x} = \frac{2+4+6+8}{4} = \frac{20}{4} = 5\) La media es 5.

Cálculo para datos agrupados:

Se utiliza la marca de clase (\(x_{mc}\)) de cada intervalo:

\(\bar{x} = \frac{\sum_{i=1}^{k} x_{mc_i} \cdot f_i}{N}\)

Donde:

\(x_{mc_i\) = Marca de clase del intervalo i (punto medio).
\(f_i\) = Frecuencia absoluta del intervalo i.
\(N\) = Número total de datos.
\(k\) = Número de intervalos.

Comparación de Media, Mediana y Moda

Característica	Media	Mediana	Moda
Definición	Promedio aritmético	Valor central (datos ordenados)	Valor más frecuente
Cálculo	Suma de valores / N	Posición central	Frecuencia máxima
Afectada por valores extremos	Sí, mucho	No, o muy poco	No
Uso con datos cualitativos	No	Ordinales (a veces)	Sí (nominales y ordinales)
Existencia	Siempre existe y es única	Siempre existe y es única	Puede no existir o no ser única
Uso de todos los datos	Sí	No (solo los centrales)	No (solo las frecuencias)

¿Cuándo usar cada medida?

Media: Es ideal para datos numéricos con distribuciones simétricas y sin muchos valores atípicos.
Mediana: Es preferible cuando hay valores extremos o la distribución es asimétrica, ya que ofrece una mejor representación del "centro típico". También útil para datos ordinales.
Moda: Es útil para identificar el valor más común o popular. Es la única opción para datos cualitativos nominales y puede ser informativa en distribuciones bimodales o multimodales.

En una distribución perfectamente simétrica, la media, la mediana y la moda coinciden. En distribuciones asimétricas, estas medidas tienden a separarse:

Ejemplo Práctico: Salarios en España

Un ejemplo claro de cómo estas medidas se comportan en datos reales con asimetría es la distribución de salarios en un país. Generalmente, hay muchas personas con salarios más bajos o medios, y unas pocas personas con salarios extremadamente altos. Esto crea una asimetría positiva.

En este tipo de distribuciones:

La media salarial será la más alta, ya que se ve influenciada por los salarios muy elevados de unos pocos.
La mediana salarial (el valor que divide a los trabajadores en dos mitades iguales según su ingreso) será menor que la media, ofreciendo una visión más realista del "salario típico".
La moda salarial (el salario más frecuente) podría ser incluso menor que la mediana, indicando el rango de ingresos más común.

Por ello, al hablar de salarios, la mediana suele ser un indicador más robusto y representativo de la realidad de la mayoría de la población que la media.

Ejemplo Práctico Completo

Consideremos las edades de un grupo de 10 personas: {"{22, 25, 22, 28, 30, 25, 35, 40, 22, 50}"}

Ordenar los datos: {"{22, 22, 22, 25, 25, 28, 30, 35, 40, 50}"}

Moda: El valor 22 aparece 3 veces, más que cualquier otro. Mo = 22 años

Mediana: Hay n=10 datos (par). Los valores centrales son el 5º (25) y el 6º (28). \(Me = \frac{25 + 28}{2} = \frac{53}{2} = 26.5\) años

Media: \(\bar{x} = \frac{22+22+22+25+25+28+30+35+40+50}{10} = \frac{299}{10} = 29.9\) años

En este caso, la media (29.9) es mayor que la mediana (26.5), que a su vez es mayor que la moda (22), lo que sugiere una ligera asimetría positiva (influenciada por valores más altos como 50).

Introducción a las Medidas de Centralización

Moda (Mo)

Mediana (Me)

Media Aritmética \(\bar{x}\)

Comparación de Media, Mediana y Moda

¿Cuándo usar cada medida?

Ejemplo Práctico: Salarios en España

Ejemplo Práctico Completo

📊 Historial de Exámenes

Tutor IA