Cargando historial...
Introducción a las Medidas de Centralización
Las medidas de centralización, también llamadas medidas de tendencia central, son valores numéricos que intentan describir el punto alrededor del cual se agrupan los datos en un conjunto. Indican un valor "típico" o "central" de la distribución. Las más comunes son la moda, la mediana y la media aritmética.
Moda (Mo)
La moda es el valor que aparece con mayor frecuencia en un conjunto de datos.
- Un conjunto de datos puede ser amodal (sin moda), unimodal (una moda), bimodal (dos modas), o multimodal (varias modas).
- Es la única medida de centralización que se puede utilizar para datos cualitativos nominales.
- No se ve afectada por valores extremos.
Para el conjunto {"{2, 3, 3, 4, 5, 5, 5, 6}"}, la moda es 5, ya que es el valor que más se repite.
Para el conjunto {"{rojo, azul, verde, azul, rojo, azul}"}, la moda es azul.
Cálculo para datos agrupados:Para datos agrupados en intervalos, la moda se encuentra en el intervalo con la mayor frecuencia (intervalo modal). Se puede estimar con la fórmula:
\(Mo = L_i + \left( \frac{f_i - f_{i-1}}{(f_i - f_{i-1}) + (f_i - f_{i+1})} \right) \cdot A_i\)
Donde:
- \(L_i\) = Límite inferior del intervalo modal.
- \(f_i\) = Frecuencia absoluta del intervalo modal.
- \(f_{i-1}\) = Frecuencia absoluta del intervalo anterior al modal.
- \(f_{i+1}\) = Frecuencia absoluta del intervalo posterior al modal.
- \(A_i\) = Amplitud del intervalo modal.
Mediana (Me)
La mediana es el valor que ocupa la posición central cuando los datos están ordenados de menor a mayor (o viceversa). Divide el conjunto de datos en dos partes iguales: el 50% de los datos son menores o iguales a la mediana, y el otro 50% son mayores o iguales.
- Para calcularla, primero se deben ordenar los datos.
- Si el número de datos (n) es impar, la mediana es el valor que se encuentra exactamente en el centro: \( \text{Posición} = \frac{n+1}{2}\).
- Si el número de datos (n) es par, la mediana es el promedio de los dos valores centrales: \( \text{Posiciones} = \frac{n}{2} \text{ y } \frac{n}{2} + 1\).
- La mediana es menos sensible a valores extremos (outliers) que la media.
Para el conjunto {"{7, 2, 5, 1, 9}:"}
- Ordenamos: {"{1, 2, 4, 5, 7, 9}"}
- n = 5 (impar). Posición = (5+1)/2 = 3. La mediana es el 3er valor: 5.
Para el conjunto {"{7, 2, 5, 1, 9, 4}:"}
- Ordenamos: {"{1, 2, 4, 5, 7, 9}"}
- n = 6 (par). Posiciones = 6/2=3 y 6/2+1=4. La mediana es el promedio del 3er y 4º valor: (4+5)/2 = 4.5.
Primero se identifica el intervalo mediano (donde la frecuencia acumulada alcanza o supera N/2). Luego se aplica la fórmula:
\(Me = L_i + \left( \frac{ \frac{N}{2} - F_{i-1}}{f_i} \right) \cdot A_i\)
Donde:
- \(L_i\) = Límite inferior del intervalo mediano.
- \(N\) = Número total de datos.
- \(F_{i-1}\) = Frecuencia acumulada del intervalo anterior al mediano.
- \(f_i\) = Frecuencia absoluta del intervalo mediano.
- \(A_i\) = Amplitud del intervalo mediano.
Media Aritmética \(\bar{x}\)
La media aritmética, comúnmente llamada promedio, es la suma de todos los valores dividida por el número total de valores.
\(\bar{x} = \frac{\sum_{i=1}^{n} x_i}{n} = \frac{x_1 + x_2 + ... + x_n}{n}\)
- Es la medida de centralización más utilizada.
- Utiliza todos los valores del conjunto de datos en su cálculo.
- Es sensible a valores extremos (outliers), ya que un valor muy alto o muy bajo puede influir significativamente en el resultado.
Para el conjunto {"{2, 4, 6, 8}:"}
\(\bar{x} = \frac{2+4+6+8}{4} = \frac{20}{4} = 5\) La media es 5.
Cálculo para datos agrupados:Se utiliza la marca de clase (\(x_{mc}\)) de cada intervalo:
\(\bar{x} = \frac{\sum_{i=1}^{k} x_{mc_i} \cdot f_i}{N}\)
Donde:
- \(x_{mc_i\) = Marca de clase del intervalo i (punto medio).
- \(f_i\) = Frecuencia absoluta del intervalo i.
- \(N\) = Número total de datos.
- \(k\) = Número de intervalos.
Comparación de Media, Mediana y Moda
| Característica | Media | Mediana | Moda |
|---|---|---|---|
| Definición | Promedio aritmético | Valor central (datos ordenados) | Valor más frecuente |
| Cálculo | Suma de valores / N | Posición central | Frecuencia máxima |
| Afectada por valores extremos | Sí, mucho | No, o muy poco | No |
| Uso con datos cualitativos | No | Ordinales (a veces) | Sí (nominales y ordinales) |
| Existencia | Siempre existe y es única | Siempre existe y es única | Puede no existir o no ser única |
| Uso de todos los datos | Sí | No (solo los centrales) | No (solo las frecuencias) |
¿Cuándo usar cada medida?
- Media: Es ideal para datos numéricos con distribuciones simétricas y sin muchos valores atípicos.
- Mediana: Es preferible cuando hay valores extremos o la distribución es asimétrica, ya que ofrece una mejor representación del "centro típico". También útil para datos ordinales.
- Moda: Es útil para identificar el valor más común o popular. Es la única opción para datos cualitativos nominales y puede ser informativa en distribuciones bimodales o multimodales.
En una distribución perfectamente simétrica, la media, la mediana y la moda coinciden. En distribuciones asimétricas, estas medidas tienden a separarse:
Ejemplo Práctico: Salarios en España
Un ejemplo claro de cómo estas medidas se comportan en datos reales con asimetría es la distribución de salarios en un país. Generalmente, hay muchas personas con salarios más bajos o medios, y unas pocas personas con salarios extremadamente altos. Esto crea una asimetría positiva.
En este tipo de distribuciones:
- La media salarial será la más alta, ya que se ve influenciada por los salarios muy elevados de unos pocos.
- La mediana salarial (el valor que divide a los trabajadores en dos mitades iguales según su ingreso) será menor que la media, ofreciendo una visión más realista del "salario típico".
- La moda salarial (el salario más frecuente) podría ser incluso menor que la mediana, indicando el rango de ingresos más común.
Por ello, al hablar de salarios, la mediana suele ser un indicador más robusto y representativo de la realidad de la mayoría de la población que la media.
Ejemplo Práctico Completo
Consideremos las edades de un grupo de 10 personas: {"{22, 25, 22, 28, 30, 25, 35, 40, 22, 50}"}
- Ordenar los datos: {"{22, 22, 22, 25, 25, 28, 30, 35, 40, 50}"}
En este caso, la media (29.9) es mayor que la mediana (26.5), que a su vez es mayor que la moda (22), lo que sugiere una ligera asimetría positiva (influenciada por valores más altos como 50).