Media, Mediana y la Forma de los Datos
Cuando escuchas “promedio”, la mayoría de las personas piensa en un solo número. Pero los estadísticos tienen varias formas de describir el centro de un conjunto de datos, y no siempre coinciden. Veamos por qué esto es importante.
Parte 1: La Media — Suma y Divide
La media (promedio aritmético) es probablemente lo primero que aprendiste:
Piensa en ella como el punto de equilibrio de los datos. Si colocaras cada dato como un peso en una recta numérica, la media es el punto donde la recta se equilibraría.
Arrastra los controles deslizantes para colocar cinco puntos de datos y observa cómo se mueve la media:
Cada pico representa un punto de datos. El pico rosa marca la media. Arrastra los controles deslizantes y observa cómo los puntos y la media se mueven juntos en la recta numérica.
Prueba esto: Mantén cuatro puntos agrupados cerca de 5, luego arrastra el Punto 5 hasta 20. ¡Observa cuánto se desplaza la media! Un solo valor extremo puede alejar la media de donde se concentra la mayoría de los datos. Por eso se dice que la media es sensible a los valores atípicos.
Parte 2: La Mediana — El Valor del Medio
La mediana es el valor que queda justo en el centro cuando ordenas los datos de menor a mayor. La mitad de los datos queda por debajo de ella y la otra mitad por encima.
Para cinco puntos, la mediana es simplemente el tercer valor después de ordenar.
Media vs. Mediana: Cuando los datos son simétricos (distribuidos de manera uniforme), la media y la mediana están cerca una de la otra. Cuando los datos están sesgados (jalados hacia un lado por valores extremos), se separan. La mediana resiste a los valores atípicos — se mantiene en su lugar aunque un valor sea extremo. Por eso cosas como el ingreso de los hogares se reportan generalmente usando la mediana en lugar de la media.
Parte 3: Distribuciones Simétricas vs. Sesgadas
No todos los conjuntos de datos tienen la misma forma. La forma de los datos cuenta una historia.
Distribución Normal (Simétrica)
La campana de Gauss es la forma simétrica clásica. La media y la mediana se ubican juntas en el centro:
Arrastra el control de centro para desplazar toda la campana a la izquierda o derecha. Arrastra el control de dispersión para hacerla más ancha (más dispersa) o más estrecha (más concentrada).
Distribución Sesgada a la Derecha
En una distribución sesgada a la derecha, una cola larga se extiende hacia la derecha. Esto ocurre cuando unos pocos valores muy grandes estiran los datos:
Piensa en los ingresos: la mayoría de las personas gana cantidades moderadas, pero unos pocos multimillonarios estiran la cola hacia la derecha. En datos sesgados a la derecha, la media es mayor que la mediana porque la media se deja arrastrar hacia la cola.
Distribución Sesgada a la Izquierda
Una distribución sesgada a la izquierda tiene una cola larga hacia la izquierda:
Piensa en las calificaciones de un examen donde la mayoría de los estudiantes obtiene notas altas pero algunos pocos sacan calificaciones muy bajas. Aquí la media es menor que la mediana.
Regla práctica:
- Simétrica: La media es aproximadamente igual a la mediana
- Sesgada a la derecha: Media > Mediana (la cola jala la media a la derecha)
- Sesgada a la izquierda: Media < Mediana (la cola jala la media a la izquierda)
Parte 4: Dispersión — ¿Qué tan separados están los datos?
Dos conjuntos de datos pueden tener la misma media pero dispersiones muy diferentes. Compara estas dos campanas:
Ambas curvas están centradas en cero, pero la curva más ancha representa datos con mayor variabilidad. La desviación estándar mide esta dispersión — una desviación estándar más grande significa que los datos están más esparcidos respecto a la media.
Desafío: Imagina dos clases que obtuvieron una media de 75 en un examen. La Clase A tiene una desviación estándar de 5, y la Clase B tiene una desviación estándar de 15. ¿Cuál clase tuvo calificaciones más consistentes? (¡Usa los controles deslizantes de arriba para visualizar la respuesta!)
Resumen
| Concepto | ¿Qué te dice? |
|---|---|
| Media | El punto de equilibrio — sensible a valores atípicos |
| Mediana | El valor central — resistente a valores atípicos |
| Simétrica | La media y la mediana están cerca |
| Sesgada | La media se desplaza hacia la cola |
| Desviación estándar | Qué tan dispersos están los datos |
Comprender estas ideas es la base de la estadística. Siempre que veas un conjunto de datos, pregúntate: ¿Dónde está el centro? ¿Qué tan dispersos están? ¿Es simétrico o sesgado? Esas tres preguntas te cuentan la mayor parte de la historia.