Estadística

Media, Mediana y la Forma de los Datos

Cuando escuchas “promedio”, la mayoría de las personas piensa en un solo número. Pero los estadísticos tienen varias formas de describir el centro de un conjunto de datos, y no siempre coinciden. Veamos por qué esto es importante.

Parte 1: La Media — Suma y Divide

La media (promedio aritmético) es probablemente lo primero que aprendiste:

Media=suma de todos los valorescantidad de valores\text{Media} = \frac{\text{suma de todos los valores}}{\text{cantidad de valores}}

Piensa en ella como el punto de equilibrio de los datos. Si colocaras cada dato como un peso en una recta numérica, la media es el punto donde la recta se equilibraría.

Arrastra los controles deslizantes para colocar cinco puntos de datos y observa cómo se mueve la media:

Punto 13
020
Punto 25
020
Punto 37
020
Punto 48
020
Punto 59
020
Media=3+5+7+8+95\text{Media} = \frac{ 3 + 5 + 7 + 8 + 9 }{5}
246810121416182022Pto 1Pto 2Pto 3Pto 4Pto 5Media

Cada pico representa un punto de datos. El pico rosa marca la media. Arrastra los controles deslizantes y observa cómo los puntos y la media se mueven juntos en la recta numérica.

Prueba Esto

Prueba esto: Mantén cuatro puntos agrupados cerca de 5, luego arrastra el Punto 5 hasta 20. ¡Observa cuánto se desplaza la media! Un solo valor extremo puede alejar la media de donde se concentra la mayoría de los datos. Por eso se dice que la media es sensible a los valores atípicos.


Parte 2: La Mediana — El Valor del Medio

La mediana es el valor que queda justo en el centro cuando ordenas los datos de menor a mayor. La mitad de los datos queda por debajo de ella y la otra mitad por encima.

Para cinco puntos, la mediana es simplemente el tercer valor después de ordenar.

Conexión

Media vs. Mediana: Cuando los datos son simétricos (distribuidos de manera uniforme), la media y la mediana están cerca una de la otra. Cuando los datos están sesgados (jalados hacia un lado por valores extremos), se separan. La mediana resiste a los valores atípicos — se mantiene en su lugar aunque un valor sea extremo. Por eso cosas como el ingreso de los hogares se reportan generalmente usando la mediana en lugar de la media.


Parte 3: Distribuciones Simétricas vs. Sesgadas

No todos los conjuntos de datos tienen la misma forma. La forma de los datos cuenta una historia.

Distribución Normal (Simétrica)

La campana de Gauss es la forma simétrica clásica. La media y la mediana se ubican juntas en el centro:

Centro (media)0
-55
Dispersión (desv. est.)1.5
0.54
-10-8-6-4-2246810

Arrastra el control de centro para desplazar toda la campana a la izquierda o derecha. Arrastra el control de dispersión para hacerla más ancha (más dispersa) o más estrecha (más concentrada).

Distribución Sesgada a la Derecha

En una distribución sesgada a la derecha, una cola larga se extiende hacia la derecha. Esto ocurre cuando unos pocos valores muy grandes estiran los datos:

24681012

Piensa en los ingresos: la mayoría de las personas gana cantidades moderadas, pero unos pocos multimillonarios estiran la cola hacia la derecha. En datos sesgados a la derecha, la media es mayor que la mediana porque la media se deja arrastrar hacia la cola.

Distribución Sesgada a la Izquierda

Una distribución sesgada a la izquierda tiene una cola larga hacia la izquierda:

-2246810

Piensa en las calificaciones de un examen donde la mayoría de los estudiantes obtiene notas altas pero algunos pocos sacan calificaciones muy bajas. Aquí la media es menor que la mediana.

Prueba Esto

Regla práctica:

  • Simétrica: La media es aproximadamente igual a la mediana
  • Sesgada a la derecha: Media > Mediana (la cola jala la media a la derecha)
  • Sesgada a la izquierda: Media < Mediana (la cola jala la media a la izquierda)

Parte 4: Dispersión — ¿Qué tan separados están los datos?

Dos conjuntos de datos pueden tener la misma media pero dispersiones muy diferentes. Compara estas dos campanas:

Dispersión de Curva A0.8
0.33
Dispersión de Curva B2
0.33
-8-6-4-22468Curva ACurva B

Ambas curvas están centradas en cero, pero la curva más ancha representa datos con mayor variabilidad. La desviación estándar mide esta dispersión — una desviación estándar más grande significa que los datos están más esparcidos respecto a la media.

Desafío

Desafío: Imagina dos clases que obtuvieron una media de 75 en un examen. La Clase A tiene una desviación estándar de 5, y la Clase B tiene una desviación estándar de 15. ¿Cuál clase tuvo calificaciones más consistentes? (¡Usa los controles deslizantes de arriba para visualizar la respuesta!)


Resumen

Concepto¿Qué te dice?
MediaEl punto de equilibrio — sensible a valores atípicos
MedianaEl valor central — resistente a valores atípicos
SimétricaLa media y la mediana están cerca
SesgadaLa media se desplaza hacia la cola
Desviación estándarQué tan dispersos están los datos

Comprender estas ideas es la base de la estadística. Siempre que veas un conjunto de datos, pregúntate: ¿Dónde está el centro? ¿Qué tan dispersos están? ¿Es simétrico o sesgado? Esas tres preguntas te cuentan la mayor parte de la historia.

Hacer el Examen