Manuel Molina Arias
Servicio de Gastroenterología Pediátrica
Hospital Universitario La Paz. Madrid
Existen una serie de medidas robustas de tendencia central. La más conocida es la mediana. Para calcularla, lo primero que tenemos que hacer es ordenar los valores de menor a mayor: 143, 152, 152, 152, 154, 155, 155, 159, 163, 166, 167, 168, 168, 170, 171, 177, 183, 185, 426 y 435. Como son 20 valores, la mediana será el valor promedio de los que ocupan las posiciones décima y undécima (166 y 167), o sea, 166,5. Como veis, más cerca del centro sin necesidad de suprimir los valores extremos.
Además de la mediana, existe una serie de parientes de la media aritmética que pertenecen a la familia de las medidas de tendencia central robustas.
Una de ellas es la media geométrica, que se calcula multiplicando todos los valores y hallando la raíz con exponente n (número de casos). Para los amantes de las fórmulas, ahí va:
En nuestro caso multiplicaríamos 143X152X152…x426x435 y haríamos la raíz de índice 20 del producto. En nuestro caso vale 179,57. El cálculo es un poco engorroso, por eso yo he usado el programa R para calcularla. Hay otra forma de llegar al mismo valor que consiste en hallar los logaritmos neperianos de los valores, calcular su media aritmética y, finalmente, hacer el antilogaritmo del promedio. En cualquier caso, cualquier programa estadístico puede calcular la media geométrica sin pestañear. Esta media es poco utilizada, aunque podemos verla en ocasiones en trabajos sobre Microbiología, ya que algunos de los parámetros que utilizan, como los títulos de las diluciones, siguen una escala logarítmica.
Para aquellos que les haya parecido sencillo lo de la media geométrica tengo preparada la media armónica. Esta se calcula dividiendo el número de observaciones por la suma total del inverso de cada valor. Quizás con la fórmula se entienda mejor:
Haciendo otra vez uso de R, su valor es de 173,36, un valor parecido al anterior. Esta media tampoco es utilizada muy a menudo, aunque a veces podemos encontrarla, sobre todo en trabajos sobre Farmacología.
Mucho más sencilla de calcular es la media recortada. Esta, como su nombre indica, se calcula recortando un determinado porcentaje de la distribución, por sus extremos (la distribución tiene que estar ordenada de menor a mayor). Por ejemplo para calcular la media recortada al 20% de nuestro ejemplo quitaríamos un 10% por cada lado (dos elementos por cada lado: 143, 152, 426 y 435) y calcularíamos la media aritmética con los restantes. Su valor es de 165,31.
Una variante de esta última es la media winsorizada. En vez de eliminar los valores, los sustituiríamos por los valores más próximos sin eliminar. En nuestro caso 143 y 152 se sustituirían por 152 y 426 y 435 por 185. Su valor es de 165,95.
Quizás el miembro de esta robusta familia que se utiliza con más frecuencia, después de la mediana, sea la media ponderada. A cada elemento se le atribuye un peso determinado (w) y, para calcular la media ponderada, se suman los productos de cada valor por su peso y se divide el total por la suma de pesos. La fórmula es la siguiente:
Vamos a calcular una media ponderada inventada de los valores de presión arterial en la que el peso para la sistólica vale 20 y para la diastólica 10. Si los valores de sistólica y diastólica son 120 y 60, respectivamente, la media ponderada valdría
Una especie de media ponderada es la que se conoce con el nombre de trimedia. Esta se calcula como la media aritmética de los tres cuartiles (primero, mediana y tercero), ponderando la mediana por dos y los cuartiles primero y tercero por uno (la suma se divide por cuatro). En nuestro ejemplo del colesterol el primer cuartil vale 154,8, la mediana 166,5 y el tercer cuartil 172,5, así que la trimedia es igual a
Y aquí lo vamos a dejar por hoy. Veis que las primas robustas de la media aritmética forman una gran familia. Pero no penséis que hemos hablado de todos los miembros de esta familia. Existen muchos otros cuya estadística es bastante más antipática, pero que podemos calcular con la mayoría de los paquetes informáticos. Son, por ejemplo, los estimadores R de tendencia y los estimadores M de tendencia, como el de Huber, el biponderado de Tukey, el redescendente de Hampel, el de Andrew, etc., etc. Pero esa es otra historia…
Qué bonita forma de explicar este tema. Un saludo desde Colombia.
Muchas gracias Verónica. Me alegra que te guste.