Sota, caballo y rey: el contraste de hipótesis

A diario nos enfrentamos a multitud de situaciones en las que siempre actuamos de la misma manera. Decimos que vamos a sota, caballo y rey. Y esto es bueno, porque se supone que este tipo de actuaciones nos salen de forma rutinaria, sin tener que pensar en ellas.

contraste de hipótesis

A diario nos enfrentamos a multitud de situaciones en las que siempre actuamos de la misma manera. Decimos que vamos a sota, caballo y rey. Y esto es bueno, porque se supone que este tipo de actuaciones nos salen de forma rutinaria, sin tener que pensar en ellas.

El problema es que para hacer una cosa a sota, caballo y rey tenemos que comprender bien cómo hacerla. De lo contrario podemos hacer cualquier cosa menos lo que pretendemos.

Un ejemplo es el contraste de hipótesis. Siempre es lo mismo: sota, caballo y rey. Y, sin embargo, al principio nos parece algo más complicado de lo que realmente es. Porque, con independencia del contraste que estemos haciendo, los pasos a seguir son siempre los mismos: establecer nuestra hipótesis nula, seleccionar el estadí­stico adecuado para cada situación, utilizar las distribución de probabilidad correspondiente para calcular la probabilidad de ese valor del estadí­stico que hemos empleado y, según este valor de probabilidad, decidirnos en favor de la hipótesis nula o de la alternativa. Vamos a analizar estos pasos uno a uno y utilizando un ejemplo concreto para comprenderlos mejor.

Supongamos que hemos medido la altura de 25 niños de una clase de un colegio y hemos obtenido las tallas que se muestran en la tabla. Si lo calculáis, la media de talla de nuestro grupo es de 135,4 cm, con una desviación estándar de 2,85 cm. Ahora resulta que hay un estudio previo a nivel de toda la provincia en la que se estima una talla de 138 para los niños de la edad de nuestra clase. La pregunta que nos planteamos es la siguiente: ¿son nuestros niños más bajos que la media o la diferencia se debe al azar de muestreo? Ya tenemos nuestro contraste de hipótesis.

contraste de hipótesis
contraste-hipotesis

Lo primero, establezcamos la hipótesis nula y la alternativa. Como ya sabemos, cuando hacemos un contraste de hipótesis podemos rechazar la hipótesis nula si el estadí­stico del contraste tiene una determinada probabilidad. Lo que no podemos hacer nunca es aceptarla, solo rechazarla. Por eso se plantea habitualmente la hipótesis nula como lo contrario a lo que queremos demostrar, para poder rechazar lo que no queremos demostrar y aceptar lo que sí­ queremos demostrar.

En nuestro caso vamos a plantear la hipótesis nula de que la talla de nuestros alumnos es igual a la de la media de la provincia y que la diferencia encontrada es debida al error de muestreo, al puro azar. Por otra parte, la hipótesis alternativa plantea que sí­ existe una diferencia y que nuestros niños son más bajos.

Una vez planteadas la hipótesis nula y alternativa tenemos que elegir el estadí­stico adecuado para este contraste de hipótesis. Este caso es uno de los más sencillos, el de comparación de dos medias, la nuestra y la de la población. En este caso, nuestra media estandarizada respecto a la de la población sigue una distribución t de Student, según la siguiente fórmula que me vais a permitir:

t = (media del grupo ““ media de población) / error estándar de la media

Así­ que sustituimos la media por nuestro valor (135,4 cm), la media poblacional por 138 y el error estándar por su valor (la desviación estándar dividida por la raí­z cuadrada del tamaño muestral) y obtenemos un valor de t de -4,55.

Ahora tenemos que calcular la probabilidad de que t sea igual a -4,55. Si pensamos un poco veremos que en el caso de que las dos medias fuesen iguales t tendrí­a un valor de cero. Cuánto más distintas sean, más se alejará el valor de t del cero. Nosotros queremos saber si esta desviación, de cero a -4,55, se debe al azar. Para ello calculamos la probabilidad de que t valga -4,55 utilizando una tabla de la distribución de la t de Student o un programa informático, obteniendo un valor de p = 0,0001.

Ya tenemos el valor de p, así­ que solo nos queda el último paso, ver si podemos rechazar la hipótesis nula. El valor de p nos indica la probabilidad de que la diferencia observada entre las dos medias se deba al azar. Como es menor de 0,05 (menor del 5%), nos sentimos lo suficientemente seguros como para decir que no es debida al azar (o, al menos, es muy improbable), así­ que rechazamos la hipótesis nula de que la diferencia se debe al azar y abrazamos la hipótesis alternativa de que las dos medias son realmente diferentes. Conclusión: nos ha tocado la clase de los más canijos de la provincia.

Y esto es todo respecto al contraste de hipótesis de igualdad de dos medias. En este caso hemos hecho una prueba de la t de Student para una muestra, pero lo importante es que os fijéis en la dinámica del contraste de hipótesis. Siempre es la misma: sota, caballo y rey. Lo que cambia, lógicamente, es el estadí­stico y la distribución de probabilidad que usamos en cada ocasión.

Para terminar solo me queda llamar vuestra atención sobre otro método que podrí­amos haber utilizado para saber si las muestra son diferentes. Este no es más que recurrir a nuestros queridos intervalos de confianza. Podrí­amos haber calculado el intervalo de confianza de nuestra media y ver si incluí­a la media de la población, en cuyo caso habrí­amos concluido que eran similares. Si la media poblacional hubiese estado fuera del intervalo, habrí­amos rechazado la hipótesis nula, llegando lógicamente a la misma conclusión. Pero esa es otra historia…

Para saber más:

Tests of statistical significance. Peacock JL, Peacock PJ eds. Oxford Handbook of Medical Statistics. Oxford University Press. Oxford, New York, 2011: 246-7.

Artí­culo publicado en colaboración con Ciencia sin seso… locura doble

Manuel Molina Arias
Servicio de Gastroenterologí­a Pediátrica
Hospital Universitario La Paz. Madrid
Written By
More from AnestesiaR

4 Comments

  • Creo que hay un error metodológico en el procedimiento. Primero se han cogido los datos, se ha visto la media ¡muestral! y como ha salido inferior a un valor dado (el promedio provincial), se plantea la hipótesis alternativa de que la media de nuestros datos (la poblacional) es inferior a la media provincial. Me parece que el error está en plantear la hipótesis basándonos (al menos en parte) en los mismos datos que luego utilizamos para realizar el contraste.
    El proceso deberí­a ser, en mi humilde opinión, el siguiente:
    1. Tenemos un grupo de jóvenes y creemos que son bajitos. Planteamos una hipótesis nula, que son tan bajitos como los demás, frente a la alternativa, que en efecto son más bajitos que los jóvenes de la provincia.
    2. Tomamos la muestra para contrastar la hipótesis.
    3. Realizamos el contraste.
    ¿Razones por la que podemos creer en el punto 1 que son bajitos? Por pura observación nuestra o, por ejemplo, por datos previos. Pero en ese último caso los datos que tomemos para el contraste no deben incluir ser esos datos previos.

  • Yo creo que hay más de un error, lo siento. En el texto se habla de un contraste para diferencia de medias, en principio eso es falso, sólo hay una media, la de la población. O si prefieres, deja claro que estás comparando las alturas de dos grupos de niños, y antes de hacer este test, debes comprobar que las varianzas son iguales para los dos grupos (o al menos suponerlo). Ademas, leo que se plantea la probabilidad de que el estadí­stico de contraste valga un número concreto, eso ya es cero por definición de variable continua. Lo siento, estas cartas de sota, caballo y rey está bastante mal jugadas, me temo :(
    Además, tal como se plantea el contraste «igual» frente a «distinto» nunca se podrá concluir que los niños de la clase son mas bajos, como mucho se podrí­a decir que no son igual de altos, pero nada más.

  • Most have been wonderful & stagnre, seeing your words in a language that is stagnre to you. Funnily enough I’ve been promoting a Serbian poetry Comp, on my blog.

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *



Este sitio usa Akismet para reducir el spam. Aprende cómo se procesan los datos de tus comentarios.