Fases del proceso de contraste de hipótesis



Fase 1

Lo primero que tenemos que hacer es formular nuestra hipótesis nula a partir de la hipótesis de investigación o alternativa. 
La hipótesis nula (H0), también llamada la hipótesis de no diferencia, indica que no existen diferencias significativas entre los resultados obtenidos en la práctica y los resultados teóricos, es decir, que no hay relación real entre las variables y que cualquier relación observada es producto del azar, de la casualidad, o debida a fluctuaciones en el muestreo. Así, la hipótesis nula indica que la media de la población A es igual a la de la población B. 
Normalmente se expresa de la siguiente forma, H0: μA = μB 

Es la hipótesis de investigación o alternativa (H1 o Ha) la que afirma que la media de la población es un valor diferente al hipotético. 
Se suele expresar de la siguiente forma, H1: μA ≠ μB 
Por tanto, lo que el investigador pretende mediante la aplicación de pruebas estadísticas al realizar el contraste de hipótesis es probar si la hipótesis nula es verdadera o falsa. 


• Si la hipótesis nula es verdadera, solo hay una posibilidad: μA=μB, por tanto, no hay diferencias estadísticamente significativas entre los grupos y no hay relación real entre las variables. Las posibles diferencias encontradas (sería muy raro que los valores fueran exactamente iguales) son debidas al azar o a características de la muestra, pero no hay relación causa-efecto entre las variables que se analizan. 

• Si la hipótesis nula es falsa, tenemos claro que μA ≠ μB, pero no sabemos si μA < μB o si μA > μB. Para saber cuál es el sentido de la diferencia, es preciso hacer un contraste bilateral o de dos colas (que es el que normalmente hacen por defecto los paquetes estadísticos).




Fase 2

Tras formular la H0 se calcula, mediante el estadístico de contraste más apropiado, la probabilidad de que los resultados observados puedan deberse al azar, es decir, la probabilidad de que, a partir de la población de referencia puedan obtenerse otras dos muestras que presenten unos valores tan diferentes como los observados. Esta probabilidad es la significación estadística (p). 
Un estadístico de contraste de hipótesis o de significación estadística es una medida estandarizada de la discrepancia que hay entre la hipótesis nula y el resultado de la diferencia de medias obtenido en la muestra. Calcula, por tanto, la probabilidad de que los resultados obtenidos en una investigación reflejen un efecto significativo y no sean producto del azar, es decir, calculan el grado de significación estadística o el valor de p.

La elección del test más adecuado para realizar el contraste de hipótesis depende de los objetivos del análisis y de la comprobación de que los datos cumplan un conjunto de supuestos o características, que son: 

- La escala de medida y el tipo de variables, las escalas de medida más precisas permiten aplicar técnicas estadísticas más potentes (por eso se indicaba, al tratar las diferentes escalas de medidas de la variable, que se debe intentar medir las variables de la forma más precisa posible).
 
- La independencia o dependencia de las medidas: debemos tener en cuenta si los datos proceden de participantes independientes (la puntuación de un sujeto no proporciona información sobre la de otro ni condiciona la puntuación de este otro sujeto), en cuyo caso se denominan medidas independientes; o si por el contrario las mediciones se hacen en los mismos participantes en diferentes momentos de tiempo o condiciones diferentes (como en los estudios antes y después). En este caso, se consideran medidas dependientes o relacionadas. 

- El aspecto de la distribución de la variable dependiente: en ciencias de la salud, donde se suele trabajar con muestras grandes (n > 30), y donde las variables que estudiamos generalmente se distribuyen según la curva normal o de Gauss, los datos suelen cumplir los supuestos que permiten la aplicación de contrastes paramétricos. 

Estos supuestos son: 
a) Normalidad y distribución homogénea de las varianzas u homocedasticidad. 
b) Trabajar con una escala de medida de razón o de intervalo. 

En el caso de que estos supuestos no se cumplan, se utilizan los contrastes no paramétricos, que permiten poner a prueba hipótesis no referidas a parámetros poblacionales (en estos casos la distribución de frecuencias de la variable dependiente puede asemejarse a la distribución de Poisson o a la de t de Student).





Fase 3

Basándose en esta probabilidad, se decidirá́ rechazar o no la hipótesis nula. Así́, cuanto menor sea el valor de p, menor será la probabilidad de que los resultados obtenidos se deban al azar y mayor evidencia habrá́ en contra de la hipótesis nula. 

Para decidir si se rechaza o no la H0 debe fijarse previamente un valor de p por debajo del cual se considera que se dispone de la suficiente evidencia contra la H0 para rechazarla. Este valor se denomina valor de significación estadística α, que de forma arbitraria, y por convenio, se fija habitualmente en el 5% (0.05). 

Con los datos obtenidos en el estudio calculamos, con el estadístico de contraste adecuado, el valor de p. 

Si el valor de p obtenido es superior al limite critico, es decir, al valor que facilitan las tablas o la aplicación estadística para ese nivel de confianza, estaríamos en la región crítica y rechazamos la hipótesis nula. Podremos decir, asumiendo ese nivel de confianza, que existen diferencias estadísticamente significativas. 

Si por el contrario el valor de p obtenido es inferior al del limite critico, estaríamos en la región de aceptación. 

En ese caso, aceptamos la hipótesis nula e indicamos que no hay diferencias estadísticamente significativas. 

Cuando la diferencia no es estadísticamente significativa, quiere decir que no se ha encontrado la suficiente evidencia para decir que las medias son diferentes, y los estudios se denominan estudios negativos. 

El valor de p no es una medida de fuerza de asociación. Este valor informa sobre la existencia de una diferencia entre ambos grupos y de la probabilidad de que no se deba al azar, pero no informa sobre la causa de las diferencias. Así, un estudio que obtenga un valor de p<0.001 no quiere decir que la asociación encontrada sea más fuerte que la de otro con una p<0.04, solo quiere decir que es más improbable que el resultado haya sido debido al azar. 

Aunque las hipótesis nulas se aceptan o rechazan con base en los datos de una muestra, las hipótesis se formulan acerca de los valores de la población. Así pues, el interés real de la prueba de hipótesis, como el de toda la inferencia estadística, consiste en formular conclusiones acerca de las relaciones existentes en la población a partir de una muestra.




Comentarios