AEF-PC

P-valor, Azar y Teorema de Bayes
featured image

P-valor, Azar y Teorema de Bayes

El p-valor es un concepto con el que se habrá topado cualquier persona que haya leído un artículo científico.

El p-valor es una probabilidad, pero, ¿la probabilidad de qué?

El Teorema de Bayes puede ayudarnos a responder a esta cuestión.

P-valor, Azar y Teorema de Bayes

La significación estadística (p-valor) es un concepto con el que se habrá topado cualquier persona que haya leído un artículo científico. El p-valor es una probabilidad, pero, ¿la probabilidad de qué?

Podríamos definir la significación estadística o p-valor como la probabilidad de que los datos observados (por ejemplo, la diferencia media de dolor en la EVA entre un grupo control y otro experimental) se hayan producido solo por mero azar. Sin embargo, estaríamos dando una definición errónea.

La significación estadística no es la probabilidad de que los datos observados se hayan producido solo por azar.

Teoría de Conjuntos

La teoría de conjuntos es una rama de la lógica matemática que estudia las propiedades y relaciones de los conjuntos.

Podemos representar las relaciones entre conjuntos mediante los diagramas de Venn. Por ejemplo, imaginemos que queremos representar la unión de los conjuntos A=personas con pelo negro y B=personas con ojos verdes, el diagrama de Venn sería el siguiente:

El espacio delimitado por la intersección de ambos círculos representaría el conjunto de sujetos que tienen pelo negro y ojos verdes, es decir, A ∩ B.

Podemos realizar operaciones entre conjuntos para estimar, por ejemplo, la probabilidad de que dos sucesos ocurran al mismo tiempo.

Probabilidad Condicionada y Teorema de Bayes

La probabilidad condicionada de un suceso B, dado otro suceso A, que se expresa mediante P(B|A), es la probabilidad de que ocurra dicho suceso B, después de que haya ocurrido el suceso A.

La fórmula para el cálculo de dicha probabilidad condicionada es la siguiente:

Por ejemplo, volviendo al caso anterior, imaginemos que la probabilidad de que una persona tenga el pelo negro es P(A) = 0.60, y la probabilidad de que una persona tenga el pelo negro y los ojos verdes es P(A∩B) = 0.30. Entonces, la probabilidad de que una persona tenga los ojos verdes, sabiendo que tiene el pelo negro es:

Todo lo anteriormente nombrado es aplicable en el caso de sucesos dependientes, es decir, cuando la ocurrencia de un suceso condiciona la probabilidad de que ocurra el otro. Por tanto, dos sucesos serían independientes cuando la ocurrencia de uno de ellos no modifica la probabilidad de que ocurra el otro. Por ejemplo, el color de los ojos de una persona no depende de la edad de esta, por tanto, la probabilidad de que alguien tenga los ojos verdes (B) sabiendo que esa persona tiene 20 años (E) seria, P(B|E) = P(B).

En los casos donde los sucesos son dependientes, a parte de la fórmula del inicio del apartado, podemos calcular la probabilidad condicionada empleando el Teorema de Bayes:

Donde  sería el i-ésimo suceso B que puede ocurrir una vez ha ocurrido A, n es el número total de sucesos dentro del suceso A y, por tanto:

Por ejemplo, partiendo del siguiente diagrama de Venn:

En este caso, la fórmula para calcular la probabilidad condicionada de, por ejemplo, el suceso A dado el suceso W, sería:

P-valor y Teorema de Bayes

La probabilidad de que el azar haya operado por sí solo sin que haya diferencias entre, por ejemplo, dos tratamientos, es decir, la probabilidad de que la hipótesis nula sea cierta, la llamaremos P(B). Por otro lado, tendríamos la probabilidad de haber obtenido la asociación observada (suceso A), es decir, la probabilidad de haber obtenido esa diferencia concreta de efectividad entre los tratamientos, partiendo de que esta diferencia se ha producido solo por azar, bajo el modelo de la hipótesis nula, es decir, la probabilidad condicionada de A dado B, P(A|B). El p-valor hace referencia a esta última probabilidad P(A|B).

En el siguiente diagrama de Venn se ejemplifica el caso de un determinado resultado en nuestro estudio (A) y los sucesos hipótesis nula (B) e hipótesis alternativas, es decir, el resto de hipótesis que no son la hipótesis nula (H1).

Si partimos de que es cierto afirmar que el p-valor es la probabilidad de que el azar haya operado por sí solo, de que la hipótesis nula sea cierta, entonces las dos probabilidades anteriormente citadas deberían tener el mismo valor, es decir:

P(A|B) = P(B)

Esta igualdad debería cumplirse para cualquier posible suceso Ai, es decir, para cualquier diferencia encontrada en el estudio:

P(A1|B) = P(B)

P(A2|B) = P(B)

Y, por tanto, utilizando la fórmula del Teorema de Bayes:

Dado que la igualdad debe cumplirse para cualquier suceso Ai, la formula genérica del Teorema de Bayes en este caso sería:

El número de posibles resultados a obtener en el estudio es infinito, es decir, existen infinitos sucesos Ai, de modo que → ∞. Cuando → ∞, el resultado de la anterior ecuación tiende a cero, P(B) → 0 . Es decir, la ecuación solo se cumpliría para todos los posibles sucesos Ai cuando la probabilidad de la hipótesis nula fuese cero, P(B) = 0, es decir, cuando la hipótesis nula no pudiera darse, cuando el azar no pudiera estar actuando por sí solo, lo cual no tiene sentido.

Definiendo el p-valor

Según la Asociación de Estadística Americana, el p-valor es “la probabilidad bajo un modelo estadístico especificado, de que un resumen estadístico de los datos (ej. Diferencia de medias muestrales entre dos grupos comparados), fuese igual o más extremo que su valor observado” (1).

El p-valor es una declaración sobre unos datos con relación a una explicación hipotética especificada, no una declaración sobre la explicación en sí (1). Dicho de otra forma, cuando calculamos los p-valores estamos dando por hecho que la hipótesis nula es cierta, es decir, que tiene una probabilidad de 1, no estamos calculando su probabilidad.

Y si el p-valor no informa sobre la probabilidad de que la hipótesis nula sea cierta o falsa, sobra decir que tampoco informa sobre la probabilidad de que la hipótesis alternativa sea cierta o falsa.

Conclusión

El p-valor no es la probabilidad de que la asociación observada se haya producido solo por azar, de que las hipótesis nula/alternativa sean ciertas/falsas.

Sobre el autor...

ruben4121

Rubén Fernández Matías

Fisioterapeuta, MSc.
Graduado en Fisioterapia. MSc Universidad de Alcalá. Colaborador Students4BE. Socio ARP-sapc y APETP. Ejercicio Libre.

Deja un comentario