El p-valor (p-value) también conocido como valor de p o valor de probabilidad, es una medida que nos permite evaluar la significancia estadística de los resultados observados durante un estudio o experimento, ayudándonos a tomar decisiones sobre las hipótesis planteadas; es una herramienta fundamental para la inferencia estadística y la interpretación de resultados obtenidos en una investigación al contrastar hipótesis; representa la probabilidad de observar los datos recolectados, o datos aún más extremos, en caso de que la hipótesis nula fuera realmente cierta.
Entonces, el p-valor proporciona la medida de lo probable que es obtener los resultados que hemos observado si es que la hipótesis nula fuera cierta; esta probabilidad oscila entre 0 y 1, y cuanto menor es el p-valor, mayor es la evidencia que nos lleva a
descartar la hipótesis nula, obteniéndose un resultado más significativo. El p-valor se utiliza en pruebas de hipótesis estadísticas donde comparamos un estadístico de muestra (media, proporción, diferencia entre grupos, etc.) con su distribución bajo la hipótesis nula; los resultados se consideran significativos si el p-valor es menor que un nivel de significancia previamente fijado (por ejemplo 0.05), donde se rechaza la hipótesis nula, y se acepta la hipótesis alternativa.
Es importante recalcar, que el p-valor no indica la probabilidad de que la hipótesis nula sea cierta o falsa, sino la probabilidad de obtener los resultados que hemos observado en el caso de que la hipótesis nula fuese cierta; además, el p-valor por sí solo no proporciona información suficiente.
CONSIDERACIONES SOBRE P-VALOR
a) Tamaño de la Muestra: El tamaño de la muestra puede influir en la precisión del p-valor, es decir, que en muestras pequeñas los resultados tienden a ser menos confiables, mientras que con muestras grandes, se pueden alcanzar resultados estadísticamente significativos.
b) Nivel de significancia (α): El nivel de significancia previamente definido (comúnmente 0.05), determina el umbral de rechazo de la hipótesis nula (H₀). Es importante elegir un nivel de significancia apropiado respecto al contexto del estudio y las consecuencias de cometer un error tipo I (rechazar la hipótesis nula cuando no debe ser rechazada).
c) Tamaño del efecto: Además del p-valor,es importante considerar el tamaño del efecto; que es la magnitud de la fuerza de la relación entre dos variables o la diferencia observada entre los grupos. Un p-valor puede ser estadísticamente significativo, pero si el tamaño del efecto es pequeño, el resultado puede tener poca relevancia práctica.
d) Contexto del estudio: Al interpretar el p-valor, se debe considerar el contexto del estudio y la pregunta de investigación en su totalidad, pues su importancia varía según el contexto.
e) Replicabilidad y robustez: Los resultados estadísticamente significativos deben ser replicados en estudios independientes, teniendo en cuenta la robustez de los resultados; un solo p-valor significativo no garantiza la validez o la replicabilidad de los resultados.
f) Posibles sesgos y limitaciones: Es necesario tener en cuenta los posibles sesgos en el diseño del estudio o las limitaciones en el método analítico a la hora de interpretar los resultados, pues los sesgos son influyentes por lo que deben ser considerados en la interpretación del p-valor.
BENEFICIOS DEL P-VALOR
a) Objetividad: El p-valor proporciona una medida objetiva de evidencia en contra de la hipótesis nula, tomando como base, datos observados en la muestra.
b) Estandarización: El p-valor proporciona una medida estandarizada que facilita la comparación de la significancia estadística entre distintos estudios o análisis, sin considerar las unidades de medida o escalas utilizadas.
c) Guía para la toma de decisiones: El p-valor puede servir como guía directa para la toma de decisiones al realizar pruebas de hipótesis estadísticas; ya que, si p-valor fuese inferior al nivel de significancia predefinido, se rechazaría la hipótesis nula en favor de la hipótesis alternativa; por ejemplo en los casos típicos sobre la toma de decisiones basadas en evidencias, donde los resultados de los p-valores significativos influyen en la formulación de políticas y la toma de decisiones clínicas.
d) Comunicación científica: El p-valor es una medida utilizada para resumir la evidencia estadística en trabajos científicos y sus análisis.
e) Interpretación de resultados: El p-valor permite dar una interpretación estadística de los resultados, para comprender y demostrar su importancia en diferentes estudios.
LIMITACIONES DEL P-VALOR
a) Poca interpretabilidad, ya que describe la probabilidad de observar los datos cuando la hipótesis nula es cierta, pero no proporciona información sobre la magnitud del efecto.
b) Uso inadecuado, se observa en una inferencia causal basada únicamente en la significancia estadística, llegando a mal interpretarse el resultado.
c) Sesgo de publicación y selección, que lleva a sobre valorar la importancia de resultados estadísticamente significativos o también subestimar la evidencia en contra de la hipótesis nula.
d) Dependencia del tamaño de la muestra, al obtener resultados estadísticamente significativos en muestras grades, sin considerar el tamaño del efecto.
e) Niveles arbitrarios de significancia, por ejemplo si la selección de α=0.05 es arbitraria, entonces la interpretación de los resultados también puede resultar arbitraria.
f) Replicabilidad y reproducibilidad, los estudios con resultados estadísticamente significativos no siempre serán replicables en estudios independientes, lo que genera dudas sobre su validez y robustez.
g) Limitaciones en estudios exploratorios, pues la significancia con p-valor puede resultar poco útil, pues podría aumentar la probabilidad de falsos positivos o errores en la información obtenida.
UMBRALES DE P-VALOR MÁS USADOS
Para determinar la significancia estadística en términos de p-valor, debemos considerar los umbrales de rechazo de la hipótesis nula que denominamos nivel de significancia (α). Los umbrales de p-valor más empleados son: 0.05, 0.01, 0.001 y 0.10; estos valores indican las probabilidades del 5%, 1%, 0.1% y 10% respectivamente, de que los resultados obtenidos sean estadísticamente significativos si la hipótesis nula fuese verdadera. De estos umbrales, el más utilizado es 0.05, si el p-valor es menor que 0.05 entonces se considera que los resultados son estadísticamente significativos; para un p-valor de 0.01 la exigencia es mayor, pues requiere más evidencia para poder rechazar la hipótesis nula; en caso de p-valor menor a 0.001, la exigencia y la certeza de los resultados es aún mayor; mientras que el valor 0.1 es el nivel de significancia es menos estricto que los anteriores y se utiliza en estudios exploratorios o cuando se desea ser más permisivo al rechazar la hipótesis nula.
Estos valores pueden variar según contexto de la investigación, la naturaleza de los datos o las preferencias del investigador por cierta disciplina o ámbito de estudio.
P-valor < 0.05
Significa que existe una probabilidad menor al 5% de que los resultados observados se deban al azar o a la casualidad, este valor es ampliamente utilizado en muchos ámbitos científicos y de investigación, pues intenta buscar el equilibrio entre ser lo suficientemente riguroso como para evitar el riesgo de cometer errores de tipo I (falsos positivos), y ser lo suficientemente sensible como para detectar hallazgos significativos; algunos ámbitos son:
- Ciencias sociales: Psicología, economía, ciencia política, sociología, etc.
- Ciencias de la salud: Medicina, sanidad pública, nutrición, etc.
- Ciencias biológicas: Biología, bioquímica, biotecnología, etc.
- Ciencias ambientales: Ecología, geografía ambiental, geología, climatología, etc.
- Ciencias de la computación: Ciencia de datos, Inteligencia artificial, etc.
- Ingeniería: Civil, mecánica, eléctrica, etc.
P-valor < 0.01
Es utilizado comúnmente en ámbitos donde se exige mayor control sobre el error de tipo I, pues un falso positivo puede resultar considerablemente significativo; incluyen ámbitos como:
- Investigación médica: Al evaluar nuevos tratamientos o intervenciones médicas.
- Ciencias de la salud pública: Los resultados de una investigación pueden marcar la dirección de las decisiones políticas en salud.
- Ciencias ambientales: Al evaluar riesgos de impactos ambientales.
- Ciencias económicas: En el análisis económico, financiero y la evaluación de políticas económicas.
- Ingeniería: Al evaluar la seguridad y las estructuras.
P-valor < 0.001
Se utiliza en disciplinas donde se necesita una evidencia muy fuerte para rechazar la hipótesis nula, pues las investigaciones en tales ámbitos, traen consecuencias importantes y los riesgos son muy altos, algunas de estas disciplinas son:
- Ciencias médicas: Ensayos clínicos de nuevos fármacos o de tratamientos.
- Salud pública: Estudios relacionados con la prevención de enfermedades, el control de epidemias o políticas de salud pública.
- Ciencias ambientales: Estudio de los efectos de los contaminantes medioambientales.
- Ingeniería de la seguridad: Estudios donde la precisión de los datos tiene consecuencias significativas en la seguridad pública.
- Investigación biomédica: Estudios relacionados con la genética, biología molecular o patogenia de enfermedades.
P-valor < 0.1
Se utiliza en disciplinas donde se puede tolerar un mayor riesgo de error tipo I (falsos positivos) y donde la rigurosidad estadística no es tan crítica como en otros ámbitos, pues se acepta un mayor margen de error en favor de la exploración, la innovación o la obtención de información preliminar; se pueden incluir:
- Estudios exploratorios: En estudios donde se exploran nuevas ideas, teorías o relaciones.
- Estudios piloto: Antes de realizar estudios más grandes y costosos, a menudo se realizan estudios piloto o investigaciones preliminares.
- Estudios de observación: En estudios como encuestas de opinión o estudios de mercado.
- Estudios de ingeniería: En las etapas iniciales del diseño o desarrollo de productos, donde se están explorando distintas estrategias y soluciones.
DEFINICIÓN MATEMÁTICA
El p-valor indica la probabilidad (P) de que un resultado o prueba estadística Kn es mayor o igual a un valor observado kn asumiendo una hipótesis nula (H₀) verdadera:
\[p-valor=P(K_n≥k_n | H_0 \text{ verdadera})\]
Si el p-valor es pequeño, indica que, bajo la hipótesis nula, los datos observados son improbables, lo que nos lleva a rechazar la hipótesis nula, en favor de la hipótesis alternativa; por otro lado, si el valor de p-valor es grande, indica que los datos observados son consistentes con la hipótesis nula. Las pruebas estadísticas pueden ser normal, t-student, chi-cuadrada, entre otras.
SIGNIFICANCIA DE LA PRUEBA
El nivel de significancia, generalmente es representado por α, y establece el umbral para considerar un resultado como estadísticamente significativo; por ejemplo, si se elige un nivel de significancia de α = 0.05, significa que se está dispuesto a aceptar un 5% de probabilidad de cometer un error tipo I, al rechazar la hipótesis nula. El p-valor y el nivel de significancia α, están intrínsecamente relacionados en las pruebas de hipótesis estadísticas.
1. Si p ≤ α, se rechaza la hipótesis nula (H₀) en favor de la hipótesis alternativa, lo que indica que los resultados son estadísticamente significativos y que hay suficiente evidencia para afirmar que existe una diferencia o efecto en la población.
2. Si p > α, no se rechaza la hipótesis nula (H₀), entonces los resultados no son estadísticamente significativos y que no hay suficiente evidencia para afirmar que existe una diferencia o efecto en la población.
CÁLCULO DEL P-VALOR
El p-valor se representa como un número entre 0 y 1, cuanto más pequeño sea el valor de p, más fuerte es la evidencia en contra de la hipótesis nula.
Para calcular el p-valor, depende del tipo de prueba estadística que se esté analizando, por ejemplo, Prueba normal (unilateral y bilateral), t-student, Chi cuadrado, ANOVA entre otros. En el caso de una prueba normal (Z) tenemos:
INTERPRETACIÓN DEL P-VALOR
EJEMPLO:
Supongamos que se lleva a cabo un estudio sobre un programa de tutoría que sirve para mejorar el rendimiento académico de los estudiantes universitarios, entonces, las hipótesis serían:
H₀: El programa de tutoría no tiene efecto en el rendimiento académico
H₁: El programa de tutoría sí mejora el rendimiento académico.
Una vez implementado el programa de tutoría y evaluado el rendimiento académico de los estudiantes a través de pruebas estandarizadas, se obtiene un p-valor de 0.03, lo significa que existe una probabilidad del 3% de conseguir una mejoría en el rendimiento académico; así mismo, como el p-valor es menor que el nivel de significancia (habitualmente 0.05), entonces indicamos que los resultados son estadísticamente significativos.
Por lo tanto, hay suficiente evidencia como para rechazar la hipótesis nula (H₀) y podemos concluir que el programa de tutoría probablemente tiene un efecto positivo sobre el rendimiento académico de los estudiantes universitarios.
En resumen, el p-valor es una de las medidas más útiles de la estadística inferencial, pues ayuda a evaluar la significancia estadística de los resultados y de tomar decisiones relacionadas con el estudio que se está realizando.
Referencia: (1) ,(2), (3), (4), (5), (6)
Para entender mejor el concepto del p-valor, se sugiere ver el video encontrado en YouTube…
(Fuente)
No hay comentarios:
Publicar un comentario