\begin{multicols}{3}
Conceptos Fundamentales en las Pruebas de Hipótesis
Las pruebas de hipótesis son procedimientos estadísticos utilizados para tomar decisiones acerca de una población basándose en datos muestrales. Estas pruebas se estructuran en torno a dos afirmaciones contradictorias:
-
Hipótesis nula (H₀): Es una afirmación sobre la población que se intenta refutar. Generalmente, representa el “status quo”, una situación de no efecto, no cambio o igualdad. Ejemplos:
- H₀: El dispositivo anticontaminante es efectivo.
- H₀: El peso medio de las piezas es igual a 300 Kg.
-
Hipótesis alternativa (H₁): Es una afirmación que se acepta si los datos de la muestra proporcionan suficiente evidencia para rechazar la hipótesis nula. Ejemplos:
- H₁: El dispositivo anticontaminante no es efectivo.
- H₁: El peso medio de las piezas es distinto de 300 Kg.
Errores en las Pruebas de Hipótesis
Al tomar una decisión sobre la hipótesis nula, se pueden cometer dos tipos de errores:
-
Error Tipo I (α): Rechazar H₀ cuando en realidad es verdadera.
- Se denota como:
- Probabilidad:
- Ejemplo: Concluir que el dispositivo anticontaminante no es efectivo cuando en realidad lo es.
-
Error Tipo II (β): No rechazar H₀ cuando en realidad es falsa.
- Se denota como:
- Probabilidad:
- Ejemplo: Concluir que el dispositivo es efectivo cuando en realidad no lo es.
La potencia de una prueba se define como la probabilidad de rechazar correctamente una hipótesis nula falsa:
Estadísticos de Prueba y Región Crítica
Para decidir si rechazamos H₀, calculamos un estadístico de prueba basado en los datos de la muestra y lo comparamos con una región crítica.
- Región crítica: Conjunto de valores del estadístico de prueba para los cuales se rechaza H₀.
- Nivel de significancia (α): Umbral máximo de error Tipo I permitido en la prueba.
- Valor-p: Probabilidad de obtener un resultado tan extremo (o más) que el observado, asumiendo que H₀ es verdadera. Si p-valor < α, se rechaza H₀.
Pruebas de Hipótesis Específicas y sus Fórmulas
- Prueba t de una muestra
Se usa para probar la media de una población cuando la desviación estándar poblacional es desconocida. Donde:
- = media muestral
- = media poblacional bajo H₀
- = desviación estándar muestral
- = tamaño de la muestra
- Prueba z de una muestra
Se usa cuando la desviación estándar poblacional es conocida. Donde es la desviación estándar poblacional.
- Prueba de Bondad de Ajuste Chi-cuadrado ()
Evalúa si una distribución observada coincide con una esperada. Donde y son las frecuencias observadas y esperadas.
- Prueba de Kolmogorov-Smirnov
Verifica si una muestra sigue una distribución específica. Donde es la función de distribución acumulada empírica y la teórica.
- Prueba de Normalidad (Shapiro-Wilk y Lilliefors)
Evalúa si los datos provienen de una distribución normal.
- Prueba del Signo
Se basa en el signo de las diferencias respecto a la mediana. Donde si y si .
- Prueba de Wilcoxon con Signo
Usa rangos de las diferencias absolutas. Aproximación normal:
- Prueba de Rachas
Prueba la aleatoriedad en una secuencia binaria. Donde es el número de rachas y es el valor esperado.
- Prueba de Kruskal-Wallis
Prueba no paramétrica para comparar más de dos grupos independientes. Donde:
- = tamaño total de la muestra
- = tamaño del grupo
- = suma de rangos del grupo
- = media de los rangos
- Prueba de Friedman
Prueba no paramétrica para comparar más de dos grupos relacionados. Donde:
- = número de sujetos
- = número de tratamientos
- = suma de rangos para el tratamiento
- Prueba de Mann-Whitney
Prueba no paramétrica para comparar dos grupos independientes. Donde:
- y son los tamaños de las muestras
- es la suma de los rangos del primer grupo
- Prueba de Wilcoxon para dos muestras relacionadas
Prueba no paramétrica para comparar dos grupos relacionados. Donde:
- es el rango de la diferencia entre las dos muestras.
- Prueba de Spearman
Correlación no paramétrica entre dos variables. Donde:
- es la diferencia entre los rangos de las dos variables.
- Prueba de Kendall
Correlación no paramétrica entre dos variables. Donde:
- es el número de concordancias
- es el número de discordancias
- Prueba de Chi-cuadrado para independencia
Prueba no paramétrica para evaluar la independencia entre dos variables categóricas. Donde:
- es la frecuencia observada en la celda
- es la frecuencia esperada en la celda
- Prueba de Chi-cuadrado para homogeneidad
Prueba no paramétrica para evaluar la homogeneidad entre dos o más poblaciones. Donde:
- es la frecuencia observada en la celda
- es la frecuencia esperada en la celda
- Prueba de Cochran
Prueba no paramétrica para evaluar la homogeneidad de proporciones en más de dos grupos. Donde:
- es el número de éxitos observados
- es el número de éxitos esperados
- Prueba de McNemar
Prueba no paramétrica para evaluar la diferencia en proporciones en dos grupos relacionados. Donde:
- es el número de discordancias en la primera dirección
- es el número de discordancias en la segunda dirección
\end{multicols}