Apéndice E — Juzgamiento no paramétrico
En este apéndice se hará una corta y rápida revisión de algunos aspectos relacionados con el juzgamiento / prueba de hipótesis no paramétrico, es decir, aquel juzgamiento en donde se hacen los menores supuestos que se pueda acerca de la población.
E.1 Prueba de signos
Ejercicio E.1
Los siguientes datos representan el tiempo, en minutos, que un paciente tiene que esperar durante 12 visitas al consultorio de un médico antes de ser atendido:
17 15 20 20 32 28 12 26 25 25 35 24 Utilice la prueba de signo a un nivel de significancia de 0.05 para probar la afirmación del médico de que la mediana del tiempo de espera de sus pacientes no es mayor de 20 minutos.
Walpole, Myers & Myers (2012). Probabilidad y estadística para ingeniería y ciencias. (9a. ed.) Pearson Educación. Ejercicio 16.1.
Para la hipótesis alternativa con respecto a la mediana: H_a: \tilde{\mu} < m_0 (con la respectiva hipótesis nula), el valor del estadístico de prueba se obtiene con:
w = \text{Número de valores en la muestra aleatoria que son mayores que } m_0 y la distribución muestral es W \sim Binomial(n=n^*, p=0.5), donde n^* es el número de valores en la muestra que son diferentes de m_0. P[W \leq w] es el valor p (p-valor).
- Para la hipótesis alternativa H_a: \tilde{\mu} > m_0, P[W \geq w] es el valor p (p-valor).
- Para la hipótesis alternativa H_a: \tilde{\mu} \neq m_0, si w < n^*/2 entonces 2 P[W \leq w] es el valor p (p-valor), si w > n^*/2 entonces 2 P[W \geq w] es el valor p (p-valor).
- El método también funciona para la diferencia de medianas con observaciones pareadas H_a: \tilde{\mu}_1 - \tilde{\mu}_2 < d_0 (> d_0 o \neq d_0).
E.2 Prueba de rangos con signo de Wilcoxon
Ejercicio E.2
Se afirma que una nueva dieta reducirá el peso de una persona en 4.5 kilogramos, en promedio, en un periodo de dos semanas. Se registran los pesos de 10 mujeres que siguen esta dieta, antes y después de un periodo de dos semanas, y se obtienen los siguientes datos:
\, 1 2 3 4 5 6 7 8 9 10 Antes 58.5 60.3 61.7 69 64 62.6 56.7 63.6 68.2 59.4 Después 60 54.9 58.1 62.1 58.5 59.9 54.4 60.2 62.3 58.7 Utilice la prueba de rango con signo a un nivel de significancia de 0.05 para probar la hipótesis de que la dieta reduce la mediana del peso en 4.5 kilogramos, en comparación con la hipótesis alternativa de que la mediana de la pérdida de peso es menor que 4.5 kilogramos.
Walpole, Myers & Myers (2012). Probabilidad y estadística para ingeniería y ciencias. (9a. ed.) Pearson Educación. Ejercicio 16.11 (Ejercicio 16.5).
Para la hipótesis alternativa con respecto a la mediana: H_a: \tilde{\mu} < m_0 (con la respectiva hipótesis nula), el valor del estadístico de prueba se obtiene así:
Se ordena de menor a mayor, el valor absoluto de la diferencia de cada dato con respecto a la hipótesis nula, y se asignan las posiciones (rangos) conservando el signo de la diferencia (en caso de empates se asigna la “posición” central).
Se suman las posiciones (rangos) con signo positivo obteniendo el estadístico de prueba w_+.
El valor crítico se puede encontrar en tablas, mediante software estadístico, o para n suficientemente grande se puede utilizar \frac{W_+ - \frac{n(n+1)}{4}}{\sqrt{\frac{n(n+1)(2n+1)}{24}}} \sim \mathcal{N}(0,1). Se rechaza H_0 si w_+ es menor o igual que el valor crítico tabulado.
- El método también funciona para la diferencia de medianas con observaciones pareadas.
- El método fue desarrollado bajo la idea de que la distribución (población) es continua.
- Si la distribución (población) es simétrica, por obvias razones, se puede hablar de media (o medias) en vez de mediana (o medianas).
- Para H_a: \tilde{\mu} > m_0 se toma w_{-}. Se rechaza H_0 si w_- es menor o igual que el valor crítico tabulado.
- Para H_a: \tilde{\mu} \neq m_0 se toma w=\min\{w_+,w_-\}. Se rechaza H_0 si w es menor o igual que el valor crítico tabulado.
E.3 Prueba U de Mann-Withney (suma de rangos de Wilcoxon)
Ejercicio E.3
Un fabricante de cigarrillos afirma que el contenido de alquitrán de la marca de cigarrillos B es menor que la de la marca A. Para probar esta afirmación se registraron las siguientes medidas del contenido de alquitrán, en miligramos:
Marca A 1 12 9 13 11 14 Marca B 8 10 7 Utilice la prueba de suma de rangos con un nivel de significancia de 0.05 para probar si la afirmación es válida.
Walpole, Myers & Myers (2012). Probabilidad y estadística para ingeniería y ciencias. (9a. ed.) Pearson Educación. Ejercicio 16.15.
Para la diferencia de medianas con observaciones independientes: H_a: \tilde{\mu}_1 < \tilde{\mu}_2, el valor del estadístico de prueba se obtiene así:
Las observaciones de las dos poblaciones se unen en un solo grupo de datos, se ordenan ascendentemente (sin perder el registro de la población a la que pertenece cada dato), y se asigna la posición (es decir el rango. De nuevo, en caso de empate se asigna la “posición” central).
Se suman los rangos correspondientes a la primera población obteniendo w_1.
El estadístico de prueba es u_1 = w_1 - \frac{n_1(n_1 + 1)}{2}
El valor crítico asociado a la distribución muestral se puede encontrar en tablas, mediante software estadístico, o para n suficientemente grande se puede utilizar \frac{U_1 - \frac{(n_1)(n_2)}{2}}{\sqrt{\frac{(n_1)(n_2)(n_1+n_2+1)}{12}}} \sim \mathcal{N}(0,1). Se rechaza H_0 si u_1 es menor o igual que el valor crítico tabulado.
- El método fue desarrollado bajo la idea de que la distribución (población) es continua.
- Si la distribución (población) es simétrica, por obvias razones, se puede hablar de medias en vez de medianas.
- Investigar qué cambia para cuando H_a: \tilde{\mu}_1 > \tilde{\mu}_2 y para cuando H_a: \tilde{\mu}_1 \neq \tilde{\mu}_2.