13  Juzgamiento

En esta sección se hará una revisión de algunos aspectos relacionados con el juzgamiento (prueba de hipótesis) acerca de un parámetro de interés, desde luego, bajo los supuestos asociados a las distribuciones muestrales previamente vistas.

13.1 Para empezar

Actividad autónoma independiente
  • Lea todo el contenido de la presente sección (Inferencia, 13. Juzgamiento).

En sus propias palabras, haga una exposición escrita (como si le estuviera explicando a un compañero o amigo) acerca de lo que aprendió a partir de lo leído, incluya su discusión, reflexiones y conclusiones al respecto. Luego, exponga lo que no entendió e intente encontrar por su cuenta respuestas a las preguntas que le surgieron, para que las pueda compartir en clase.

13.2 Aspectos generales

Tengamos en cuenta la siguiente situación:

En una línea de producción, el peso promedio con que se llena cada recipiente es 16 onzas. Un exceso o una insuficiente de llenado ocasionan problemas serios y, cuando son detectados, es necesario que el operador detenga la línea de producción para reajustar el mecanismo de llenado. Con base en datos anteriores, se supone que la desviación estándar poblacional es 0.8 onzas. Cada hora, un inspector de control de calidad toma una muestra de 30 recipientes y decide si es necesario detener la producción y hacer un reajuste. El nivel de significancia es \alpha = 0.05.

  1. Establezca la prueba de hipótesis para esta aplicación al control de calidad.
  2. Si se encuentra que la media muestral es 16.32 onzas, ¿cuál es el valor-p? ¿Qué medidas recomendaría usted tomar?

Anderson, Sweeney, Williams & Camm (2016). Estadística para Negocios y Economía. (12a. ed.) Cengage Learning. Capítulo 9. Ejercicio 60.

Una prueba de hipótesis es un procedimiento estadístico que se usa para tomar una decisión, con respecto a una conjetura acerca de la población, a partir de la evidencia que se tiene en la muestra (es decir, a partir de la información que nos da la muestra).

13.2.1 Hipótesis nula H_0 e hipótesis alternativa H_a

Suponga que se está en un juicio. Bajo la idea de que un acusado es inocente hasta que se demuestre lo contrario (el jurado debe encontrarlo culpable “más allá de la duda razonable”), entonces,

\begin{aligned} H_0 &: \text{ El acusado es inocente} \\ H_a &: \text{ El acusado es culpable} \end{aligned}

La evidencia tiene que ser suficiente para condenar al acusado (rechazar H_0). En caso contrario, se dice que no hay suficiente evidencia para declararlo culpable (no se rechaza H_0).

13.2.2 Tipo de error

\, H_0 es verdadera H_a es verdadera
Se rechaza H_0 Error Tipo I \checkmark
No se rechaza H_0 \checkmark Error Tipo II

Sea

\alpha = P[\text{Error Tipo I}]

y

\beta = P[\text{Error Tipo II}]

entonces \alpha se denomina el nivel de significancia y 1 - \beta la potencia de la prueba (usada para rechazar o no rechazar la hipótesis nula).

¿es posible que \alpha y \beta sean simultáneamente tan pequeños como uno quiera?

No, no es posible. Cuando reducimos uno de los dos, el otro aumenta.

Lo que si podemos hacer es fijar un valor relativamente pequeño para \alpha y utilizar pruebas que tengan la mayor potencia posible (pruebas con el menor \beta posible para ese \alpha fijo).

13.2.3 Pruebas de hipótesis a dos colas o a una cola

A dos colas:

\begin{aligned} H_0 &: \theta = \theta_0 \\ H_a &: \theta \neq \theta_0 \end{aligned}

A una cola a derecha:

\begin{aligned} H_0 &: \theta \leq \theta_0 \\ H_a &: \theta > \theta_0 \end{aligned}

A una cola a izquierda:

\begin{aligned} H_0 &: \theta \geq \theta_0 \\ H_a &: \theta < \theta_0 \end{aligned}

13.2.4 Pasos de una prueba de hipótesis

  1. Determine la hipótesis nula H_0 y la hipótesis alternativa H_a.

  2. Seleccione el estadístico de prueba apropiado

  3. Calcule el valor que toma el estadístico a partir de los datos muestrales.

  4. A partir de un nivel de significancia \alpha, usando:

    1. el o los valores críticos:

      1. Determine el o los valores críticos y la regla de rechazo a partir de la distribución muestral del estadístico de prueba.
      2. Si el valor del estadístico de prueba está en la zona de rechazo entonces rechace H_0, en caso contrario no rechace H_0.
    2. el p-valor:

      1. Calcule el p-valor correspondiente al valor del estadístico de prueba a partir de su distribución muestral.
      2. Si el p-valor es menor que \alpha entonces rechace H_0, en caso contrario no rechace H_0.

13.3 Una población

13.3.1 Media

Si se desea hacer un juzgamiento (prueba de hipótesis) acerca de la media de una población, es decir, en el caso en el cual el parámetro de interés \theta es la media \mu (H_0: \mu = \mu_0):

  1. Si \sigma es conocida, entonces, para n suficientemente grande o bajo el supuesto de que la variable de interés de la población tiene distribución normal, el valor del estadístico de prueba está dado por, \frac{\bar{x} - \mu_0}{\sigma/\sqrt{n}}, la distribución muestral es \mathcal{N}(0,1), y,

  2. Si \sigma es desconocida, entonces, bajo el supuesto de que la variable de interés de la población tiene distribución normal, el valor del estadístico de prueba está dado por, \frac{\bar{x} - \mu_0}{s/\sqrt{n}}, la distribución muestral es t_{n-1}, y,

Para ilustrar:

Ejercicio 13.1  

En una línea de producción, el peso promedio con que se llena cada recipiente es 16 onzas. Un exceso o una insuficiente de llenado ocasionan problemas serios y, cuando son detectados, es necesario que el operador detenga la línea de producción para reajustar el mecanismo de llenado. Con base en datos anteriores, se asume que la desviación estándar poblacional es 0.8 onzas. Cada hora, un inspector de control de calidad toma una muestra de 30 recipientes y decide si es necesario detener la producción y hacer un reajuste. El nivel de significancia es \alpha = 0.05.

  1. Establezca la prueba de hipótesis para esta aplicación al control de calidad.
  2. Si se encuentra que la media muestral es 16.32 onzas, ¿cuál es el valor-p? ¿Qué medidas recomendaría usted tomar?
  3. Si se encuentra que la media muestral es 15.82 onzas, ¿cuál es el valor-p? ¿Qué medidas sería preferible tomar?

Anderson, Sweeney, Williams & Camm (2016). Estadística para Negocios y Economía. (12a. ed.) Cengage Learning. Capítulo 9. Ejercicio 60.

Ejercicio 13.2  

La cámara de comercio de una comunidad de la costa del Golfo en Florida anuncia en su publicidad que hay disponibilidad de propiedades en el área residencial a un costo medio de \$125000 o menos por lote. Suponga que en una muestra de 32 propiedades se encuentra una media muestral de \$130000 por terreno y una desviación estándar muestral es \$12500. Use 0.05 como nivel de significancia para probar la validez de lo que se dice en la publicidad.

Anderson, Sweeney, Williams & Camm (2016). Estadística para Negocios y Economía. (12a. ed.) Cengage Learning. Capítulo 9. Ejercicio 66.

13.3.2 Proporción

Si se desea hacer un juzgamiento (prueba de hipótesis) acerca de la proporción de una población, es decir, en el caso en el cual el parámetro de interés \theta es la proporción p (H_0: p = p_0), para n suficientemente grande (np > 10 y n(1-p) > 10), el valor del estadístico de prueba está dado por, \frac{\hat{p} - p_0}{\sqrt{\frac{p_0(1-p_0)}{n}}} y la distribución muestral es \mathcal{N}(0,1).

Para ilustrar:

Ejercicio 13.3  

Una estación de radio de Myrtle Beach anuncia que, por lo menos, 90\% de los hoteles y moteles estarán llenos el fin de semana en que se conmemora el Día de los Caídos. La radiodifusora aconseja a sus oyentes hacer sus reservaciones con anticipación si piensan pasar ese fin de semana en esa localidad vacacional. La noche del sábado, una muestra de 58 hoteles y moteles, indicó que 49 estaban completamente llenos y 9 aún tenían habitaciones libres. ¿Cuál es su reacción ante lo anunciado por la estación de radio después de ver la evidencia muestral? Use \alpha = 0.05 al realizar el estadístico de prueba. ¿Cuál es el valor-p?

Anderson, Sweeney, Williams & Camm (2016). Estadística para Negocios y Economía. (12a. ed.) Cengage Learning. Capítulo 9. Ejercicio 72.

13.3.3 Varianza

Si se desea hacer un juzgamiento (prueba de hipótesis) acerca de la varianza (o la desviación estándar) de una población, es decir, en el caso en el cual el parámetro de interés \theta es la varianza \sigma^2 (H_0: \sigma^2 = \sigma_0^2) (si el problema está planteado con la desviación estándar, eleve al cuadrado para llevarlo a un problema equivalente de varianza), bajo el supuesto de que la variable de interés de la población tiene distribución normal, el valor del estadístico de prueba está dado por, \frac{(n-1)s^2}{\sigma_0^2} y la distribución muestral es \chi^2_{n-1}

Para ilustrar:

Ejercicio 13.4  

En una muestra de 9 días de los últimos seis meses se encontró que un dentista había tratado a los siguientes números de pacientes: 22, 25, 20, 18, 15, 22, 24, 19 y 26. Si el número de sujetos atendidos por día tiene una distribución normal, ¿un análisis de estos datos muestrales permitiría rechazar la hipótesis de que la varianza de la cantidad de pacientes atendidos por día es 10? Use un nivel de significancia de 0.10. ¿Cuál es su conclusión?

Anderson, Sweeney, Williams & Camm (2016). Estadística para Negocios y Economía. (12a. ed.) Cengage Learning. Capítulo 11. Ejercicio 29.

13.4 Dos poblaciones

13.4.1 Medias

Si se desea hacer un juzgamiento (prueba de hipótesis) acerca de las medias de dos poblaciones \mu_1 y \mu_2 (H_0: \mu_1 = \mu_2 + d_0), es decir, en el caso en el cual el parámetro de interés \theta es la diferencia de las medias \mu_1 - \mu_2 (H_0: \mu_1 - \mu_2 = d_0):

  1. Si son observaciones pareadas, entonces haga:

    X = X_1 - X_2 lo que implica que \bar{X} = \bar{X}_1 - \bar{X}_2 y \mu = \mu_1 - \mu_2, quedando así en la situación de una media de una población (para los anteriores X, \bar{X} y \mu).

  2. Si NO son observaciones pareadas, con \sigma_1 y \sigma_2 conocidas, entonces, para n suficientemente grande o bajo el supuesto de que la variable de interés de cada población tiene distribución normal, el valor del estadístico de prueba está dado por, \frac{ \left( \bar{x}_1 - \bar{x}_2 \right) - \left( d_0 \right)}{\sqrt{\frac{\sigma_1^2}{n_1}+\frac{\sigma_2^2}{n_2}}}, y la distribución muestral es \mathcal{N}(0,1).

  3. Si NO son observaciones pareadas y se considera que \sigma_1 = \sigma_2, entonces, bajo el supuesto de que la variable de interés de cada población tiene distribución normal, el valor del estadístico de prueba está dado por, \frac{ \left( \bar{x}_1 - \bar{x}_2 \right) - \left( d_0 \right)}{s_p \, \sqrt{\frac{1}{n_1}+\frac{1}{n_2}}}, donde s_p^2 = \frac{(n_1-1)s_1^2 + (n_2-1)s_2^2}{n_1+n_2-2}, y la distribución muestral es t_{n_1+n_2-2}.

  4. Si NO son observaciones pareadas y se considera que \sigma_1 \neq \sigma_2, entonces, bajo el supuesto de que la variable de interés de cada población tiene distribución normal, el valor del estadístico de prueba está dado por, \frac{ \left( \bar{x}_1 - \bar{x}_2 \right) - \left( d_0 \right)}{\sqrt{\frac{s_1^2}{n_1}+\frac{s_2^2}{n_2}}}, y la distribución muestral es t_{\nu}, donde \nu = \left\lfloor \frac{\left(s_1^2/n_1+s_2^2/n_2\right)^2}{\frac{\left(s_1^2/n_1\right)^2}{n_1-1} + \frac{\left(s_2^2/n_2\right)^2}{n_2-1}} \right\rfloor.

Ejercicio 13.5  

Se esperaba que el Día de San Valentín el gasto promedio fuera de \$100.89 (USA Today, 13 de febrero de 2006). ¿Hay diferencia en las cantidades que desembolsan los hombres y las mujeres? El gasto promedio en una muestra de 40 hombres fue de \$135.67 y en una muestra de 30 mujeres fue de \$68.64. Por estudios anteriores se sabe que la desviación estándar poblacional en el consumo de los hombres es \$35 y en el de las mujeres es \$20. ¿Los datos muestrales apoyan o rechazan la hipótesis de que hay una diferencia significativa entre las cantidades que desembolsan los hombres y las mujeres?

Anderson, Sweeney, Williams & Camm (2016). Estadística para Negocios y Economía. (12a. ed.) Cengage Learning. Capítulo 10. Ejercicio 5.

Ejercicio 13.6  

En los últimos años prolifera una cantidad cada vez mayor de opciones de entretenimiento que compiten por el tiempo de los consumidores. En 2004 la televisión por cable y la radio superaron a la televisión abierta, la música grabada y los periódicos, convirtiéndose en los medios de entretenimiento más usados (The Wall Street Journal, 26 de enero de 2004). Con una muestra de 15 individuos, los investigadores obtienen los datos de las horas por semana que destinan a ver televisión por cable y de las horas por semana en que escuchan la radio.

\, 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15
TV 22 8 25 22 12 26 22 19 21 23 14 14 14 16 24
Radio 25 10 29 19 13 28 23 21 21 23 15 18 17 15 23

Use como nivel de significancia 0.05 y haga una prueba para la diferencia entre las medias poblacionales de la cantidad de horas destinadas a la televisión por cable y la cantidad de horas destinadas a la radio. ¿Cuál es el valor-p?

Anderson, Sweeney, Williams & Camm (2016). Estadística para Negocios y Economía. (12a. ed.) Cengage Learning. Capítulo 10. Ejercicio 25.

Ejercicio 13.7  

Con cierta periodicidad, Merrill Lynch solicita a sus clientes evaluaciones sobre los consultores y los servicios financieros que les proporciona. Las puntuaciones más altas en la encuesta de satisfacción del cliente indican mejor servicio con 7 como la puntuación más alta. A continuación se presentan en forma resumida las puntuaciones otorgadas a dos consultores financieros por los miembros de dos muestras aleatorias independientes. El consultor A tiene 10 años de experiencia, mientras que el consultor B tiene sólo 1 año. Use \alpha = 0.05 y realice una prueba para determinar si el consultor con más experiencia tiene la media poblacional más alta en la evaluación del servicio.

Consultor n \bar{x} s
A 16 6.82 0.64
B 10 6.25 0.75

Suponga varianzas iguales y repita suponiendo varianzas diferentes.

Anderson, Sweeney, Williams & Camm (2016). Estadística para Negocios y Economía. (12a. ed.) Cengage Learning. Capítulo 10. Ejercicio 17.

13.4.2 Proporciones

Si se desea hacer un juzgamiento (prueba de hipótesis) acerca de las proporciones de dos poblaciones p_1 y p_2 (H_0: p_1 = p_2 + d_0), es decir, en el caso en el cual el parámetro de interés \theta es la diferencia de las proporciones p_1 - p_2 (H_0: p_1 - p_2 = d_0):

  1. Si son observaciones pareadas, entonces haga

    X = X_1 - X_2 lo que implica que \bar{X} = \hat{P}_1 - \hat{P}_2 y \mu = p_1 - p_2, quedando así en la situación de una media de una población (para los anteriores X, \bar{X} y \mu).

  2. Si NO son observaciones pareadas y d_0 = 0 (H_0: p_1 = p_2 + 0), entonces, para n suficientemente grade \left( n_1p_1>5 \right., n_2p_2>5, n_1(1-p_1)>5 y \left. n_2(1-p_2)>5 \right), el valor del estadístico de prueba está dado por, \frac{ \left( \hat{p}_1 - \hat{p}_2 \right) - \left( 0 \right)}{ \sqrt{\hat{p} (1-\hat{p}) \left(\frac{1}{n_1}+\frac{1}{n_2}\right)}}, donde \hat{p} = \frac{n_1 \hat{p}_1 + n_2 \hat{p}_2}{n_1 + n_2}, y la distribución muestral es \mathcal{N}(0,1).

  3. Si NO son observaciones pareadas y d_0 \neq 0, entonces, para n suficientemente grade \left( n_1p_1>5 \right., n_2p_2>5, n_1(1-p_1)>5 y \left. n_2(1-p_2)>5 \right), el valor del estadístico de prueba está dado por, \frac{ \left( \hat{p}_1 - \hat{p}_2 \right) - \left( d_0 \right)}{\sqrt{\frac{\hat{p}_1\left(1-\hat{p}_1\right)}{n_1}+\frac{\hat{p}_2\left(1-\hat{p}_2\right)}{n_2}}} y la distribución muestral es \mathcal{N}(0,1).

Ejercicio 13.8  

En un estudio de la Asociación Estadounidense de Automovilistas (AAA, por sus siglas en inglés) se investigó si era más probable que conductores de género masculino o femenino se detuvieran para solicitar indicaciones sobre cómo llegar a una dirección (AAA, enero de 2006). Se preguntaba a los conductores: “Si usted y su cónyuge van en su automóvil y se pierden, ¿se detiene para preguntar por el domicilio que busca?” En una muestra representativa se encontró que 300 de 811 mujeres dijeron que sí se detenían para preguntar, mientras que 255 de 750 hombres dijeron que también lo hacían. La hipótesis de investigación de AAA afirmaba que era más probable que las mujeres se detuvieran para preguntar por el domicilio. Pruebe la hipótesis usando \alpha = 0.05.

Anderson, Sweeney, Williams & Camm (2016). Estadística para Negocios y Economía. (12a. ed.) Cengage Learning. Capítulo 10. Ejercicio 32.

13.4.3 Varianzas

Si se desea hacer un juzgamiento (prueba de hipótesis) acerca de las varianzas (o las desviaciones estándar) de dos poblaciones \sigma_1^2 y \sigma_2^2 \left(H_0: \sigma_1^2 = d_0 \, \sigma_2^2\right), es decir, en el caso en el cual el parámetro de interés \theta es el cociente de las varianzas \sigma_1^2 y \sigma_2^2 \left(H_0: \frac{\sigma_1^2}{\sigma_2^2} = d_0\right) (si el problema está planteado con desviaciones estándar, eleve al cuadrado para llevarlo a un problema equivalente de cociente de varianzas), bajo el supuesto de que la variable de interés de la población tiene distribución normal, el valor del estadístico de prueba está dado por, \frac{1}{d_0} \frac{s_1^2}{s_2^2} y la distribución muestral es F_{n_1-1,n_2-1}.

Ejercicio 13.9  

El Amstat News (diciembre de 2004) lista los sueldos medios de profesores asociados de estadística en instituciones de investigación, en escuelas de humanidades y en otras instituciones en Estados Unidos. Suponga que una muestra de 200 profesores asociados de instituciones de investigación tiene un sueldo promedio de \$70750 anuales con una desviación estándar de \$6000. Suponga también que una muestra de 200 profesores asociados de otros tipos de instituciones tienen un sueldo promedio de \$65200 con una desviación estándar de \$5000. Pruebe la hipótesis de que el sueldo medio de profesores asocia dos de instituciones de investigación es \$2000 más alto que el de los profesores de otras instituciones. Utilice un nivel de significancia de 0.01. Para determinar si debe usar varianzas iguales o distintas, realice la prueba de hipótesis respectiva.

Walpole, Myers & Myers (2012). Probabilidad y estadística para ingeniería y ciencias. (9a. ed.) Pearson Educación. Ejercicio 10.32.

13.5 Relación entre pruebas de hipótesis e intervalos de confianza

¿Existe una relación entre las pruebas de hipótesis y los intervalos de confianza?

Una prueba de hipótesis a dos colas (H_a: \theta \neq \theta_0) con un nivel de significancia \alpha es equivalente a calcular un intervalo de confianza bilateral del 100(1-\alpha)\% para \theta y rechazar H_0 si \theta_0 está por fuera del intervalo.

En general, la región de “no rechazo” es equivalente a (es la transformación de) un intervalo de confianza del parámetro de interés.

13.6 Otras pruebas de hipótesis

En general, las pruebas de hipótesis vistas hasta ahora suponen que la variable de interés en la población tiene una distribución aproximadamente normal, o en unos pocos casos bastó con suponer que se tiene una muestra suficientemente grande, lo cual nos permitió utilizar las distribuciones muestrales vistas en el Capítulo 11 (Distribuciones muestrales).

¿Qué hacer en caso de que la distribución de la variable de interés en la población: no es cuantitativa continua, no es simétrica, no es gaussiana por la razón que sea, y además no contamos con una muestra suficientemente grande para aplicar el teorema de límite central?

Algunas alternativas de juzgamiento (prueba de hipótesis), en donde no se hacen supuestos distribucionales, se pueden consultar en el Apéndice E (Juzgamiento no paramétrico)

13.7 Al finalizar

Actividad autónoma independiente
  • No olvide seleccionar y resolver ejercicios (con respuesta) de un libro, acerca de lo visto en esta sección. Por ejemplo, seleccionar ejercicios del capítulo 10 (sin las secciones 10.6, 10.7, 10.11, 10.12 y 10.13) del libro de Walpole o de los capítulos 9, 10 y 11 (sin las secciones 9.7 y 9.8) del libro de Anderson.