9  Tests más potentes

En esta sección se hará una revisión de algunos aspectos generales relacionados con la potencia de un test, los tests más potentes, y los tests de razón de verosimilitudes.

9.1 Función de potencia de un test

Sea \tau un test no aleatorizado para el juzgamiento de H_0 con función crítica \varphi_{\tau}(\mathbf{x}). La función de potencia denotada como \pi_{\tau}(\theta) es una función con dominio \Theta y recorrido el intervalo (0,1), definida como, \pi_{\tau}(\theta) = P_{\theta} \left[ \varphi_{\tau}(\mathbf{X}) = 1\right]

Si \Theta_1 = \Theta_0^C, la función \beta_{\tau}(\theta) = 1 - \pi_{\tau}(\theta) es denominada curva característica de operación o curva CO del test \tau.

La función de potencia de un test en teoría perfecto \tau sería, \pi_{\tau} (\theta) = 1 - \mathrm{I}_{\Theta_0}(\theta) o equivalentemente la curva CO para un test en teoría perfecto \tau se establecería como, \beta_\tau(\theta) = 1 - \mathrm{I}_{\Theta_1}(\theta)

Ejercicio 9.1 El tiempo que una persona requiere para comprar una tarjeta de ingreso en el sistema de Transmilenio en la estación de Alcala durante el 2002, ha mostrado un comportamiento que sugiere el modelo Uniforme en el intervalo (0,\theta) para su descripción. Se afirma que el tiempo máximo de permanencia en la fila está entre dos y tres minutos. Para evaluar la afirmación y tomar los correctivos del caso, se va a registrar el tiempo empleado por n personas que serán elegidas por medio de un procedimiento especial de muestreo en la rampa de ingreso, y se propone la utilización del test, \tau : \text{ Rechazar } H_0 \text{ si } x_{(n)} \leq 1.9 \text{ o si } x_{(n)} > 3.1, para el juzgamiento de la hipótesis nula H_0 en el sistema, H_0 : \theta \in [2,3] \\ \text{frente a} \\ H_1 : \theta \notin [2,3]. Determinar la función de potencia del test propuesto.

La función de potencia del test propuesto es \begin{aligned} \pi_{\tau}(\theta) &= P \left[ \varphi_{\tau}(\mathbf{X}) = 1\right] \\ &= P \left[ X_{(n)} \leq 1.9 \text{ o } X_{(n)} > 3.1 \right] \\ &= P \left[ X_{(n)} \leq 1.9 \right] + P \left[ X_{(n)} > 3.1 \right] \\ &= P \left[ X_{(n)} \leq 1.9 \right] + 1 - P \left[ X_{(n)} \leq 3.1 \right] \\ &= \mathrm{F}_{X_{(n)}}(1.9;\theta) + 1 - \mathrm{F}_{X_{(n)}}(3.1;\theta) \end{aligned} donde, \mathrm{F}_{X_{(n)}}(x;\theta) = \left[\mathrm{F}_X(x) \right]^n = \frac{x^n}{\theta^n} \mathrm{I}_{[0,\theta)}(x) + \mathrm{I}_{[\theta,\infty)}(x), por lo tanto, \begin{aligned} \pi_{\tau}(\theta) &= \left( \mathrm{F}_{X_{(n)}}(1.9;\theta) + 1 - \mathrm{F}_{X_{(n)}}(3.1;\theta) \right) \mathrm{I}_{[0,\infty)}(\theta) \\ &= \frac{1.9^n}{\theta^n} \mathrm{I}_{[0,\theta)}(1.9) + \mathrm{I}_{[\theta,\infty)}(1.9) + \mathrm{I}_{[0,\infty)}(\theta) - \left( \frac{3.1^n}{\theta^n} \mathrm{I}_{[0,\theta)}(3.1) + \mathrm{I}_{[\theta,\infty)}(3.1) \right) \\ &= \frac{1.9^n}{\theta^n} \mathrm{I}_{(1.9,\infty)}(\theta) + \mathrm{I}_{(0,1.9]}(\theta) + \mathrm{I}_{[0,\infty)}(\theta) - \frac{3.1^n}{\theta^n} \mathrm{I}_{(3.1,\infty)}(\theta) - \mathrm{I}_{(0,3.1]}(\theta) \\ &= \mathrm{I}_{[0,\infty)}(\theta) + \mathrm{I}_{(0,1.9]}(\theta) - \mathrm{I}_{(0,3.1]}(\theta) + \frac{1.9^n}{\theta^n} \mathrm{I}_{(1.9,\infty)}(\theta) - \frac{3.1^n}{\theta^n} \mathrm{I}_{(3.1,\infty)}(\theta) \\ &= \mathrm{I}_{(0,1.9]}(\theta) + \mathrm{I}_{(1.9,3.1]}(\theta) + \mathrm{I}_{(3.1,\infty]}(\theta) \\ & \quad + \mathrm{I}_{(0,1.9]}(\theta) \\ & \quad - \mathrm{I}_{(0,1.9]}(\theta) - \mathrm{I}_{(1.9,3.1]}(\theta) \\ & \quad + \frac{1.9^n}{\theta^n} \mathrm{I}_{(1.9,3.1]}(\theta) + \frac{1.9^n}{\theta^n} \mathrm{I}_{(3.1,\infty)}(\theta) \\ & \quad - \frac{3.1^n}{\theta^n} \mathrm{I}_{(3.1,\infty)}(\theta) \\ &= \mathrm{I}_{(0,1.9]}(\theta) + \frac{1.9^n}{\theta^n} \mathrm{I}_{(1.9,3.1]}(\theta) + \left( 1 + \frac{1.9^n}{\theta^n} - \frac{3.1^n}{\theta^n} \right) \mathrm{I}_{(3.1,\infty)}(\theta) \end{aligned}

Código
n <- 8
t1 <- seq(0.0001, 1.9, 0.0001)
p1 <- rep(1, length(t1))
t2 <- seq(1.9001, 3.1, 0.0001)
p2 <- (1.9 / t2)^n
t3 <- seq(3.1001, 5, 0.0001)
p3 <- 1 + (1.9 / t3)^n - (3.1 / t3)^n
plot(c(t1, t2, t3), c(p1, p2, p3), type = "l", bty = "n", main = paste0("n = ", n),
     xlab = expression(theta), ylab = expression(pi[tau](theta)), col = "red")
segments(c(0,2,3), c(1,0,1), c(2,3,5), c(1,0,1), lty = 2, col = "blue", lwd = 2)

Código
n <- 800
p1 <- rep(1, length(t1))
p2 <- (1.9 / t2)^n
p3 <- 1 + (1.9 / t3)^n - (3.1 / t3)^n
plot(c(t1, t2, t3), c(p1, p2, p3), type = "l", bty = "n", main = paste0("n = ", n),
     xlab = expression(theta), ylab = expression(pi[tau](theta)), col = "red")
segments(c(0,2,3), c(1,0,1), c(2,3,5), c(1,0,1), lty = 2, col = "blue", lwd = 2)

9.2 Test más potente

Definición 9.1 Sea el sistema de hipótesis, H_0 : \theta = \theta_0 \\ \text{frente a} \\ H_1 : \theta = \theta_1 el test \tau se denomina test más potente para H_0, con nivel \alpha, si, \pi_{\tau}(\theta_0) = \alpha y \pi_{\tau}(\theta_1) \leq \pi_{\tau^*}(\theta_1) para todo test \tau^* de nivel menor o igual a \alpha.

9.3 Test uniformemente más potente (UMP)

Definición 9.2 Sea el sistema de hipótesis, H_0 : \theta \in \Theta_0 \\ \text{frente a} \\ H_1 : \theta \in \Theta_1 el test \tau se denomina test uniformememte más potente (test UMP), para H_0, con nivel \alpha, si, \sup_{\theta \in \Theta_0} \pi_{\tau}(\theta) = \alpha y \pi_{\tau}(\theta) \leq \pi_{\tau^*}(\theta) para todo \theta \in \Theta_1 y para todo test \tau^* de nivel menor o igual a \alpha.

¿existe algún mecanismo para obtener o construir el mejor test posible para cada situación (el test más potente para cada sistema de hipótesis y cada \alpha dados)?

9.4 Razón simple de verosimilitudes

Definición 9.3 Sea el sistema de hipótesis simples, H_0 : \theta = \theta_0 \\ \text{frente a} \\ H_1 : \theta = \theta_1, el siguiente test se denomina test de razón simple de verosimilitudes de nivel \alpha: \tau : \text{ Rechazar } H_0 \text{ si } W\left(x_1, \dots, x_n \right) < k, donde, W\left(x_1, \dots, x_n \right) = \frac{\mathrm{L}\left(\theta_0; x_1, \dots, x_n \right)}{\mathrm{L}\left(\theta_1; x_1, \dots, x_n \right)}, y k es una constante tal que, P_{\theta_0} \big[ W\left(X_1, \dots, X_n \right) < k \big] = \alpha

9.5 Lema de Neyman Pearson

Teorema 9.1 El test de razón simple de verosimilitudes es un test más potente para H_0.

9.6 Razón generalizada de verosimilitudes

Definición 9.4 Sea el sistema de hipótesis, H_0 : \theta \in \Theta_0 \\ \text{frente a} \\ H_1 : \theta \in \Theta_1, con \Theta_1 \cup \Theta_0 = \Theta (hipótesis antitéticas), el siguiente test se denomina test de razón simple de verosimilitudes de nivel \alpha: \tau : \text{ Rechazar } H_0 \text{ si } W\left(x_1, \dots, x_n \right) < k, donde, W\left(x_1, \dots, x_n \right) = \frac{ \underset{\theta \in \Theta_0}{\sup} \; \mathrm{L}\left(\theta; x_1, \dots, x_n \right)}{\underset{\theta \in \Theta}{\sup} \; \mathrm{L}\left(\theta; x_1, \dots, x_n \right)}, y k es una constante tal que, \underset{\theta \in \Theta_0}{\max} \; P_{\theta} \big[ W\left(X_1, \dots, X_n \right) < k \big] = \alpha.

Note que el denominador de W\left(x_1, \dots, x_n \right) es la función de verosimilitud evaluada en el estimador máximo verosímil de \theta.

Por otra parte, debemos conocer la distribución de W = W\left(X_1, \dots, X_n \right), para poder establecer la constante k, la cual necesitamos para terminar de formular por completo el test. Con frecuencia tendremos que recurrir a tests equivalentes derivados de W (tests a partir de variables aleatorias resultantes de aplicar una serie de operaciones a W) en donde la distribución sea conocida. Otra alternativa es usar distribuciones asintóticas (aproximaciones), en aquellos casos en donde se considere que la muestra es suficientemente grande.

9.7 Razón monótona de verosimilitudes (MLR)

Definición 9.5 Una familia de densidades \left\{\mathrm{f}_X\left(x ; \theta\right) : \theta \in \Theta \subseteq \mathbb{R}\right\} se dice que tiene una razón monótona de verosimilitudes (MLR) en la estadística T = T(X_1, \dots , X_n), si para dicha estadística, el cociente, \frac{\mathrm{L}\left(\theta_1; x_1, \dots, x_n \right)}{\mathrm{L}\left(\theta_2; x_1, \dots, x_n \right)} es una función no creciente o no decreciente de T(x_1, \dots , x_n), para cada \theta_1 < \theta_2.

Ejercicio 9.2 Realice la deducción analítica completa que muestra que la familia de densidades Poisson tiene razón monótona de verosimilitudes en la estadística T = \bar{X}.

9.8 UMP bajo MLR

Teorema 9.2 Sea X_1, \dots, X_n una muestra aleatoria de una población con densidad perteneciente a una familia de densidades con MLR en la estadística T = T(X_1, \dots , X_n). Si dentro del juzgamiento de la hipótesis nula H_0 se considera el sistema de hipótesis, H_0 : \theta \leq \theta_0 \\ \text{frente a} \\ H_1 : \theta > \theta_0, y si la razón MLR es:

  1. no decreciente, entonces,

    \tau : \text{ Rechazar } H_0 \text{ si } T(x_1, \dots , x_n) < k es un test uniformemente más potente (UMP) para H_0, donde k es tal que, P_{\theta_{0}}\left[ T(X_1, \dots , X_n) < k \right] = \alpha

  2. no creciente, entonces,

    \tau : \text{ Rechazar } H_0 \text{ si } T(x_1, \dots , x_n) > k es un test uniformemente más potente (UMP) para H_0, donde k es tal que, P_{\theta_{0}}\left[ T(X_1, \dots , X_n) > k \right] = \alpha

9.9 UMP bajo familia exponencial

Teorema 9.3 Sea X_1, \dots, X_n una muestra aleatoria de una población con distribución perteneciente a la familia exponencial unidimensional. Si dentro del juzgamiento de la hipótesis nula H_0 se considera el sistema de hipótesis, H_0 : \theta \leq \theta_0 \, \left(\text{o }\theta = \theta_0\right)\\ \text{frente a} \\ H_1 : \theta > \theta_0, si T es la estadística natural de la familia \left(T = \sum_{i=1}^n \mathrm{T}(X_i)\right), y si \mathrm{c}(\theta) es una función monótona:

  1. creciente de \theta, entonces,

    \tau : \text{ Rechazar } H_0 \text{ si } T > k es un test uniformemente más potente (UMP) para H_0, donde k es tal que, P_{\theta_{0}}\left[ T > k \right] = \alpha

  2. decreciente de \theta, entonces,

    \tau : \text{ Rechazar } H_0 \text{ si } T < k es un test uniformemente más potente (UMP) para H_0, donde k es tal que, P_{\theta_{0}}\left[ T < k \right] = \alpha