5 Aspectos generales
En esta sección se hará una revisión de algunos aspectos generales relacionados con la estimación por intervalo, específicamente en cuanto a conceptos y definiciones iniciales. Adicionalmente, se presentará la idea general detrás del método de la variable pivote.
5.1 Conceptos y definiciones iniciales
Sean X_1, \dots, X_n una muestra aleatoria de una población con función de densidad \mathrm{f}_X(x;\theta), \theta \in \Theta, \mathrm{g}(\theta) una función cuyo recorrido es un conjunto de números reales, y las estadísticas T^{(1)} = \mathrm{T}^{(1)}\left( X_1, \dots, X_n \right) y T^{(2)} = \mathrm{T}^{(2)}\left( X_1, \dots, X_n \right).
Un intervalo aleatorio es un intervalo en el cual al menos uno de sus extremos es una variable aleatoria.
Sean T^{(1)} y T^{(2)} tales que P\left[T^{(1)} < T^{(2)}\right] = 1; el intervalo aleatorio \left(T^{(1)}, T^{(2)}\right) se denomina intervalo de confianza del 100(1-\alpha)\% para \mathrm{g}(\theta), si \mathrm{P}\left[T^{(1)} < \mathrm{g}(\theta) < T^{(2)}\right] = 1 - \alpha probabilidad que no depende de \theta. El valor 1 - \alpha se denomina nivel de confianza, T^{(1)} se denomina límite de confianza inferior para \mathrm{g}(\theta) y T^{(2)} se denomina límite de confianza superior para \mathrm{g}(\theta). Una realización particular del intervalo de confianza se denomina estimación por intervalo del 100(1 - \alpha)\% de confianza para \mathrm{g}(\theta).
El intervalo aleatorio \left( T^{(1)}, \infty \right) es un intervalo de confianza unilateral del 100(1-\alpha)\% para \mathrm{g}(\theta), si P\left[T^{(1)} < \mathrm{g}(\theta) \right] = 1 - \alpha probabilidad que no depende de \theta. T^{(1)} recibe el nombre de límite de confianza inferior unilateral para \mathrm{g}(\theta).
El intervalo aleatorio \left( -\infty, T^{(2)} \right) es otro intervalo de confianza unilateral del 100(1-\alpha)\% para \mathrm{g}(\theta), si se tiene que, P\left[\mathrm{g}(\theta) < T^{(2)}\right] = 1 - \alpha probabilidad que no depende de \theta. T^{(2)} recibe el nombre de límite de confianza superior unilateral para \mathrm{g}(\theta).
Sea \left(T^{(1)}, T^{(2)}\right) un intervalo de confianza para \theta; si \mathrm{g}(\theta) es una función estrictamente monótona con dominio \Theta y recorrido un subconjunto de los números reales, entonces, cuando \mathrm{g}(\theta) es estrictamente creciente, \Big(\mathrm{g}\left(T^{(1)}\right), \mathrm{g}\left(T^{(2)}\right)\Big) es un intervalo de confianza para \mathrm{g}(\theta), y, cuando es estrictamente decreciente, \Big(\mathrm{g}\left(T^{(2)}\right), \mathrm{g}\left(T^{(1)}\right)\Big) es un intervalo de confianza para \mathrm{g}(\theta).
Sea \mathrm{A} \left( x_1, \dots, x_n \right) un subconjunto del espacio de observaciones. \mathrm{A}\left( X_1, \dots, X_n \right) se denomina región de confianza del 100(1-\alpha)\% para el parámetro \theta, si P \big[ \theta \in \mathrm{A}\left( X_1, \dots, X_n \right) \big] = 1 - \alpha probabilidad que no depende de \theta.
5.2 Método de la variable pivote
Sea Q_X = \mathrm{Q}(\theta, X_1, \dots, X_n) una función del parámetro \theta y de las variables que conforman la muestra aleatoria X_1, \dots, X_n. Q se denomina variable aleatoria pivote para el parámetro \theta si la distribución de Q no depende de \theta.
Ejercicio 5.1 Para una muestra aleatoria de una población Normal de media \mu = \theta y varianza \sigma^2 conocida, determine si, Q = \frac{\bar{X} - \theta}{\sigma/\sqrt{n}} = \frac{\sqrt{n}(\bar{X} - \theta)}{\sigma} es una variable pivote para \theta (es decir, determine la distribución de la variable aleatoria Q, en donde será evidente si esta depende o no de \theta).
El método de la variable pivote para la construcción de intervalos de confianza consiste en:
- Determinar una variable pivote.
- Obtener los cuantiles a y b a partir del nivel de confianza dado (1 - \alpha), de tal forma que, P \left[a < Q < b \right] = 1 - \alpha,
- Realizar las transformaciones que sean necesarias (por medio de sucesos/eventos aleatorios que sean equivalentes), con el objetivo de llegar a la forma, P \left[ T^{(1)} < \mathrm{g}(\theta) < T^{(2)} \right] = 1 - \alpha concluyendo así que el intervalo \left(T^{(1)}, T^{(2)}\right) es un intervalo de confianza del 100(1-\alpha)\% para \mathrm{g}(\theta).
Ejercicio 5.2 Para una muestra aleatoria de una población Normal de media \mu = \theta y varianza \sigma^2 conocida, a partir de una variable pivote, obtenga un intervalo de confianza bilateral del 100(1-\alpha)\% para \theta.
De la solución del Ejercicio 5.1, sabríamos que Q = \frac{\sqrt{n}(\bar{X} - \theta)}{\sigma} es una variable pivote y conoceríamos su respectiva distribución (la cual no depende de \theta). Es así que para un 1 - \alpha dado, gracias a esa distribución, podríamos encontrar a y b tales que, P \left[ a < Q < b \right] = 1 - \alpha
Para los a y b que encontremos y transformando la variable pivote Q, tenemos que, \begin{aligned} P \left[ a < Q < b \right] &= 1 - \alpha \\ P \left[ a < \sqrt{n} \frac{\bar{X} - \theta}{\sigma} < b \right] &= 1 - \alpha \\ P \left[ \frac{a \sigma}{\sqrt{n}} < \bar{X} - \theta < \frac{b \sigma}{\sqrt{n}} \right] &= 1 - \alpha \\ P \left[ - \bar{X} + \frac{a \sigma}{\sqrt{n}} < - \theta < - \bar{X} + \frac{b \sigma}{\sqrt{n}} \right] &= 1 - \alpha \\ P \left[ \bar{X} - \frac{b \sigma}{\sqrt{n}} < \theta < \bar{X} - \frac{a \sigma}{\sqrt{n}} \right] &= 1 - \alpha. \end{aligned}
Dados los datos de la muestra \left(x_1, x_2, \dots, x_n\right), una estimación por intervalo (un intervalo de confianza) del 100(1 - \alpha)\% de nivel de confianza para \theta sería, \left(\bar{x} - (b) \frac{\sigma}{\sqrt{n}} < \theta < \bar{x} + (-a) \frac{ \sigma}{\sqrt{n}} \right) donde a y b son tales que, P \left[a < Q < b \right] = 1 - \alpha para Q con distribución conocida que no depende de \theta.