9 Principios
En esta sección se hará una revisión de algunos temas relacionados con los principios de inferencia.
Recordemos la relación entre los tres grandes bloques del curso:
- Lea todo el contenido de la presente sección (Inferencia, 9 Principios).
En sus propias palabras, haga una exposición escrita (como si le estuviera explicando a un compañero o amigo) acerca de lo que aprendió a partir de lo leído, incluya su discusión, reflexiones y conclusiones al respecto. Luego, exponga lo que no entendió e intente encontrar por su cuenta respuestas a las preguntas que le surgieron, para que las pueda compartir en clase.
9.1 Muestreo
Ejercicio 9.1 Supongamos que queremos saber si una persona tiene algún problema de salud o presenta alguna enfermedad mediante un examen de sangre.
- ¿Es necesario extraer toda su sangre o es suficiente con tomar solo una pequeña cantidad? ¿por qué?
- ¿Una pequeña cantidad representa bien lo que ocurre en todo el cuerpo? ¿por qué? ¿qué pasaría si no fuera así? ¿se puede tomar de cualquier parte? ¿por qué?
- ¿Estaría bien sacar conclusiones acerca de lo que ocurre en todo el cuerpo (toda la sangre) a partir de una pequeña cantidad? ¿por qué?
- ¿Qué es una muestra?
- ¿Por qué se necesita una muestra?
- ¿Cómo puedo garantizar que la muestra en realidad “representa adecuadamente” a la población?
9.1.1 Muestra aleatoria
Lo que necesito, desde la teoría, es lo siguiente:
Definición 9.1 (Muestra aleatoria) Si X_1, X_2, \dots, X_n son n variables aleatorias independientes e igualmente distribuidas con distribución F_X(x), entonces X_1, X_2, \dots, X_n es una muestra aleatoria, de tamaño n, de la población con distribución F_X(x).
En una muestra aleatoria, X_1, X_2, \dots, X_n son variables aleatorias que me hablan acerca de todos los posibles valores de la variable de interés que potencialmente podría obtener para mi muestra, valores cuyas probabilidades se rigen por la distribución (poblacional) de dicha variable de interés. Utilizaremos la notación x_1, x_2, \dots, x_n para referirnos a los valores de la variable de interés que efectivamente obtuvimos en una muestra obtenida, es decir, es una realización de la muestra aleatoria de todas las que se podrían haber obtenido.
¿Desde la práctica, cómo puedo garantizar que la muestra en realidad se obtuvo aleatoriamente?
9.1.2 Muestreo aleatorio simple
Ejercicio 9.2
Fortune publica datos sobre ventas, valor del activo, valor de mercado y utilidades por acción de las 500 corporaciones industriales más grandes de Estados Unidos (Fortune 500, 2006). Suponga que usted desea seleccionar una muestra aleatoria simple de 10 corporaciones de la lista Fortune 500. Identifique los números de las 10 corporaciones que se tomarán para la muestra.
Anderson, Sweeney, Williams & Camm (2016). Estadística para Negocios y Economía. (12a. ed.) Cengage Learning. Capítulo 7. Ejercicio 3.
Muestreo aleatorio simple (población finita): Una muestra aleatoria simple de tamaño n de una población finita de tamaño N es aquella que es seleccionada de tal manera que cada posible muestra (de tamaño n) tiene la misma probabilidad de ser seleccionada.
Muestreo aleatorio simple (población infinita): Cada individuo se selecciona de manera independiente.
Obtención de valores seudoaleatorios “igualmente probables”:
- En la calculadora:
RAN#
- En una hoja de cálculo: Funciones
ALEATORIO()
yALEATORIO.ENTRE(inferior; superior)
. - En el software estadístico R: Función
sample(x, size, replace = FALSE, prob = NULL)
. - Simple Random Sampling Applet
- Generate Random Numbers
9.1.3 Otros tipos de muestreo
Muestreo estratificado: En este caso los individuos de la población se pueden dividir en grupos (homogéneos en su interior y heterogéneos entre ellos) y se desea que en la muestra se tenga una representación adecuada de cada uno de estos grupos. Es así que se toma una muestra aleatoria simple de individuos de cada grupo, de tal manera que en la muestra se conserve la proporción de los tamaños de los grupos.
Muestreo por conglomerados: En este caso los individuos de la población están divididos en segmentos que no necesariamente son homogéneos, cada segmento es una buena representación en menor escala del comportamiento de toda la población y por lo tanto no es necesario tomar individuos de todos los segmentos. Es así que se toma una muestra aleatoria simple de los segmentos y luego para cada segmento seleccionado se toma una muestra aleatoria simple de individuos.
Muestreo sistemático: En este caso, los elementos de la población son seleccionados de manera sistemática a través de la población. La idea es tomar aleatoriamente un individuo por cada cierto número de individuos, es decir, tomo aleatoriamente un individuo de los primeros k, luego uno de los siguientes k y así sucesivamente.
9.2 Conceptos básicos
Conceptos básicos ya mencionados:
- Población.
- Variable.
- Distribución.
- Parámetro.
Imaginemos todas las situaciones en las que NO tendremos datos poblacionales sino únicamente datos muestrales, como por ejemplo la que tenemos a continuación.
En un estudio de USA Today/CNN/Gallup realizado con 369 padres que trabajan, se encontró que 200 consideran que pasan muy poco tiempo con sus hijos debido a sus compromisos laborales (supongan que también les preguntan el tiempo al día que pasan con sus hijos, entre otras preguntas).
- ¿Cuál sería la población en esta situación?
- ¿Cuáles serían las variables?
- ¿Cuál sería la distribución de cada variable?
- ¿Cuál sería el parámetro o los parámetros de la distribución de cada variable?
Adaptado de: Anderson, Sweeney, Williams & Camm (2016). Estadística para Negocios y Economía. (12a. ed.) Cengage Learning. Capítulo 8. Ejercicio 54.
Ejercicio 9.3 Lance una moneda 10 veces consecutivas, registrando los diez resultados obtenidos. Considere que dichos resultados son la realización de una muestra aleatoria de tamaño 10.
- ¿Cuál sería la población en esta situación?
- ¿Cuál sería la variable?
- ¿Cuál sería la distribución de la población?
- ¿Cuál sería el parámetro o los parámetros de dicha distribución?
Conceptos básicos adicionales:
Estadístico: Cualquier cálculo o cómputo (fórmula) a partir de la muestra, es decir, cualquier función de las variables de una muestra aleatoria.
Estimador: Función de la muestra aleatoria (estadístico) que es usado para estimar un parámetro de una población.
Estimación: Valor que toma un estimador a partir de los datos que tenemos asociados a la muestra aleatoria.
En un estudio de USA Today/CNN/Gallup realizado con 369 padres que trabajan, se encontró que 200 consideran que pasan muy poco tiempo con sus hijos debido a sus compromisos laborales (supongan que también les preguntan el tiempo al día que pasan con sus hijos, entre otras preguntas).
- ¿Cuál sería una buena fórmula a utilizar para estimar el o los parámetros de la distribución de cada variable/pregunta?
- Suponga que todos tomamos una muestra, ¿todos obtenemos las mismas estimaciones?
Adaptado de: Anderson, Sweeney, Williams & Camm (2016). Estadística para Negocios y Economía. (12a. ed.) Cengage Learning. Capítulo 8. Ejercicio 54.
Relación entre los conceptos:
Ejercicio 9.4
Defina las poblaciones adecuadas a partir de las cuales se seleccionaron las siguientes muestras:
Se llamó por teléfono a personas de 200 casas en la ciudad de Richmond y se les pidió nombrar al candidato por el que votarían en la elección del presidente de la mesa directiva de la escuela.
Se lanzó 100 veces una moneda y se registraron 34 cruces
Se probaron 200 pares de un nuevo tipo de calzado deportivo en un torneo de tenis profesional para determinar su duración y se encontró que, en promedio, duraron 4 meses.
En cinco ocasiones diferentes a una abogada le tomó 21, 26, 24, 22 y 21 minutos conducir desde su casa en los suburbios hasta su oficina en el centro de la ciudad.
Walpole, Myers & Myers (2012). Probabilidad y estadística para ingeniería y ciencias. (9a. ed.) Pearson Educación. Ejercicio 8.1.
- No olvide seleccionar y resolver ejercicios (con respuesta) de un libro, acerca de lo visto en esta sección.