miércoles, 2 de mayo de 2007

LA MUESTRA

9. POBLACIÓN Y MUESTRA

¿CÓMO SE DELIMITA UNA POBLACIÓN?

Una vez que se ha definido cuál será nuestra unidad de análisis, se procede a delimitar la población que va a ser estudiada y sobre la cual se pretende generalizar los resultados. Así, una población es el conjunto de todos los casos que concuerdan con una serie de especificaciones (Selítiz, 1974). La muestra suele ser definida como un subgrupo de la población (Sudman, 1976). Para seleccionar la muestra deben delimitarse las características de la población. Muchos investigadores no describen lo suficiente las características de la población o asumen que la muestra representa automáticamente a la población. Es frecuente que muchos estudios que únicamente se basan en muestras de estudiantes universitarios —porque ‘es fácil aplicarles el instrumento de medición, pues están a la mano”— hagan generalizaciones temerarias sobre jóvenes que probablemente posean otras características sociales. Es preferible entonces, establecer claramente las características de la población, a fin de delimitar cuáles serán los parámetros muestrales. Lo anterior puede ilustrarse con el ejemplo de la investigación sobre el uso de la televisión por los niños. Está claro que en dicha investigación la unidad de análisis son los niños. Pero, ¿de qué población se trata?, de ¿todos los niños del mundo?, de ¿todos los niños de la República Mexicana? Sería muy ambicioso y prácticamente imposible referirnos a poblaciones tan grandes. Así tenemos que en nuestro ejemplo la población fue delimitada de la siguiente manera:

Nuestra población comprende a todos aquellos directores generales de empresas industriales y comerciales que en 1983 tienen un capital social superior a 30 millones de pesos, con ventas superiores a los 100 millones de pesos y/o con más de 300 personas empleadas.

Vemos que en este ejemplo se delimita claramente la población, excluyendo a personas que no son los directores generales, a empresas que no pertenezcan al giro industrial y comercial, como por ejemplo bancos, hoteles, casas de bolsa. Se establece también claramente que se trata de empresas medianas y grandes con base en criterios de capital y de recursos humanos.

Algunos investigadores usan el término universo, pero los autores preferimos utilizar el término población, ya que como Kisch (1974), consideramos que universo es más bien un término descriptivo de un Conjunto infinito de datos, lo que no se aplica a la población.

Los criterios que cada investigador cumpla dependen de sus objetivos de estudio, lo que es importante es establecerlos claramente. Toda investigación debe ser transparente, sujeta a crítica y a réplica, y este ejercicio no es posible si al. examinar los resultados, el lector no puede referirlos a la población utilizada en un estudio.

¿CÓMO SELECCIONAR LA MUESTRA?

Hasta este momento hemos visto que se tiene que definir cuál será la unidad de análisis y cuáles son las características de la población. En este inciso hablaremos de la muestra o mejor dicho de los tipos de muestra que existen, a fin de poder elegir la más conveniente para un estudio.

La muestra es, en esencia, un subgrupo de la población. Digamos que es un subconjunto de elementos que pertenecen a ese conjunto definido en sus características al que llamamos población. Con frecuencia leemos y oímos hablar de “muestra representativa”, ‘muestra al azar “ “muestra aleatoria” como si con los simples términos se pudiera dar más seriedad a los resultados. En realidad, pocas veces se puede medir a toda la población, por lo que obtenemos o seleccionamos una muestra y se pretende —desde luego— que este subconjunto sea un reflejo fiel del conjunto de la población. Todas las muestras deben ser representativas, por tanto el uso de este término es por demás inútil. Los términos al azar y aleatorio denotan un tipo de procedimiento mecánico relacionado con la probabilidad y con la selección de elementos, pero no logra esclarecer tampoco el tipo de muestra y el procedimiento de muestreo. Hablemos entonces de esto en los próximos incisos.

Tipos de muestra.

Básicamente categorizamos a las muestras en dos grandes ramas: las muestras no probabilísticas y las muestras probabilísticas. En estas últimas todos los elementos de la población tienen la misma posibilidad de ser escogidos. Esto se obtiene definiendo las características de la población, el tamaño de la muestra y a través de una selección aleatoria y/o mecánica de las unidades de análisis. Imagínense el procedimiento para obtener el número premiado en un sorteo de lotería. Este número se va formando en el momento del sorteo, a partir de las bolitas (con un dígito) que se van sacando después de revolverías mecánicamente hasta formar el número, de manera que todos los números tienen la misma probabilidad de ser elegidos.

En las muestras no probabilísticas, la elección de los elementos no depende de la probabilidad, sino de causas relacionadas con las características del investigador o del que hace la muestra. Aquí el procedimiento no es mecánico, ni en base a fórmulas de probabilidad, sino que depende del proceso de toma de decisiones de una persona o grupo de personas, .y desde luego, las muestras seleccionadas por decisiones subjetivas tienden a estar sesgadas. El elegir entre una muestra probabilística o una no probabilística, depende —sí, otra vez— de los objetivos del estudio, del esquema de investigación y de la contribución que se piensa hacer con dicho estudio. Para ilustrar lo anterior mencionaremos varios ejemplos que toman en cuenta dichas consideraciones.

EJEMPLO

En un primer ejemplo tenemos una investigación sobre inmigrantes extranjeros en México, (Baptista et al. 1988). El objetivo de la investigación es documentar las experiencias de viaje, de vida y de trabajo. Para cumplir dicho propósito se seleccionó una muestra no probabilística de personas extranjeras que por diversas razones —económicas, políticas, fortuitas— hubieran llegado a México entre 1900 y 1960. Las personas se seleccionaron a través de conocidos, de asilos, de referencias. De esta manera se entrevistaron a 40 inmigrantes con entrevistas semiestructuradas que permitieron al sujeto hablar libremente sobre sus experiencias.

Comentado. En este caso una muestra no probabilística es adecuada pues se trata de un estudio con un diseño de investigación exploratorio, es decir, no es concluyente, sino su objetivo es documentar ciertas experiencias. Este tipo de estudio pretende generar datos e hipótesis que constituyan la materia prima para investigaciones más precisas.

¿CÓMO SE HACE UNA MUESTRA PROBABILÍSTICA?

Resumiremos diciendo que la elección entre la muestra probabilística y una no probabilística se determina con base en los objetivos del estudio, el esquema de la investigación y el alcance de sus contribuciones. Las muestras probabilísticas tienen muchas ventajas, quizás la principal es que puede medirse el tamaño de error en nuestras predicciones. Puede decirse incluso que el principal objetivo en el diseño de una muestra probabilística es el de reducir al mínimo este error al que se le llama error estándar (Kish, 1965).
Las muestras probabilísticas son esenciales en los diseños de investigación por encuestas en donde se pretende hacer estimaciones de variables en la población, estas variables se miden con instrumentos de medición (capítulo 9) y se analizan con pruebas estadísticas para el análisis de datos en donde se presupone que la muestra es probabilística, donde todos los elementos de la población tienen una misma probabilidad de ser elegidos. Los elementos muestrales tendrán valores muy parecidos a los de la población, de manera que las mediciones en el subconjunto, nos darán estimados precisos del conjunto mayor. Que tan preciso son dichos estimados depende del error en el muestreo, el que se puede calcular, pues hay errores que dependen de la medición y estos errores no pueden ser calculados matemáticamente.

El tamaño de la muestra.

Cuando se hace una muestra probabilística, uno debe preguntarse ¿Cuál es el número mínimo de unidades de análisis (personas, organizaciones, capítulos de telenovelas, etc.), que necesito para conformar una muestra (n) que me asegure un error estándar menor de .01 (fijado por nosotros), dado que la población N es aproximadamente de tantos elementos? En esta pregunta se inquiere cuál será la probabilidad de ocurrencia de , y de que el valor de —basado en n observaciones— se sitúe en un intervalo que comprenda al verdadero valor de la población. Es decir que mi estimado se acerque a , al valor real. Si nosotros establecemos el error estándar y fijamos .01, sugerimos que esta fluctuación promedio de nuestro estimado y con respecto a los valores reales de la población , no sea> .01, es decir que de 100 casos, 99 veces mi predicción sea correcta y que el valor de se sitúe en un intervalo de confianza que comprenda el valor de . La fórmula para determinar el tamaño de n es la siguiente:
Lo cual se ajusta si se conoce el tamaño de la población N. Entonces tendremos que:
Pongamos el siguiente ejemplo. En el ejemplo que ya habíamos dado en el inciso 8.2 de este capítulo, delimitamos a una población diciendo que para un estudio de directores generales consideramos a “todos aquellos directores generales de empresas industriales y comerciales que en 1983 tienen un capital social superior a 30 millones de pesos, con ventas superiores a los 100 millones de pesos y/o con más de 300 personas empleadas”. Con estas características se precisó que la población era de N = 1 176 directores generales ya que 1 176 empresas conformaban las mencionadas características. ¿Cuál es entonces el número de directores generales n que se tiene que entrevistar, para tener un error estándar menor de .015, y dado que la población total es del 176?

N = población de 1176 empresas.
= valor promedio de una variable = 1, un director general en cada empresa.
Se = error estándar - .015, lo determinamos. Es aceptable pues es muy pequeño.
V = varianza de la población. Su definición (Se)2 el cuadrado del error estándar.
S2 = varianza de la muestra expresada como la probabilidad de ocurrencia de

Sustituyendo tenemos que:
S2=p(1-p)=.9(1-.9)=.09
V= (.015)2=.000225
y ajustando tenemos que:
Es decir que, para nuestra investigación, necesitaremos una muestra de 298 directores generales.

Esto (como habíamos dicho) es el primer procedimiento para obtener la muestra probabilística: el determinar el tamaño de la misma, con base en estimados de la población. El segundo procedimiento estriba en cómo y de dónde seleccionar a esos 298 sujetos.

¿CÓMO SE LLEVA A CABO EL PROCEDIMIENTO DE SELECCIÓN?

Cuando iniciamos nuestra discusión sobre muestra probabilística, señalamos que dichos tipos de muestra dependen de dos cosas:

1) Del tamaño de la muestra; 2) del procedimiento de selección. De lo primero, hemos hablado con todo detalle, de lo segundo hablaremos ahora. Se determina el tamaño de la muestra n, pero ¿cómo seleccionar los elementos muestrales? Se precisa el número de racimos necesario ¿cómo se seleccionan a los sujetos dentro de cada racimo? Hasta el momento sólo hemos dicho que los elementos se eligen aleatoriamente, pero ¿cómo se hace esto?

Las unidades de análisis o los elementos muestrales se eligen siempre aleatoriamente para asegurarnos que cada elemento tenga la misma probabilidad de ser elegidos. Pueden usarse 2 procedimientos de selección:

Tómbola.

Muy simple y no muy rápido, consiste en numerar todos los elementos muestrales del 1..._ n. Hacer unas fichas, una por cada elemento, revolverías en una caja, e ir sacando n fichas, según el tamaño de la muestra. Los números elegidos —al azar— conformarán la muestra.

Números random o números aleatorios.

El uso de números random no significa la selección azarosa o fortuita, sino la utilización de una tabla de números que implica un mecanismo de probabilidad muy bien diseñado. Los números random de la Corporación Rand, fueron generados con una especie de ruleta electrónica. Existe una tabla de un millón de dígitos, publicada por esta corporación; partes de dicha tabla se encuentran en los apéndices de muchos libros de estadística.