3 Diseño de estudios estadísticos

El objetivo de este tema es tener el conocimiento de las etapas necesarias para el diseño de un estudio estadístico vinculado con la recolección de información.

Todo estudio estadístico vinculado con recolección de información debe partir de una pregunta de investigación, esta sirve como guía para el diseño estadístico y todas sus etapas; estas etapas son:

  1. Temática: Se formaliza y se plantea un marco teórico/conceptual de la pregunta de investigación, en esta etapa se identifican indicadores, variables y preguntas. La finalidad es contar con un cuestionario.
  2. Encuesta por muestreo (otra aproximación): Tiene la finalidad de establecer el mecanismo para acceder a la población de estudio, de tal forma que esta información sea valida (representativa). La salida de esta etapa normalmente es un listado de unidades a entrevistar.
  3. Operativo de campo (paradata): Se refiere al componente logístico para efectivizar el listado de unidades a entrevistar. La salida de esta etapa son los cuestinarios con información
  4. Sistema/procesamiento: Esta etapa es la responsable de contar con una base de datos a partir del cuestionario y la recolección de operativo de campo. Su salida es la base de datos.

3.1 Pregunta de investigación

  • ¿Cuáles son los ingresos, edades y lugares de trabajo de los niños y niñas trabajadores del municipio de La Paz? (descriptiva)
  • Situación de Madres adolescentes en Bolivia (descriptiva)
  • El nivel de Empoderamiento de las Madres adolescentes en Bolivia (descriptiva)
  • Los migrantes cuando llegan a nuestro país de que viven (descriptiva)
  • ¿la dactilo-pintuta como estrategia permitirá una estimulación favorable para la coordinación oculo-manual en niñas y niños de 5-6 años de edad de la Unidad Educativa Vicente Donoso Torres? (relación causa/efecto). \(Estimulación->Coordinación\)
  • La falta de desayuno escolar en estudiantes de primaria y secundaria, tendrá algún efecto en la salud. (relación causa/efecto)
  • Conocimientos, prácticas y vivencias de violencias en adolescentes. (descriptiva)
  • ¿Cuáles son las causas principales de los embarazos tempranos de las adolescentes en Bolivia? (relación causa/efecto)

Las recomendaciones principales para formular una pregunta de investigación son; (1) establecer claramente la población de estudio, (2) establecer la temática de interés sobre la población. Las preguntas pueden tener un sentido descriptivo o abordar aspectos de causa/efecto.

Después de plantear la pregunta de investigación que responde principalmente a la motivación del investigador, siguen varias etapas tradicionales como; definir objetivos, planteamiento del problema, justificación, hipótesis.

3.2 Tipos de estudios estadísticos

Están orientados al sentido de la pregunta de investigación, en obtener información descriptiva o información de tipo causa/efecto, incluyendo en lo descriptivo la necesidad o no de obtener información representativa. Estos son tres:

  • Diseños experimentales: Por excelencia el método más puro para obtener una relación de causa y efecto.
  • Muestra aleatoria: Se usa principalmente para preguntas de tipo descriptivo, el censo es un caso particular de una muestra aleatoria. En este tipo de estudios es posible medir una relación de causa/efecto pero con más errores, aproximando con técnicas cuasi-experimentales
  • Estudios Observacionales: No tienen la finalidad de lograr resultados representativos de una población y tampoco permiten tener una medida para relaciones de causa efecto, son estudios del tipo exploratorios (sondeos). Son útiles para problemáticas sociales complejas o cuando es difícil de acceder a la población.

3.3 Tipos de variables

  • Principales/resultado/predictivas: Corresponden a las variables asociadas a responder la pregunta de investigación. (\(X->Y\))
  • Control: Variables auxiliares que se pueden medir y que ayudan o complementan el conocimiento al rededor de las variables principales.
  • Disturbio: Variables que no se pueden medir y que afectan a las variables principales
  • Aleatorias (Ruido blanco): Son el resto de variables que no afecta a las variables principales

Ejemplo, se busca entender la relación entre la educación y los ingresos de las personas.

  • Principales: Ingreso, educación
    • Persona 1, universitaria: 3000 Bs
    • Persona 2, universitaria: 7000 Bs
  • Control: Lugar de trabajo, puesto, experiencia, edad, sexo, carrera, tiempo de trabajo (medio/completo), tipo de contrato
  • Disturbio: Habilidades, motivación, acuerdo de relación (amigo, partidaria, familia, aval), suerte
  • Aleatorias (Ruido blanco): Color del cabello, nombre de su madre

3.4 Temática y el diseño de cuestionarios

Esta es la primera etapa en un proceso de recolección de datos, busca traducir la pregunta de investigación en indicadores medibles por medio de variables y planteadas en un cuestionario para la población objetivo.

  1. Se inicia con un marco conceptual donde se definen los conceptos planteados en la pregunta de investigación. (Rev. de literatura)
  2. Definir indicadores medibles y sus variables a partir del paso anterior.
  3. Convertir las variables en preguntas para el cuestionario
  4. Identificar variables de control para introducirlas en el cuestionario
  5. Diseñar el cuestionario

Ejemplo, ¿Los migrantes cuando llegan a nuestro país de que viven?

  1. ¿Qué es un migrante?,

Tarea, plantear hasta el paso que pueda para los temas de empoderamiento o pobreza

Ejemplo

Pobreza: + La ONU ha definido a la pobreza como “la condición caracterizada por una privación severa de necesidades humanas básicas, incluyendo alimentos, agua potable, instalaciones sanitarias, salud, vivienda, educación e información. + El sociólogo George Simmel sostiene que la “pobreza,” en términos sociológicos, refiere no tanto a las personas con bajos ingresos sino a aquellos que son dependientes: “La persona pobre, sociológicamente hablando, es el individuo que recibe asistencia porque carece de medios de subsistencia” (Simmel, 1965: 140). + Baratz y Grigsby hablan de la pobreza como “una privación severa de bienestar físico y bienestar mental, estrechamente asociada con inadecuados recursos económicos y consumos” (1971: 120). + Gary Fields (2001) define la pobreza como la incapacidad de un individuo o una familia para disponer de los recursos suficientes para satisfacer sus necesidades básicas. + Ringen sostiene que la pobreza es un “nivel de consumo que está por debajo de lo que generalmente es considerado el mínimo decente” (1988: 354). El Banco Mundial define a la pobreza como “la incapacidad para alcanzar un nivel de vida mínimo”

Indicador: ¿Cómo se mide la pobreza?. \[FGT_{\alpha}=\frac{1}{N}\sum_{i=1}^{H}({\frac {z-y_{i}}{z}})^{\alpha}\]

Variables:

Donde, \(N:\) es el tamaño de la población, \(y_i\) es el gasto o ingreso per cápita del hogar donde proviene el individuo, \(z:\) linea de pobreza y \(\alpha:\) es un parámetro de "sensibilidad. \(H\) es el número total de personas cuyo ingreso o gasto per cápita está por debajo de la línea de pobreza.

Preguntas: Se debe construir el ingreso de las personas:

  • Ingreso Laboral
    • Dependientes
      • ¿Durante el último mes, cuál fue su salario sin contar los descuentos (liquido)?
    • Independientes
      • ¿Durante el último mes, cuál fue su ingreso descontando gastos de insumos/producción y servicios de su activad económica?
  • Ingreso no laboral
    • ¿Durante el último mes, recibió ingresos por bonos o rentas?
    • ¿Durante el último mes, recibió ingresos por alquileres?
    • ¿Durante el último mes, recibió ingresos por remesas del exterior?

3.4.1 Tipos de preguntas

El tipo de pregunta en un cuestionario depende de establecer la respuesta que se espera.

  • Preguntas cerradas con opciones fijas de selección única
    • ¿Es hombre o mujer
        1. Hombre
        1. Mujer
    • ¿Qué relación o parentesco tiene (…) con el jefe o jefa del hogar?
        1. JEFE O JEFA DEL HOGAR
        1. ESPOSA/O O CONVIVIENTE
        1. HIJO/A O ENTENADO/A
        1. YERNO O NUERA
        1. HERMANO/A O CUÑADO/A
        1. PADRES
        1. SUEGROS
        1. NIETO/NIETA
        1. OTRO PARIENTE
        1. OTRO QUE NO ES PARIENTE
        1. EMPLEADA/O DEL HOGAR CAMA ADENTRO
        1. PARIENTE DE LA EMPLEADA/O DEL HOGAR
  • Preguntas cerradas con opciones fijas de selección múltiple
    • ¿Qué deportes usted practica?
      • Natación
      • Futbol
      • Volley
      • Basketball
      • Wally
      • Raquet
      • Ninguno
      • Otros
  • Preguntas abiertas; Texto
    • ¿Cuál es el nombre y apellido de cada una de las personas que viven habitualmente en este hogar (empezando por el/la Jefe/a del Hogar)?
    • ¿Cuál es el idioma o lengua en el que aprendió a hablar en su niñez?
  • Preguntas Numéricas:
    • ¿Cuántos años cumplidos tiene?
    • ¿Cuántos hijos tiene?}
    • ¿Número de miembros del hogar?
  • Preguntas de tipo Fecha
    • ¿Cuál es la fecha de su nacimiento?

Para las preguntas cerradas, es posible volverlas semi abiertas, cuando se incluye opciones como: especificar.

En el caso de las preguntas cerradas de selección única, son bastante populares las preguntas que incluyen escalas, la escala más popular es la escala de Likert

Nota. Para las categorías de las respuestas cerradas es una buena práctica codificar las categorías, esto permite mejorar la captura de la información.

3.4.2 Formas para diseñar un cuestionario

Se refiere a crear y diseñar el cuestionario, las dos opciones que existen son:

  • Para impresión en papel; Cara a cara, Autollenado
    • Excel
    • Word
    • Otras
  • Encuestas digitales; cara a cara, autollenado web
    • Google forms
    • Survey monkey
    • Kobo Collect
    • CsPro

3.4.3 Documentacion al respecto los cuestionarios

Hay varios documentos que se generan para el uso correcto de los cuestionarios, entre ellos:

  • Glosario de términos
  • Diccionario de preguntas
  • Diagramas de flujo; siempre y cuando existan flujos/saltos en el cuestionario
  • Matriz de indicadores/preguntas

3.5 Muestreo estadístico

El muestreo estadístico se refiere a obtener una muestra representativa de la población de interés, este método se aplica cuando no es posible realizar una recolección completa de la población (censo).

Algunos conceptos relevantes:

  • Muestra: un subconjunto de la población
  • Población objetivo: Colección de todas las unidades de análisis
  • Unidad de análisis: Elemento del cual se busca conocer la información para analizarla
  • Variabilidad de una variable: Se refiere a cuan parecida o no es la información de una determinada variable
  • Tamaño de la población: Es el número de elementos que tiene la población objetivo, denotado por \(N\)
  • Tamaño de la muestra: Es el número de elementos que tiene la muestra, denotado por \(n\)
  • Aleatoriedad: Es un proceso cuyo resultado no se puede predecir
  • Muestras aleatorias: Son muestras obtenidas de una población, siguiendo un mecanismo aleatorio (al azar)

Un ejemplo, se quiere realizar un estudio sobre las condiciones de los/las estudiantes de trabajo social de la UMSA respecto las clases virtuales.

Solución,

  • Conseguir una lista de los/las estudiantes de trabajo social (matriculados), sobre la lista realizar un sorteo para seleccionar a la muestra. (\(N=1200\), \(n=50\)) Una vez seleccionada la muestra se debe buscar a la muestra seleccionada y hacer la encuesta. (Muestreo aleatorio simple)
  • Conseguir una lista de los/las estudiantes de trabajo social (matriculados) que incluya el año de ingreso, sobre la lista realizar un sorteo para seleccionar a la muestra, garantizando que cada año de ingreso tenga muestra. (\(N=1200\), \(n=50=\{2,2,2,...,5,5,5,5\}\)) Una vez seleccionada la muestra se debe buscar a la muestra seleccionada y hacer la encuesta. (Muestreo aleatorio estratificado simple)
  • Conseguir una lista de las materias dadas esta gestión (paralelos) y sobre esa lista de materias realizar el sorteo de materias. (\(N_M=60\), \(n_m=10\)). Una vez seleccionadas las materias, nos dirigimos a esas materias y realizamos la encuesta a todos los estudiantes de la materia durante una clase. (Muestreo por conglomerados)

Un ejemplo, se quiere conocer la situación económica de las familias del barrio de Munaypata del municipio de La Paz.

  • Conseguir una lista de los/las familias, sobre la lista realizar un sorteo para seleccionar a la muestra. (\(N=2800\), \(n=50\)) Una vez seleccionada la muestra se debe buscar a la muestra seleccionada y hacer la encuesta. (Muestreo aleatorio simple)
  • Conseguir una lista de los/las familias que incluya el número de miembros, sobre la lista realizar un sorteo para seleccionar a la muestra garantizando que cada tamaño de familia tenga muestra. (\(N=2800\), \(n=50=\{3,6,6,... \}\)) Una vez seleccionada la muestra se debe buscar a la muestra seleccionada y hacer la encuesta. (Muestreo aleatorio estratificado simple)
  • Conseguir una lista de los manzanos en el barrio y sobre esa lista de manzanos realizar el sorteo de familias. (\(N_M=80\), \(n_m=10\)). Una vez seleccionadas los manzanos, nos dirigimos a esas manzanos y realizamos la encuesta a todas las familias del manzano. (Muestreo por conglomerados)

Un ejemplo, se quiere conocer el estado nutricional de niños y niñas de un hogar de acogida del municipio de El Alto que tiene en total 60 niños/as.

La representatividad de la muestra depende del alcance y calidad de la lista que se consiga. Esta lista de unidades de interés (simples/agregadas) se conoce en estadística como el Marco Muestral.

3.5.1 Marco Muestral

Es un listado de las unidades simples de la población objetivo, el marco muestral perfecto es el que contiene a toda la población objetivo. Mientras más parecido sea el marco muestral a la población objetivo la representatividad será mejor.

3.5.2 Técnicas de muestreo

Las técnicas de muestreo son mecanismos que permiten seleccionar la muestra de una población siguiendo diferentes estrategias y criterios, depende en gran medida del tipo de marco muestral con el que se cuente. Podemos definir 2 tipos de técnicas; las probabilísticas y las no probabilísticas.

Las técnicas probabilísticas nos permiten hacer inferencia, es decir podemos utilizar la muestra como una muestra representativa de la población objetivo, siempre y cuando se respete la selección aleatoria de la muestra. Por otro lado, las técnicas no probabilísticas carecen de representatividad, son más útiles cuando la población objetivo es difícil de acceder y no es posible construir un marco muestral.

3.5.2.1 Técnicas probabilísticas

  • Muestreo aleatorio simple: Parte de la selección de la muestra otorgando la misma oportunidad (probabilidad) de selección a todos los miembros de la población objetivo mediante un mecanismo de selección completamente aleatoria de un marco muestral.

  • Muestreo estratificado: Parte de una clasificación de la población es sub grupos (estratos), una vez clasificada se toma muestras de cada estrato. La variable de clasificación debe tener alguna relación a la variable de estudio, cuando esto se cumple el error de muestreo se reduce, para determinar la cantidad de muestra que se obtiene de cada estrato existen diferentes mecanismos de asignación; uniforme, proporcional, Neyman, Potencia, etc. Este muestreo reduce el error muestral si se clasifica correctamente.

  • Muestreo sistemático: Es un tipo de muestreo probabilístico donde se hace una selección aleatoria del primer elemento para la muestra, y luego se seleccionan los elementos posteriores utilizando intervalos fijos o sistemáticos hasta alcanzar el tamaño de la muestra deseado. El tamaño del salto y para elegir el arranque aleatorio, esta dado por:

\[k=\frac{N}{n}=\frac{50}{5}=10\]

  • Muestreo por conglomerados: La población está dividida en áreas lo más heterogéneas posibles internamente y lo más homogéneas posibles entre sí. Selecciona al azar un conglomerado que será el que formará la muestra. Los conglomerados incrementan el error muestral

  • Muestreo por etapas: Es un muestreo donde existen selecciones por etapas, donde se cuenta con marcos muestrales en cada etapa y una selección de muestra en cada etapa, son selecciones de muestra sucesivas. Un ejemplo particular funciona cuando se busca una muestra de estudiantes de colegio, las etapas puedes ser:

  • Distritos escolares

  • Unidades educativas

  • Curso

  • Paralelo

  • Estudiantes

  • Muestreo por fases: Este muestreo es parecido al muestreo por etapas, la diferencia radica en que se planifica una recolección de información en la las fases iniciales con la finalidad de profundizar la entrevista en las fases finales. Normalmente la primera fase tiene un gran número de muestra y la última fase menos. Un muestreo de 2 fases es lo más común.

  • Muestreo proporcional al tamaño: Es un muestreo con un esquema de selección que otorga diferentes probabilidades de selección, es decir no todas las unidades de la población tienen la misma oportunidad de pertenecer a la muestra.

Como ejemplo, imaginemos que tenemos que seleccionar 2 comunidades de un grupo de 6 comunidades; el tamaño de estas 6 comunidades es:

  • C1: 30

  • C2: 5

  • C3: 5

  • C4: 100

  • C5: 10

  • C6: 15

  • Muestreo complejo: Es la combinación de las distintas técnicas de muestreo

3.5.3 Técnicas No aleatorios / no probabilísticos

Están orientadas principalmente a estudios de caso o estudios en poblaciones complejas/vulnerables, la mayor dificultad de estas técnicas es que no son representativas

  • Muestreo Bola de nieve
  • Muestreo intencionado
  • Muestreo por cuotas
  • Muestreo voluntario

3.5.4 Tamaño de muestra (n)

\[ n_{final}=\frac{n_{1}*(Deff)}{(1-\hat{TNR})} \] Con: * \(n_{final}:\) Tamaño de muestra final (En unidades elementales) * \(Deff:\) Efecto de Diseño (Se recomienda un \(Deff=2\) si no se lo puede calcular. Si se realiza un muestreo aleatorio simple su valor es 1). * \(\hat{TNR}:\) Tasa de No Respuesta Esperada, es la proporción que se estima perder por no respuesta o boletas mal llenadas. * \(n_1:\) Tamaño de muestra para un muestreo de tipo aleatoria simple para una población finita.

\[ n_{1}=\frac{n_0}{1+\frac{n_0}{N}} \] Con:

  • \(N:\) Tamaño de la Población (En unidades elementales)

  • \(n_0:\) Tamaño de muestra para un muestreo de tipo aleatorio simple para poblaciones infinitas

  • Error Absoluto

    • Indicadores de tipo promedio (\(\bar{Y}\))

\[ n_0=\frac{k^2*S^2_y}{e^2} \] + Indicadores de tipo proporción (\(P\))

\[ n_0=\frac{k^2*N*P*Q}{e^2*(N-1)} \]

  • Error Relativo
    • Indicadores de tipo promedio (\(\bar{Y}\))

\[ n_0=\frac{k^2*CV^2_y}{e^2_r} \] + Indicadores de tipo proporción (\(P\))

\[ n_0=\frac{k^2*Q*N}{e^2_r*(N-1)*P} \]

Con:

  • \(k:\) Coeficiente de confiabilidad (al 95% de confiabilidad \(k=1.96\))
  • \(S_y:\) Desviación estándar de la variable \(Y\) (Buscar en alguna fuente similar)
  • \(e:\) Margen de error permisible Absoluto (Definir en base a cuanto se quiere alejar en términos absolutos del verdadero parámetro)
  • \(e_r:\) Margen de error permisible Relativo (Ideal \(e_r=0.05\), mayor a 0.15 es cuestionable)
  • \(P:\) Proporción de una categoría de interés (Para una muestra con error relativo, mientras mas extraña es la categoría a explorar mas grande es la muestra requerida. Para muestras con error absoluto el máximo se alcanza en \(P=0.5\))
  • \(Q=1-P\)
  • \(CV_y:\) Es el Coeficiente de Variación de la variable de \(Y\) (Buscar en algún estudio similar o suponer un valor de \(CV_y=1\))

\[|\theta - \hat{\theta}|=error_{absoluto}\]

\[S^2_y=\frac{\sum_{i=1}^N (y_i-\bar{y})^2}{N-1}\]

Ejemplo, en el curso de estadística social se va a tomar una muestra de estudiantes presentes en la clase, para estimar el promedio de horas de estudio a la semana. Se plantea lograr un 95% de confiabilidad y tener un error de muestreo de máximo 3 horas, se espera que el 5% de estudiantes que estén en la muestra no responda a la encuesta. Calcular el tamaño de muestra.

Solución,

\[n_0=\frac{k^2*S^2_y}{e^2}=\frac{1.96^2*157}{3^2}\] Así tenemos \(k=1.96\), \(e=3\), \(S^2_y=157\) \(n_0=67.02\), \(N=49\)

\[n_{1}=\frac{n_0}{1+\frac{n_0}{N}}=\frac{67.02}{1+\frac{67.02}{49}}=28.30\] Finalmente, \(Deff=1\) ya que es una selección sobre una lista de las unidades elementales

\[n_{final}=\frac{n_{1}*(Deff)}{(1-\hat{TNR})}=\frac{28.3*1}{(1-0.05)}=29.799\approx 30\]

Ejemplo 2, se busca realizar una encuesta a todos los estudiantes de trabajo social para estimar el porcentaje de apoyo al candidato \(X\) para las próximas elecciones de director de carrera. Se desea tener un error de muestreo que no supere el 2% del porcentaje de apoyo, se estima que el 10% de los estudiantes no colaborara con la encuesta, también, no es posible acceder al listado de todos de la carrera en kardex, por lo tanto el muestreo que armara sera usando conglomerado, etapas, etc. (Garantizar un 95% de confiabilidad)

Solución, como dato tenemos \(k=1.96\), \(e=0.02\), \(P=0.5\), \(Q=0.5\)

\[n_0=\frac{k^2*N*P*Q}{e^2*(N-1)}\approx \frac{k^2*P*Q}{e^2}=\frac{1.96^2*0.5*0.5}{0.02^2}=2401\] Ahora, no conocemos a \(N\), vamos asumir que \(n_1=n_0\), finalmente \(Deff=2\)

\[n_{final}=\frac{2401*2}{(1-0.1)}=5335.56\approx 5336\] El número obtenido es imposible de cumplir, por lo tanto se sube el error muestral al 8%. Calcular el tamaño de muestra asociado a este nuevo valor.

3.6 Recolección de datos y operativo de campo

Se refiere a la parte logística del estudio, en este punto tenemos como insumos el cuestionario de la encuesta y también la selección de la muestra, esta parte contiene diferentes actividades:

  • Prueba piloto
  • Sensibilización
  • Reclutamiento del personal
  • Capacitación
  • Recolección de la información (operativo principal)
  • Control de calidad / supervisión
  • Presupuesto del operativo de campo

3.6.1 Prueba piloto

Es un ensayo inicial que tiene por objetivo calibrar/ajustar las herramientas de la recolección, los tiempos de entrevista y desplazamiento, no existe un tamaño de muestra definido para esta actividad, sin embargo, se sugiere que imite lo que sería una jornada o dos del operativo de campo principal.

Se recomienda simular eventos bajo presión, con cierto grado de dificultad, con la finalidad de estar preparados para cualquier contingencia.

3.6.2 Sensibilización

Busca facilitar realizar las encuestas, este proceso puede estar vinculado con:

  • Acuerdos locales
  • Política de incentivos
  • Propaganda
  • Distintivos del personal de campo

El objetivo principal es ganar la confianza del informante.

3.6.3 Reclutamiento del personal

Se refiere al proceso para buscar a los encuestadores y supervisores de la encuesta, en esta actividad se pueden definir filtros para seleccionar al personal adecuado:

  • Educación
  • Experiencia
  • Idioma
  • Lugar de residencia

3.6.4 Capacitación

En esta actividad se capacita al personal de campo en el uso de las herramientas de recolección, formularios, identificación de las unidades a entrevistar, desplazamiento en terreno, técnicas de entrevista, control de riesgos, etc.

3.6.5 Recolección de la información (operativo principal)

Es el operativo central donde se recolecta la información, se recomienda para esta actividad organizar al personal en brigadas para mejorar el desplazamiento. Una brigada esta conformada por un grupo de encuestadores y un supervisor.

3.6.6 Control de calidad / supervisión

Son actividades que buscan garantizar un desempeño óptimo y principalmente esta orienta al cuestionario, esta pueden ser:

  • Revisión al azar de los cuestionarios
  • Acompañar una entrevista
  • Llamar a un informante al azar al concluir la jornada de trabajo

Muchos de los controles de calidad sobre el cuestionario pueden estar en el mismo cuestionario o en el sistema de recolección de la encuesta.

3.6.7 Presupuesto del operativo de campo

Este proceso tienen la finalidad de establecer el presupuesto global del operativo, las partidas usuales son:

  • Salarios
  • Viáticos
  • Transporte
  • Comunicación
  • Material
  • Incentivos

La definición de la cantidad de encuestadores que se requiere se la obtiene tomando en cuenta los días de trabajo, la carga de trabajo (encuestas por día) y la muestra total.

Por ejemplo, se requiere hacer 1000 encuestas, en un operativo de 7 días, sabiendo que un encuestador realiza en promedio 8 encuestas diarias. ¿Cuántos encuestadores se requiere?. Si por la jornada de trabajo se paga al encuestador 110 Bs. ¿Cuál es el presupuesto global de salarios para los encuestadores?

  • \((1000/7)/8=17.8 \approx 18\)
  • \(18*110*7=13860 Bs.\)

3.7 Sistemas y procesamiento de la información

Se refiere a definir donde se vacía la información recolectada, las sistemas más usuales son:

  • Excel
  • SPSS
  • CsPro

A este proceso se lo conoce como transcripción, ya no es tan usual, normalmente se crean cuestionarios digitales que almacenan la información de manera directa, para la creación de formularios digitales existen las opciones:

  • google forms
  • CsPro
  • Kobo / ODK

Estas herramientas dependen de la técnica de recolección. Tarea, encontrar las definiciones de:

  • CAPI: (Computer-Assisted Personal Interviewing) Entrevista asistida por el ordenador, para entrevistas cara a cara
  • CATI: (Computer-Assisted Telephones Interviewing) Entrevista asistida por el ordenador, para entrevistas telefónicas/celulares
  • CAWI: (Computer Aided Web Interviewing) Entrevistas web asistidas por el ordenador

3.8 Análisis y exploración de los datos recolectados

Esta fase de análisis y exploración inicia cuando se logra recolectar la información, en particular tiene distintas etapas que varían según la necesidad del investigador.

  • Importación de datos
  • Depuración de la base de datos
  • Exploración descriptiva
  • Modelado estadístico
  • Resultados / análisis