1 / 63

Verónica De Jesús Romo Enrique Gómez Bernal Claudia Irene Larracilla Camacho Martha Patricia Ordóñez Reyes Marcos Sebast

IIMAS “Técnicas de Muestreo” M. Patricia Romero. NO RESPUESTA. Verónica De Jesús Romo Enrique Gómez Bernal Claudia Irene Larracilla Camacho Martha Patricia Ordóñez Reyes Marcos Sebastián Pineda Espinosa. Diciembre, 2004. ÍNDICE 1. Origen de la No Respuesta

khuyen
Télécharger la présentation

Verónica De Jesús Romo Enrique Gómez Bernal Claudia Irene Larracilla Camacho Martha Patricia Ordóñez Reyes Marcos Sebast

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. IIMAS “Técnicas de Muestreo” M. Patricia Romero NO RESPUESTA Verónica De Jesús Romo Enrique Gómez Bernal Claudia Irene Larracilla Camacho Martha Patricia Ordóñez Reyes Marcos Sebastián Pineda Espinosa Diciembre, 2004

  2. ÍNDICE • 1. Origen de la No Respuesta • 2. Métodos para tratarla: • (en el Diseño, en el levantamiento y en el • Procesamiento de la Información) • 3. Implicaciones • 4. Ejercicios • 5. Bibliografía

  3. 1. ORIGEN DE LA NO RESPUESTA

  4. La No-respuesta o falta de respuesta se ubica dentro de los errores ajenos al muestreo. • Este tipo de errores se pueden presentar tanto en las encuestas por muestreo como en los censos (considerados como encuestas exhaustivas). • El problema consiste en la existencia de cuestionarios para los que no ha sido posible recoger la información por diversos motivos, distinguiéndose entre las negativas a responder y las ausencias del hogar.

  5. La No-respuesta o falta de respuesta puede referirse a la totalidad de un cuestionario o a ciertas preguntas (en este caso se habla de respuesta parcial) • Contrario a los errores de muestreo, en los errores ajenos al muestreo no decrecen al aumentar el tamaño de muestra, al contrario, en general crecen. • La falta de respuesta total suele medirse por el porcentaje de unidades muestrales elegibles que no respondieron, respecto al número de unidades elegibles de la muestra.

  6. FACTORES QUE INFLUYEN EN LA FALTA DE RESPUESTA (Ejemplos) • Organismo patrocinador de la encuesta • Oportunidad de ejecución de la encuesta • Índole de las preguntas • Adiestramiento de entrevistadores • Extensión del cuestionario (CARGA DE RESPUESTA) • Interés de las preguntas

  7. Falta de credibilidad en la promesa de confidencialidad • Recelo a establecer contacto con extraños • Falta de tiempo para cooperar • El miedo a aparecer en archivos electrónicos públicos

  8. ¿POR QUÉ YO Y NO MI VECINO? • En la Encuesta Nacional por Muestreo en la India, se utiliza el principio de “Propósitos Múltiples”: que consiste en la investigación simultánea de varios temas pero con diferentes muestras de hogares para distintos cuestionarios a fin de reducir la carga de respuesta. • Las tasas de negativas suelen ser mucho menores en los países en vías de desarrollo que en los desarrollados.

  9. La falta de respuesta introduce sesgos cuando las unidades no respondientes difieren sustancialmente de las respondientes, por lo que la utilización de sustitutos no necesariamente elimina el sesgo. • Un indicador del sesgo puede obtenerse al comparar los valores de la(s) variable(s) de interés correspondientes a unidades que responden al primer intento contra los que contestaron después de varios intentos.

  10. La falta de respuesta es considerada a veces como el ÍNDICE MÁS VISIBLE DE LA CALIDAD DE LA ENCUESTA, con respecto a su recibimiento en la población, su oportunidad, capacitación y control de los entrevistadores, carga de respuesta y en general al control del proceso operativo. • La entrega de incentivos a los respondientes puede ser eficaz.

  11. Aunque existen variaciones en la tasa de respuesta, con respecto a la técnica de entrevista (cara a cara, por teléfono, por correo, etc.) y el perfil de los entrevistados, el rango identificado varía de 46% a 76%, y los que más responden suelen tener mayor nivel socioeconómico.

  12. FLUJO DE DATOS DE UNA ENCUESTA

  13. Supongamos que las unidades de población (N) pueden ser dividas en dos estratos: N1: Número de unidades que si responden N2: Número de unidades que no responden Entonces: N = N1 + N2y W1=N1/N, W2=N2/N siendo W2 la proporción de no-respuesta en la población. EFECTOS DE LA NO-RESPUESTA

  14. Por lo que el sesgo que se obtiene al utilizar estimar a la media poblacional es: Al utilizar a de la población: Finalmente, si se utiliza a proporción de la población:

  15. Como la muestra no provee información sobre el estrato de no respondientes, los tamaños de sesgos son desconocidos lo que dificulta el calcular intervalos de confianza para los estimadores de las características de interés. Sin embargo, para el caso de estimar proporciones el intervalo de confianza estará dado de la siguiente manera: Además, Birnbaum y Sirken muestran que un valor de n que garantiza un error menor que d es:

  16. 2. TRATAMIENTOS EN EL DISEÑO

  17. Técnica de Hansen y Hurwitz • Esta técnica se utiliza principalmente para el diseño de encuestas por correo: • Se selecciona una muestra, a la cual se le envía el cuestionario • Se selecciona una “submuestra” de aquellas personas que no respondieron el cuestionario • A esta submuestra se aplicará el cuestionario de manera personal • Los datos obtenidos de las dos partes de la muestra son combinadas para obtener los estimadores de interés.

  18. Asimismo esta técnica propone un tamaño de muestra de acuerdo a los costos en que se incurrirían al llevar a cabo una encuesta de ese tipo: donde: c0: costo de incluir una unidad muestral en la primera etapa. c1: costo de procesar la información obtenida c2: costo de obtener y procesar la información del grupo de no-respuesta

  19. Modelo de Deming • Deming en 1953 propuso un modelo que muestra cómo las visitas adicionales ayudan a disminuir el sesgo y propuso un modelo para determinar el número óptimo de visitas adicionales para tener una precisión dada. • Suponga que la población puede ser divida en r grupos de acuerdo a la probabilidad de que la persona esté en casa.

  20. Ahora se toma una muestra sin reemplazo de tamaño n0. Después de i visitas, la muestra es dividida en (r+1) grupos. Sea nij el número de unidades en la muestra que corresponden al grupo j y responden en o antes de la i-ésima visita. Así, el grupo (r+1) contendrá a todas las unidades que aún no han sido entrevistadas. De esta forma se puede ver que E[ni] (número esperado de personas que han sido entrevistadas en el curso de i visitas) es:

  21. Técnica de Politz & Simmons • Con esta técnica se pretende evitar por completo las visitas adicionales mediante la recolección de las primeras visitas solamente, que a continuación se corrigen con información acerca de la probabilidad de encontrar al entrevistado. Se le pregunta en qué cantidad de k periodos similares habría estado disponible para entrevista; si la respuesta es r, se pondera la entrevista con (k+1)/(r+1). Por lo regular se utiliza k=5.

  22. Por ejemplo, si el entrevistado dice que ha estado disponible en r=1 periodos similares, obtiene la ponderación 6/2. Así, de 600 sujetos, cada uno de los cuales tiene la probabilidad 1/3 de ser encontrado en su casa, se encontrará a 200; al dar la respuesta r=1 y obtener la ponderación 6/2, toman el lugar de los 400 que se han encontrado en sus casas.

  23. EJERCICIO

  24. Efectos de las Revisitas. Aplicación Se trabaja con una población dividida en tres clases (j). En la cual se encuesta a un adulto al azar. pj: proporción de la población que cae en la j-ésima clase A su vez la población se encuentra dividida en dos grupos, cuyas mj se muestran a continuación. mj: es la media de la característica de para la j-ésima clase

  25. wij: es la probabilidad de que se encuentre un entrevistado de la j-ésima clase antes de k i-ésima visita. Es una probabilidad condicionada al del número de visitas • =P(OE1a ò OE2a ó … óOEi-ésima) El número de entrevistas obtenidas en i-ésima visita se obtiene por medio de: noSpjwij Donde no es el tamaño inicial de la muestra.

  26. Como se puede apreciar en la tabla, el número de entrevistas obtenidas aumenta conforme aumenta el número de revistas lo cual permite obtener mejores estimaciones de los parámetros poblacionales. Por otro lado el costo promedio de la entrevista y el tiempo de obtención de la información aumentan, lo cual significa una fuerte restricción. Con el fin de observar los beneficios de las revisitas, se calculó el sesgo para la estimación de la y barra para las dos poblaciones. En ambos casos se aprecia un menor sesgo cuando aumentan las visitas a las unidades muestrales que no contestaron.

  27. La media verdadera de la población para la característica esta dada por: mbara =Spimj Bajo el supuesto de las mj de los datos iniciales La media de la muestra obtenida después de i visitas, es también una esperanza condicional de yi barra dado el numero de visitas. E (y ibarra dado ni) = Swij pi mj / Swijpj = m ibarra

  28. Los sesgos que se obtuvieron en ambos grupos son los siguientes. Una política que requiere tres visitas, por ejemplo reduce el sesgo de manera considerable. Pero la restricción monetaria, por la cual no es posible hacer un número elevado de revisitas; por lo tanto se desea encontrar el estimador con menor ECM dado el número inicial de la muestra (no) que determino el presupuesto disponible.

  29. En la siguiente tabla se muestran los ECMde los estimadores con diferentes tamaños de muestras iniciales para cada uno de los grupos. Con no=1000 se obtiene el mejor estimador con 3 visitas, en el grupo 2 esto pasa con 4 visitas, pues mayores resisitas resultan innecesarias e incluso perjudiciales ya que aumenta el ECM

  30. Con no=2000 el número de visitas que necesarias para obtener la información que proporcione los estimados de menor ECM es 4 visitas en el grupo I y cinco en el grupo II La mayor virtud del modelo yace en su capacidad de establecer políticas económicas para buscar el número de revisitas para obtener información que proporciones los estimadores con mejor ECM para cualquier tipo de encuesta.

  31. 3. MÉTODOS EN EL LEVANTAMIENTO

  32. Encuestas repetidas (callbacks) • La no-respuesta se puede reducir mediante esfuerzos persistentes de los entrevistadores y motivando a los que no responden. • Encuesta delegada (Proxy) • Una técnica importante es elegir datos de una unidad alternativa. Por ejemplo las instrucciones de la encuesta pueden indicar que se puede encuestar, en el caso de que no sea posible hacerlo a la persona indicada, a cualquier otro miembro de la familia que tenga más de 20 años.

  33. Rechazos-seguimiento • Siempre que sea posible debe hacerse un seguimiento de los hogares que rechazan la encuesta. En la mayoría de los casos esto significará que un entrevistador experimentado habrá de efectuar una visita personal. • Teléfono • Permite que se realice la entrevista en su momento sean cuales sean las condiciones climatológicas.

  34. 2. Está especialmente indicada para personas solas, familias pequeñas e inquilinos de apartamentos a los que suele ser difícil de localizar en casa y a los que se suele encontrar por la noche. 3. Permite realizar la entrevista de la manera que más convenga al entrevistado. 4. Da más oportunidades y tiempo para la reiteración de la encuesta.

  35. Cuota • En el muestreo por cuotas, se estratifica la población según unas variables que se espere estén muy relacionadas con la respuesta. • Sustitución en el campo • Hay dos tipos básicos de sustituciones a usar: • Selección al azar • Se selecciona probabilísticamente unidades adicionales a partir de una población restringida o subgrupo, bajo el supuesto de que sus características serán muy parecidas a las de las unidades que no responden.

  36. Sin embargo, no elimina el sesgo debido a la no-respuesta inicial, sólo sustituye de manera insesgada una unidad por otra que falló en responder, pudiendo tener o no las mismas características. • Selección de un sustituto específicamente designado. • Identifica a una o más unidades que se encuentren próximas a las unidades que no responden, esto es debido a la tendencia de las unidades vecinas a tener características similares en comparación con unidades seleccionadas al azar.

  37. Uso de incentivos • Un incentivo puede ser menos costoso que una llamada adicional. La planificación de incentivo se basa en el coste de las llamadas o visitas adicionales que habrían de efectuarse en un esfuerzo por completar la entrevista.

  38. Respuesta aleatorizada • Este modelo debido a Warner permite eliminar o reducir los sesgos introducidos cuando en vez de negativas se obtienen contestaciones deliberadamente falsas. Se ha utilizado este método en encuestas con preguntas de carácter íntimo, por ejemplo: alcoholismo, drogadicción, aborto, conducta sexual, conductas de carácter delictivo, etc. • Suponga un grupo A el cual está formado por personas con una característica “inaceptable” y estamos interesados en calcular la proporción pA de personas que pertenecen a ese grupo.

  39. El método de Warner indica que a cada persona entrevistada (de una m.a. de tamaño n seleccionada de la población), pro ejemplo, se le da una moneda marcada en un lado con A y el otro lado con B. Donde los lados indican: A: “Pertenezco al grupo A” B: “No pertenezco al grupo A” Además se sabe que: P(A)=pw y P(B)=1-pw

  40. Al entrevistado se le pide que lance la moneda (el entrevistador no observa el resultado del lanzamiento) y que solamente diga “sí” o “no” pertenece al grupo que le indica la moneda (sin mencionar en qué lado cayó la moneda). Se asume que la persona respondió sinceramente. Ahora suponga que n1 respondieron “sí”. Entonces un estimador insesgado de qw,la probabilidad de una respuesta afirmativa está dada por:

  41. Como pwes conocida, un estimador insesgado de pAes: y la varianza del estimador será:

  42. 3. MÉTODOS PARA TRATARLA EN EL PROCESAMIENTO DE LA INFORMACIÓN

  43. Levantamiento de Datos Unidades que Responden Unidades que NO Responden Depuración Previa Completo y Consistente Blancos o Entradas Inconsistentes No válidos Imputación Estimación Tabulación

  44. MÉTODOS DE LLENADO (IMPUTACIÓN) • La imputación es el proceso de asignar valores a datos faltantes para producir un conjunto de datos completos, ésto con la finalidad de reducir el sesgo debido a la No Respuesta. • Existen diversos métodos y aquí se describen algunos: • Imputación Deductiva. • Se usa cuando las respuestas que faltan se pueden deducir del resto de la información.

  45. 2. Fichero Caliente (Hot Deck). Generalmente es un procedimiento de duplicación. Cuando falta un valor, se duplica un valor ya existente en la muestra para reemplazarlo. 3. Fichero Caliente Modificado. Su esencia es la clasificación y empate de donantes potenciales y receptores utilizando muchas variables. El empate se hace sobre bases jerárquicas donde el nivel más bajo es aquel en el que se encuentra un donante.

  46. 4. Regresión. Se toman los datos en los que si hay respuesta. Esta Imputación, produce valores más cercanos al verdadero que otros métodos pero es costoso y lleva mucho tiempo realizarlo para todas las preguntas con datos faltantes. 5. Ponderación. Se inflan las ponderaciones mediante la inversa de la tasa de respuesta. En un área de balance b, una estimación del total de una característica viene dada por:

  47. nb ∑ Xi/Пi i=1 Si solo responden mb unidades entonces, la ponderación Пi-1 es inflada por la inversa de la tasa de respuesta mb/nb o sea, nb/mb. 6. Duplicación. Duplica un número de unidades suficientes mb entre los que no responden y de esta forma alcanzar el nivel original de nb unidades.

  48. 7. Sustitución. Se sustituye la no respuesta por datos históricos o por datos provenientes de una fuente externa.En lugar de áreas de balance, se usan clases de ponderación (características de las unidades últimas). 8. Tasa RAD (Ranking Ratio) Se usa como una forma de ajuste cuando las clases a ponderar se definen en términos de tablas de contingencia de ciertas características. Lo que se busca es hacer que las distribuciones marginales ponderadas se comporten igual en la población.

  49. Edad de la Población Edad de la muestra 1 2 … k Total 1 2 … k Total 1 w11 w12…w1k w1. 1 q11 q12… q1k q1. 2 w21 w22…w2k w2. 2 q21 q22… q2k q2. w.1 w.2… w.k 1 q.1 q.2… q.k 1 Las ponderaciones marginales de la muestra, se igualan a las de la población mediante un proceso iterativo. El sesgo en este método depende de la proximidad de las distribuciones de las células entre dos poblaciones y de la diferencia en las medias entre los que responden y no responden en una célula.

  50. IMPLICACIONES DE LA NO RESPUESTA

More Related