1 / 40

Instituto de Investigaciones en Matemáticas Aplicadas y en Sistemas

Instituto de Investigaciones en Matemáticas Aplicadas y en Sistemas. Especialidad en Estadística Aplicada Muestreo Profesora: Patricia Mercado. Equipo 8. Claudia Alcalá Ana Jacobo Yolanda Jiménez Nina Jiménez. RESPUESTA ALEATORIZADA. AGUILA: ¿Has probado algún tipo de droga?

kumiko
Télécharger la présentation

Instituto de Investigaciones en Matemáticas Aplicadas y en Sistemas

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. Instituto de Investigaciones en Matemáticas Aplicadas y en Sistemas Especialidad en Estadística Aplicada Muestreo Profesora: Patricia Mercado

  2. Equipo 8 Claudia Alcalá Ana Jacobo Yolanda Jiménez Nina Jiménez

  3. RESPUESTA ALEATORIZADA

  4. AGUILA: ¿Has probado algún tipo de droga? SI NO SOL: ¿Eres mujer? SI NO Practica Lanza una moneda y según el resultado contesta la pregunta correspondiente:

  5. Características Sensitivas. Características en donde los entrevistados sienten dañada su intimidad al pedir que respondan un cuestionario Preguntas Sensitivas Son las preguntas que sirven para captar las caracteristicas sensitivas Proporción Sensitiva Proporcion de poblacion con caracteristicas sensitivas Definiciones

  6. Cuando las personas que son entrevistadas, se niegan a contestar o dan una respuesta falseada a preguntas sensitivas, que las ponen en aprietos o les pueden ser dañinas en algún sentido. Se utiliza para estimar las proporciones de población sensitiva ¿Cuándo se utiliza?

  7. ¿Cuándo se utiliza?

  8. Método 1(Warner 1965) • Se supone una población con cierta característica sensitiva, lo que se quiere es calcular la proporción p de los elementos que tienen esa característica.

  9. Supuestos • Los supuestos del modelo de Warner son los siguientes:  • Los entrevistados responden verazmente. • La pregunta que se debe responder es seleccionada con probabilidad preasignada,  ó 1 – , (0 <  < 1). • La población es susceptible de clasificar en el conjunto A, los poseedores de la característica sensitiva, ó Ac, que no tiene la característica. 

  10. Supuestos • Los entrevistados forman parte de una muestra probabilística de tamaño n, seleccionada con reemplazo. (sin pérdida de generalidad se puede suponer un censo en cuyo caso el tamaño de muestra es igual al tamaño de la población n = N).

  11. El método de Warner propone 2 enunciados y en ambos la respuesta es SI ó NO: Q1.Tienes la característica sensitiva SI NO Q2.No tienes la característica sensitiva SI NO La probabilidad  de que el individuo conteste Q1es conocida y 1- es la probabilidad de que conteste Q2

  12. El mecanismo de aleatorización que originalmente utilizó Warner es una aguja giratoria en un disco con dos regiones delimitadas. La aguja apunta con probabilidad  a la región A y con 1 -  a la región Ac, el entrevistado responde a la pregunta Qa si la aguja señala la región A, o a la pregunta Qac si la aguja señala la región Ac, de esta manera, todo se conjuga para que el entrevistador sólo anote SI ó NO para cada entrevistado.

  13. Ejemplo • El entrevistado elige una de las preguntas mediante un proceso aleatorio, por ejemplo, lanza un dado y si obtiene {1,2,3,4}contesta Q1, si obtiene {5,6} entonces debe responder Q2.

  14. Sea P la proporción de la población para la cual la respuesta verdadera de Qa es SI, entonces 1 – P es la proporción de personas que contestan SI a Qac, entonces la probabilidad de respuestas SI debería estar dada por: • Pr(SI) = P + (1 - )(1 –P) • Despejando P: P= P(si)-(1-q) 2 q -1

  15. Estimador de la Proporción Sensitiva

  16. Método 2 (Horvitz,Shah y Simmons, 1967) • Pregunta inocua:es aquélla pregunta que no es sensitiva y que no está relacionada con ella. Reemplazar Qac con una pregunta inocua y define QI como una probabilidad conocida de responder SI a la pregunta.

  17. Qa = ¿Ha robado algún artículo de una tienda? SI NO • QI = ¿En el lanzamiento de la moneda, le salió sol? SI NO

  18. Definiciones de Probabilidades Prob de contestar Qa es q Prob de contestar QI es 1-q La prob QI de responder SI es a (CONOCIDA) P(si)= q p+ (1-q) a p= P(si)-(1-q) a a

  19. ESTIMADORES • Los estimadores basados en X contestaciones en una muestra de tamaño n

  20. ¿Qué método es mejor? • Supongamos valores p=0.3 a =0.6 q =0.5 Método 1 Método 2 Casi 10 veces más eficaz que el de Warner

  21. Algunos ejemplos y extensiones o adecuaciones del modelo

  22. Ejemplo método Warner 1973 encuesta fecundidad en Alberta, Canadá. Conocer el no. de abortos ilegales. Selección de 3 muestras independientes, 327, 269 y 342 mujeres en edad fértil. Entre otras preguntas, se formulaba la siguiente: ¿Tuvo un aborto provocado (terapéutico o ilegal) durante 1972? Procedimientos diferentes en la aplicación de la encuesta en cada una de las muestras. 1ra. Interrogatorio directo. 2da. Respuesta anónima por correo 3ra. Respuesta aleatorizada.

  23. Técnica de aleatorización

  24. Resultados

  25. Ejemplo método de Horvitz Estimar en una universidad la proporción de estudiantes que han usado cocaína . Método: en una caja se colocaron y revolvieron 30 bolas rojas, 16 azules y 4 blancas; se pidió a cada estudiante que extrajera una bola de la caja, si la bola extraída era roja se contestaba la pregunta 1 y en caso contrario la pregunta 2. Pregunta 1: ¿Alguna vez has usado droga? Pregunta 2: ¿Es blanca la bola que extrajo?

  26. Resultados

  27. Técnica de RA en datos cuantitativos 1969 Greenberg, Horvitz, et. al. Estimar el no. de abortos en 5 áreas metropolitanas de Carolina del Norte. 2 muestras de mujeres adultas. Preguntas realizadas: 1. ¿Cuantos abortos había tenido durante su vida? 2: Si una mujer tiene que trabajar tiempo completo ¿Cuántos hijos cree ud. que debería tener? Técnica: Caja 35 bolas rojas y 15 azules. Si bola roja respondían pregunta 1, y si bola azul pregunta 2.

  28. Resultados

  29. Técnica RA con dos preguntas alternas 1971, Greenberg, Horvitz, et al. Se utiliza cuando la proporción de la población con la característica no sensitiva no se conoce, y se requiere estimar la proporción de la población que posee la característica sensitiva. Se requiere la aplicación de dos muestras, y consiste en la aplicación de dos preguntas no sensitivas en conjunto con la pregunta sensitiva.

  30. Otoño 1971, Research Triangle Institute aplicó el modelo para conocer la relación entre la bebida y el conducir un automóvil en el Condado de Mecklenburg, Carolina del Nte. La población de interés eran personas no abstemias mayores de 16. Método de aleatorización: lanzamiento de moneda (P=1/2). Y las preguntas: Sensitiva: A) ¿Ha tenido un accidente automovilístico durante el año pasado en el que yo tuve la culpa.? Dos preguntas alternas: B-1) ¿Nació en Abril? B-2) ¿Vivía en Carolina del Nte., pero no en el Condado de Mecklenburg en 1966? Muestra 1 Muestra 2 P. Si/A= 11.79 P. Si/A = 22.3 P. Si/B-1= 10.24 P. Si/B-2 =8.41 P. Si/ambas = .9364 P. Si/ambas = 1.18 n = 184 m = 239 La proporción estimada ¶ = 24.72 y Var (¶) = 3.92

  31. Modelo RA con 2 características sensitivas Tesis Acturía, 1976, Ramón Vera. Objetivo estimar la proporción marginal de presencia de cada característica y la proporción conjunta. Se utilizan 6 preguntas, enumeradas y organizadas en grupos de 3. La pregunta 1 y 2 son de las características sensitivas, las otras 4 no tienen relación con las anteriores, pero las 3 últimas están interrelacionadas. Respuesta Si o NO. 1. ¿Has hecho uso de drogas en más de 3 veces en los últimos 12 meses? 2. ¿En los últimos 15 días te has masturbado alguna vez cuando menos? 3. ¿Naciste en el mes de Abril? 4. ¿Tu no. de cuenta termina en 0,1 ó 2? 5. ¿Tu no. de cuenta termina en 0 ó 1? 6. ¿Tu no. de cuenta termina en 2?

  32. Grupos formados A: Pregunta 1-4 (Drogra - No. Cuenta) B: Pregunta 2-3 (Masturbación - Nacimiento) C: Pregunta 5-6 (No. Cuenta - No. Cuenta) Método de aleatorización: De una baraja española entrevistado elegía una carta. Paso 1 Si 1,2,3,4,5,6,7 contesta la pregunta 1 si 10,11,12 contesta 4 Paso 2 Si contestó 1, la segunda pregunta se elige del grupo B, ó del grupo C si contestó a 4. Paso 3 Para elegir la pregunta en cualquiera de estos grupos, se elegía una carta de una baraja americana. Grupo B Grupo C Si A,2,3,4,5,6,7,8,9,10 Pregunta 2 Pregunta 5 Caso contrario Pregunta 3 Pregunta 6 Las respuestas se depositaban en una urna, y se cruzaba si/no.

  33. Se tomaron dos muestras alumnos Fac. Ciencias 2do. Semestre 1976, cursaban estadística I, estadística II y Procesos Estocásticos. n = 80 m= 36

  34. Otras extensiones • Modelos para datos continuos, ordinales. • Kuk (1990) . El encuestado genera dos variables binarias de respuesta independientes. Bajo supuesto de dos distribuciones Bernoulli. k eventos por intrevistado. • Clark y Desharnais (1998). Modelo para determinar la proporción de los entrevistados deshonestos.

  35. Ejemplo NO optimo Duffy y Waterton (1988) realizaron un muestreo por conglomerados en dos etapas para aplicar una encuesta para medir la incidencia de problemas relacionados con alcohol en Edimburgo, Escocia. UPM’s fueron distritos de votación y las USM’s personas. 1/5 se elige aleatoriamente para contestar preguntas directas y el resto en respuesta aleatorizada (RA). Resultados: tasa de respuesta 81.1% grupo de preguntas directas, 76.5% grupo de respuesta aleatorizada. Estimación de la proporción de personas que habían bebido más del límite legal inmediatamente antes de conducir un auto, fue de 0.469 grupo preguntas directas y 0.382 grupo RA (diferencia no significativa estadísticamente). Aquí RA no aumentó la tasa de respuesta ni la incidencia estimada de la característica sensitiva.

  36. Aumenta la probabilidad de contestar la verdad que en una pregunta directa. Mayor índice de respuesta. Aumento en la complejidad de la pregunta. Dificultad en entender el método de aleatorización. Ventajas Desventajas

  37. Sugerencias generales • La técnica debe de incorporarse en una parte de la muestra piloto y el método regular en la otra parte, a fin de evaluar su comprensión, grado de aceptación y funcionamiento general en la población. • En su fase de aplicación es preciso constatar que cada interrogado ha comprendido lo que debe de hacer como que el método confiere absoluta privacidad. • Las preguntas tratadas por RA deben aparecer al fianl del cuestionario, después de las que se formulan por vías convencionales y previa explicación de que se trata de un procedimiento para cuya aplicación se solicita especial cooperación

  38. RESULTADOS DE LA PRACTICA

  39. Bibliografía • De la Vega Sergio, Vera Ramón Modelo de respuesta aleatorizada para una doble clasificación sensitiva. Tesis Actuario 1976 • Zellner, A. An efficient method of estimating seemingly unrelated regressions and tests for aggregation bias, JASA, June 1962 348-368. • Warner, S., Randomized response: a survey technique for eliminating evasive answer bias. JASA, March 1965, 63-69. • Abul-Ela, A., Greenberg, B., and Horvitz, A., A multi-proportions randomized response model. JASA, Sept. 1967, 990-1008. • Greenberg, B., Abdul-Ela, A., Simmons, W., and Horvitz, D., The unrelated question randomized response model: theorectical framework. JASA, June 1969, 520-539.

  40. Gould,A. Shah, B., and Abernathy, J., Unrelated question randomized response techniques with two trials per respondent. Proceedings of the Social Statistics Section of the ASA, 1971. • Grrenberg, B., Abernathy, J., and Horvitz, D., Application of the randomized response technique in obtaining quantitative data JASA, June 1971, 243-250. • Warner, S., The linear randomized response model. JASA, Dec. 1971, 884-888. • Cambell, C. and Joiner, B., How to get the answer without being sure you've asked the question. The American Statistician, Dec. 1973, 229-231. • Dowling, T. and Shactman, Ran On the relative efficiency of randomized response models. JASA, March 1975, 84-87.

More Related