1 / 47

Curso de verão 2013 laboratório em planos complexos de amostragem

Curso de verão 2013 laboratório em planos complexos de amostragem. Amostragem por conglomerados em múltiplos estágios Questões sobre tamanhos de amostras Sorteio das unidades de amostragem Efeito do delineamento na precisão das estimativas. Amostragem por conglomerados em múltiplos estágios.

jabari
Télécharger la présentation

Curso de verão 2013 laboratório em planos complexos de amostragem

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. Curso de verão 2013laboratório em planos complexos de amostragem • Amostragem por conglomerados em múltiplos estágios • Questões sobre tamanhos de amostras • Sorteio das unidades de amostragem • Efeito do delineamento na precisão das estimativas

  2. Amostragem por conglomerados em múltiplos estágios

  3. Amostra de conglomerados em múltiplos estágios • Conglomerados: unidades de amostragem que contém vários elementos • Múltiplos estágios • sorteio de unidades dentro de unidades sorteadas anteriormente • conglomerados sorteados no 1º. Estágio  UPA: áreas geográficas pequenas, que cobrem toda a população • Em inquéritos • Amostras do país ou de regiões do país ou de estados UPA  município • Amostras em municípios UPA  setor censitário

  4. Setor censitário

  5. Fração de amostragem • AAS f = n/N = m/M • Amostragem em dois estágios f = f1* f2 • Amostragem em três estágios f = f1* f2 * f3

  6. Questões sobre o tamanho da amostraDois estágios de seleção • Cálculo de n – número de pessoas - considerando o parâmetro a ser estimado • Definição dos domínios – n para cada domínio • Cálculo de m – número de domicílios • Cálculo do número de setores censitários e de domicílios por setor

  7. Objetivo Estimar prevalências • Parâmetro proporção • Estimador na AAS

  8. Tamanho de amostra para proporçõesAmostragem aleatória simples

  9. Variância por elemento  P(1-P)

  10. Erro de amostragem • Semi-amplitude do intervalo de confiança d d • Consequência de que • 1,96  indica nível de confiança de 95%

  11. Exemplos • Para estimar a proporção de idosos com HA no município X • ISA-Capital 2008  52% • d=5%  IC:[47%;57%] • n=384 • Para estimar a proporção de idosos com depressão no município X • ISA-Capital 2008  25% • d=5%  IC:[20%;30%] • n=288 • Para estimar a proporção de idosos com rinite no município X • ISA-Capital 2008  12% • d=5%  IC:[7%;17%] ???? • n=100

  12. Passagem AAS Amostra complexa

  13. EFEITO DO DELINEAMENTO

  14. Variâncias • Amostragem aleatória simples • Amostragem por conglomerados de tamanhos desiguais

  15. Prevalência de hipertensão em idososisacamp-2008

  16. No planejamento de inquéritos • deff=2 Dependerá • da homogeneidade intraclasse • da distribuição da amostra pelas unidades primárias de amostragem

  17. Domínios • Cálculo de n deve ser feito para cada domínio. • Domínio – parte da população para a qual estimativas separadas são planejadas (Kish pág.75) • Podem ser definidos por critérios: 1) geográficos 2) demográficos

  18. Tamanho de amostra em domínios • Tamanho mínimo de amostra  n=500 • Amostra proporcional • tam.total =n/(menor prop)=500/0,10=5000 • Amostras de tamanhos iguais • tam.total=5*n=2500

  19. INQUÉRITOS Tamanho da amostra de pessoas  tamanho da amostra de domicílios Transformação de n  m m  número de pessoas a serem sorteadas dividido pela média de pessoas por domicílio na faixa etária de interesse

  20. Não resposta • Acréscimo pela taxa de não resposta (máxima a ser tolerada) Diminui o erro de amostragem das estimativas, mas não o vício causado pela não resposta

  21. Exemplo

  22. Definindo número de setores censitários e de domicílios por setor Para um dado m  busca-se menor deff O efeito do delineamento depende: • da estratégia elaborada para o processo de sorteio - número de setores e domicílios por setor • da composição interna dos conglomerados - homogeneidade intra conglomerados

  23. Correlação intraclasse

  24. Determinação de b

  25. Tamanho ótimo de b Ca  custo associado ao conglomerado c  custo por elemento

  26. Considerando a razão de custos adotada pelo SEADE (na PCV)  20

  27. Número de setores censitários a = n / b escolher a>=30

  28. Sorteio no 1º. estágioSorteio com probabilidade proporcional ao tamanho • Metodologia de eleição da maior parte dos inquéritos • Medidas de tamanho determinam probabilidade de seleção  probabilidades diferentes para as UPAs • Probabilidades de seleção das UPAS combinadas com frações de amostragem adequadas nos estágios seguintes  equiprobabilidade • Principal atrativo  amostras de tamanhos aproximadamente iguais nas UPAs

  29. Fração de amostragemPrimeiro estágio é o tamanho do setor i M é o número total de domicílios

  30. Arquivo de setores censitários do IBGE

  31. Sorteio no 1º. estágioSorteio PPT - probabilidade proporcional ao tamanho 1º. passo – soma acumulada • considerando o setor censitário como UPA • a cada setor é atribuído um intervalo de números • tamanho do intervalo = número de domicílios de cada setor

  32. 1º. passo do sorteio PPT

  33. Sorteio no 1º. estágioSorteio PPT - probabilidade proporcional ao tamanho • 2º. Passo – Calcula-se o intervalo de amostragem (total de domicílios / número de setores da amostra) • 3º. Passo – Sorteia-se um número aleatório dentro do 1º. intervalo (início casual) • 4º. Passo – Acumula-se o intervalo de amostragem sucessivamente • Os setores da amostra serão os que tiverem nos seus “intervalos de números” os números sorteados

  34. No exemplo • Total de domicílios: 276080 • Total de setores da amostra: 70 • Intervalo de amostragem: 276080/70=3944 • Início casual entre 1 e 3944: 232 • Setor 02 é o primeiro setor sorteado (seu intervalo é 161 a 419) • Outros números sorteados: 232 + 3944 = 4176 (setor 22) 4176 + 3944 = 8120 (setor 44) 8120 + 3944 = 12064 (setor 68) ...

  35. Fração de amostragemSegundo estágio • Se Mi é também o número de domicílios encontrado em campo (número atual de domicílios)  • Ex: Mi=360 e b=120  f2=1/3 Será incluído na amostra 1 domicílio cada 30

  36. Sorteio no 2º. estágio Sorteio de domicílios • Calcula-se o intervalo de amostragem  domicílios do setor / b sendo b o número de domicílios a ser sorteado no setor • Sorteia-se um início aleatório no 1o. intervalo (início casual) • Soma-se o intervalo de amostragem sucessivamente • Os números assim identificados correspondem aos domicílios sorteados

  37. Fração de amostragem global

  38. Se Mi não é igual a tamanho atual1ª. opção • Seleção de domicílios com fração fixa (b/Mi) é o número de domicílios sorteado no setor é o número de domicílios do censo (utilizado no sorteio do 1º. estágio) é o número de domicílios existentes no momento da pesquisa (atual)

  39. Se Mi não é igual a tamanho atual – 1ª. opção Vantagem • Fração de amostragem global é a mesma para todas as UPAs – amostra equiprobabilística Desvantagens • Sem controle do tamanho final da amostra • Número de domicílios nas UPAs podem variar muito

  40. 1ª opção • No exemplo: • Mas tamanho atual é 278 • Serão sorteados 46 domicílios que corresponde a 1/6 dos domicílios atualmente existentes.

  41. Se Mi não é igual a tamanho atual 2ª. opção • Fixar b (o número de domicílios é o mesmo em todos os setores) • Frações de amostragem distintas nos setores  ponderação

  42. 2ª opção • No exemplo: • Mas tamanho atual é 278 • Serão sorteados 43 domicílios mas a fração de amostragem nesse setor foi de 6,5

  43. Peso do delineamentoPeso básico • Inverso da fração de amostragem • Se amostra equiprobabilística  • Se há diferenças entre probabilidades utilizadas no sorteio, para cada elemento i 

  44. Peso do delineamento • Peso resultante da utilização de diferentes probabilidades de seleção  inverso da fração de amostragem • Causas 1) tamanhos atuais das UPAs diferentes dos tamanhos utilizados em seu sorteio e sorteio de um número constante de domicílios nos setores 2) sorteio de números de elementos nos estratos ou domínios não proporcionais ao tamanho dos estratos/domínios

  45. Ajuste de não resposta • Variável utilizada no ajuste – variável para a qual há informação também para os não respondentes. Usual – geográficas. • Suposição – em cada categoria da variável de ajuste os respondentes são amostras das pessoas sorteadas – as perdas são ao acaso • Dentro das categorias – amostra de respondentes é inflada para atingir número sorteado

  46. Ajuste de pós estratificação • A distribuição da amostra segundo variáveis sóciodemográficas é igualada à distribuição da população • Utilização de dados da população - externos, portanto, à pesquisa.

More Related