1 / 150

linhas

Desenvolvimento e epsquisa

Télécharger la présentation

linhas

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. Bioestatística Prof. Dr. Leandro Giavarotti IPGS - 2011

  2. Conceitos básicos  Estatística  Termo utilizado tanto para o estudo geral quanto para as medidas específicas.  Ex: A média é uma estatística de uma amostra.  População  Totalidade dos elementos ou de atributos dos elementos referentes a um conujunto determinado  População do Estado de São Paulo  População de pacientes de um hospital  População de remédios de uma farmácia.

  3. População  Pode ser finita e pequena  Fácil de conhecer todos os seus elementos  Na maioria da vezes, é finita mas incontável, ou mesmo infinita  Nestes casos, a estatística utiliza amostras para caracterizar a população

  4. Amostra  Parte tomada de uma população, ou um conjunto de elementos de uma população, selecionados através de algum critério  Uma população pode dar origem a várias amostras  Todas as amostras estão contidas na população

  5. Variável  Característica a ser estudada em determinada população  Cor dos olhos dos moradores de São Paulo  Altura dos alunos do curso do IPGS  IMC dos pacientes de uma clínica de estética

  6. Classificação de variáveis  Contínuas  Podem assumir qualquer valor dentro de um intervalo de interesse  Dados contínuos  Peso, altura, distância percorrida em um teste de esforço  Geralmente estão associadas a unidades m, Kg, l, m/s… 

  7. Classificação de variáveis  Discretas  Assumem valores inteiros dentro de um intervalo de contagem  Números de itens referentes à variável  Número de repetições de um exercício, número de refeições por dia, número de pacientes atendidos numa clínica

  8. Classificação de variáveis  Nominais (categóricas)  Assumem apenas alguns estados ou categorias  Geralmente não são numéricas  Suas observações são contadas.  Sexo de uma população, queixas de dor lombar, presença de obesidade, tipo de pele

  9. Classificação de variáveis  Ordinais  Relacionam-se a avaliaçãoes subjetivas segundo preferência ou desempenho Primeiro/segundo/terceiro Melhor/pior Maior/menor Mais/menos    

  10. Identificando…  10 gramas  Contínua  15 segundos  Contínua/discreta  3 erros/10 acertos  Nominal  O mais lento  Ordinal  3 períodos de atividade física por semana  Discreta  O mais alegre  Ordinal  12,5 Km/h  Contínua  O mais fraco  Ordinal

  11. Notação Sigma para somatórias  A maior parte dos cálculos estatísticos utiliza a Somatória de números  A notação utilizada para essa operação é ∑.  Para uma variável X que pode assumir os valores 2, 4, 5 e 9, temos que:  ∑x = 2 + 4 + 5 + 9 = 20  ∑x² = 2² + 3²+ 4² + 9² = 4 + 16 + 25 + 81 = 126

  12. Notação Sigma para somatórias  Para somar os 5 primeiros valores possíveis de uma variável x, teremos:  Para somar os n valores possíveis para uma variável x, temos:   1 5        x x x x x x 1 2 3 4 5 i 1 i n     ... x x x x 1 2 i n i

  13. Aplicando…  Considere a seguinte tabela:  Calcule:   1 i  ix 3 2 8    i xi 1 8 2 2 3 3 4 6 5 7 6 8 7 9 8 4 9 5 10 11 4 1 2    ix 8 2 10          6 7 8 9 4 5 4 1 57

  14. Aplicando…  Considere a seguinte tabela:  Calcule:   4 i   n x 1 i xi 1 8 2 2 3 3 4 6 5 7 6 8 7 9 8 4 9 5 10 11 4 1 6     2 ix 36 49 64 149 4 2 x i    64 4  9  36  113    1 i , 1 98        8 2 3 6 7 8 9 4 5 4 1 57   i i

  15. Estatística descritiva  É utilizada para descrever ou explorar uma variável, através de parâmetros específicos (população) ou estatísticas específicas (amostras) que permitam caracterizar a variável em estudo.

  16. Tabelas e gráficos  Maneiras de conhecer os dados  Distribuição  Representações gráficas  Clareza na apresentação dos dados

  17. Considere:  Um pesquisador, considerando pesquisas que demonstram que indivíduos que praticam atividade física regularmente podem ter uma expectativa de vida maior, resolve conhecer os hábitos da população da cidade De São Paulo. Para tanto, consegue passar um questionário de hábitos de atividade física para 200 habitantes. Os dados que ele coleta são os seguintes e desconsideraram o tipo específico de atividade desenvolvido pelos indivíduos:

  18. Dados  Praticam atividade física:  120 sim e 80 não.  Dos que praticam atividade física:  30 são do sexo masculino e 50 do sexo feminino.  Freqüência semanal no sexo masculino:  1x/semana – 5 indivíduos, sendo 3 acima dos 30 anos.  2x/semana – 15 indivíduos, sendo 9 acima de 30 anos.  3x ou mais /semana – 10 indivíduos, sendo 5 acima dos 30 anos.  Freqüência semanal no sexo feminino:  1x/semana – 12 indivíduos. 6 acima dos 30 anos.  2x/semana – 20 indivíduos. 8 acima de 30 anos.  3x ou mais /semana – 18 indivíduos. 8 acima dos 30 anos.

  19. Tabela I – Número de indivíduos que praticam atividade física classificados de acordo com sexo - masculino (M) e feminino (F)- e freqüência de atividade.

  20. Tabela II – Número de indivíduos que praticam atividade física classificados de acordo com sexo - masculino (M) e feminino (F)-, freqüência de atividade e faixa etária.

  21. Gráfico I – Número de indivíduos que praticam atividade física classificados de acordo com sexo - masculino (M) e feminino (F)-, freqüência de atividade e faixa etária.

  22. Alternativas  Considerando que se busca observar uma característica populacional baseado em uma amostra, poderia ser mais elucidativo apresentar os gráficos e tabelas em termos de percentual de todos os resultados obtidos e não de valores absolutos.

  23. Medidas de Tendência Central  O conceito de medida de tendência diz respeito a medida de um valor que possa melhor representar a tendência de um conjunto de números, ou uma variável. As três medidas mais utilizadas são a média, a mediana e a moda.

  24. Média aritmética  A média aritmética é a primeira idéia que ocorre quando se fala em “média”de alguma variável numérica, e é calculada dividindo-se a soma dos números do conjunto pelo tamanho deste. Assim a média entre 2, 4 e 6 é (2+4+6)/3 = 4.  A média populacional é convencionalmente denominada µ, e é calculada da forma genérica como:  … onde N é o tamanho total da população. N   x i   1 i N

  25. Média Aritmética  Já a média de uma amostra, ou média amostral, é designada por x e assume a forma  …onde n é o tamanho total da amostra. x n i  ( ) x i  i x n

  26. Média Aritmética  Dada uma amostra de tamanho n retirada de uma população de tamanho N, x é apenas uma estimativa de µ, ou seja a média amostral é uma estimativa da média populacional. x

  27. Propriedades da média aritmética  A média de qualquer conjunto pode ser sempre calculada.  Para um dado conjunto de números a média é única.  A média é afetada por todos os valores do conjunto.  Somando-se, subtraindo-se, multiplicando ou dividindo cada elemento do conjunto por uma constante a média também será acrescida, diminuída, multiplicada ou dividida por esta constante, respectivamente.  A soma dos desvios dos números do conjunto a contar da média é zero:   i n   [ ] 0 x x i 1

  28. ~ (x ) Mediana  A mediana divide um conjunto ordenado de dados em dois grupos dequantidades iguais. A metade do grupo estará abaixo e, a outra metade, acima da mediana.  Isto significa que para um conjunto de dados, se os mesmos forem ordenados,a mediana ocupará o centro deste conjunto.  Ex.: Dada a variável x = {1, 3, 0, 2, 4}, a mediana é 2.

  29. ~ (x ) Mediana  Para se calcular a mediana a mediana de um conjunto de dados deve-se:  Ordenar o conjunto;  Verificar se a há um número par ou ímpar de valores no conjunto;  Se for ímpar a mediana será o valor que ocupa a posição central e se for par será a média entre as duas posições centrais.

  30. Quartil e Percentil  Os quartis estão estreitamente relacionados à mediana e dividem um conjunto de dadosem quatro partes iguais:  Ex.: Dado x = {8.1; 1; 4; 2; 3; 6; 5; 7.6 }  Ordenando x tem-se: 1; 2; 3; 4; 5; 6; 7.6; 8.1

  31. Moda ) ˆ (x  A moda é o valor que aparece com maior freqüência.  x = {0; 1; 0; 2; 3; 4; 4; 0; 3; 2; 5; 6}. A moda é 0.  x= {3; 1; 2; 3; 3; 4; 5; 1,5; 2; 1,5; 0; 4; 1,5; 1,5; 6}. A moda é 1,5.

  32. Moda ) ˆ (x  Seja a tabela a seguir que contém o número de indivíduos (em um grupo de 100 indivíduos) que praticam atividade física, junto com a freqüência semanal  A moda será duas vezes por semana.

  33. Comparação entre Média, Mediana e Moda  Muitas vezes, precisamos decidir qual a medida de tendência central que mais se adequa aos nossos objetivos.  Como decidir?

  34. Medidas de dispersão ou variabilidade  As medidas de tendência central nos dão uma idéia da concentração dos dados em torno de um valor.  Entretanto, é preciso também conhecer suas características de espalhamento ou dispersão.

  35. Medidas de dispersão ou variabilidade  Se examinarmos o conjunto de dados ao lado, podemos observar um espalhamento para os mesmos.  A variabilidade ou dispersão é a medida da diferença entre os valores do conjunto.

  36. Amplitude total  Uma medida de dispersão é a da amplitude total do conjunto de dados.  Seja x uma variável que assume os valores x1, x2, ...xn.  A amplitude é definida como a diferença entre o valor máximo e mínimo que x pode assumir, respectivamente.  Ex.: x={-1, 2, 0, 3, 2, 1}, amplitude é 3 – (-2) = 4.

  37. Amplitude total  A amplitude pode levar a erros de avaliação, pois não representa o conjunto dos dados.  Muitas vezes reflete muito mal a dispersão dos mesmos.  Se x1 = { 1, 7, 6, 8, 8, 9, 9, 12, 15}, a amplitude é 14.  Se x2 = {3, 3, 4, 4, 8, 11, 13, 13, 14, 1 4} a amplitude é 11.  Aparentemente x1 teria maior dispersão que x2.

  38. Amplitude total  Analisando em uma escala os dois conjuntos:  Verificamos que o conjunto x1 tem uma maior concentração nos dados do que o x2.

  39. Desvio médio  O desvio médio é uma outra medida de dispersão e é definido matematicamente como: N     x i 1 i N

  40. Variância populacional  A variância, juntamente como o desvio padrão, é a medida de dispersão mais utilizada, como veremos nos diversos itens posteriores.  Matematicamente a variância é definida como: 2 N       x i   2 1 i N

  41. Desvio Padrão Populacional  O desvio padrão nada mais é do que a raiz quadrada da variância e matematicamente é definida como: 2 N       x i   2 1 i N

  42. Variância Amostral  Em se tratando de cálculo de valores amostrais, introduz-se o conceito degraus de liberdade (gl).  As estatísticas passam a ser determinadas através do número de gl.  Como a variância será estimada através da média, que já é uma estimativa, perde-se então um grau de liberdade para o cálculo da variância amostral que é calculada como:   2 n    x x i  2 1 i s n

  43. Desvio Padrão Amostral  O desvio padrão nada mais é do que a raiz quadrada da variância e matematicamente é definida como:   2 n 1   x x i  i s n

  44. Coeficiente de variação  Muitas vezes se deseja saber se a dispersão dos dados está muito alta, ou mesmo comparar a dispersão de resultados de amostras diferentes para diferentes tipos de medida.  Por exemplo, suponhamos que mediram-se a massa e a altura de uma mesma amostra de indivíduos e obteve-se como média para a massa 82,4 kg e desvio 65,4 kg; e para a altura a média de 176 cm e desvio padrão de 80 cm.  Qual das duas medidas possui maior dispersão?

  45. Coeficiente de variação  A princípio, pode parecer que é a altura.  Entretanto, devem-se levadas em conta as diferentes unidades de medida.  Uma forma de melhor comparar as variabilidades das medidas é através do coeficiente de variação ou CV.

  46. Coeficiente de variação s CV   Matematicamente é definido como:  Pela fórmula, podemos concluir que o CV é adimensional.  Para o exemplo anterior, têm-se os CVs de  65,6/82,4 = 0,79, para a massa  80/176 = 0,45, para a altura.  Isto mostra que existe maior dispersão nos dados de massa que nos de altura. x

  47. Distribuição de Freqüência  Muitas vezes, quando observa-se o conjunto dos dados obtidos de uma população ou de uma amostra grande verifica-se que sua avaliação é confusa.  Isto ocorre muito para dados de variáveis contínuas.

  48. Distribuição de Freqüência  Como exemplo, observemos a tabela abaixo que contém a concentração de glicose sangüínea encontrada em uma amostra de 32 indivíduos.  O cálculo da média e desvio padrão poderiam caracterizar bem esta amostra, sendo útil na avaliação da mesma.  Entretanto, podemos estar interessados na “concentração” dos valores da amostra estudada em determinadas faixas de concentração.

  49. Distribuição de Freqüência  Um método do qual se pode lançar mão para realizar tal investigação é estudar a distribuição de freqüência dos dados em questão.  Uma distribuição de freqüência é um método de agrupamento de dados em classes ou intervalos e pode ser apresentado em forma de tabela ou de gráfico, também conhecido como histograma.

More Related