1 / 118

Estatística e Análise de Dados

Estatística e Análise de Dados. Professor Leandro Morilhas. Agenda. Conceito e origem da Estatística. Áreas de Estudo. Medidas de posição central. Medidas de dispersão. Probabilidade. Correlação e regressão linear. Um passeio pela história …. 3000 AC – Censos no Egito. Outras cenas.

jeff
Télécharger la présentation

Estatística e Análise de Dados

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. Estatística e Análise de Dados Professor Leandro Morilhas

  2. Agenda • Conceito e origem da Estatística. • Áreas de Estudo. • Medidas de posição central. • Medidas de dispersão. • Probabilidade. • Correlação e regressão linear.

  3. Um passeio pela história …

  4. 3000 AC – Censos no Egito

  5. Outras cenas ...

  6. Na Babilônia também …

  7. Na Bíblia … • Quarto livro do velho testamento • Instrução a Moisés • Fazer um levantamento dos homens de Israel que estivessem aptos a guerrear

  8. Augusto César • Édito para que se fizesse o censo em todo o império romano Censere em latim = taxar

  9. Maria e José • Em função do édito, Maria e José viajaram para Belém

  10. Guilherme o conquistador • Inglaterra • 1085 • Levantamento estatístico • Terras • Propriedades • Empregados • Animais • Base de cálculo de impostos Domesday = Dia do juízo final

  11. Um livro para os impostos …

  12. Séc XVII - Tábuas de Mortalidade • John Graunt • Análises de nascimentos e mortes • % de homens ligeiramente superior a de mulheres

  13. Palavra Estatística • Cunhada pelo acadêmico alemão Gottfried Achenwall por volta da metade do século XVIII • O verbete “statistics” apareceu pela primeira vez na Enciclopédia Britânica em 1797

  14. Para entender a ... Estatística Status Estado Poder público Caracterização dos dados

  15. Uma origem controversa Estatística para cobrar IMPOSTOS

  16. E depois …. Facilitar a análise de DADOS

  17. A Estatística é dividida em: Análise de dados: Coleta, organização e resumo dos dados Probabilidade: Necessária para tirar conclusões a partir de amostras Inferência estatística: Tirar conclusões estatísticas de dados específicos usando os conhecimentos de probabilidade

  18. Definições: População É o conjunto de todos os elementos de interesse em um determinado estudo Amostra É uma parte da população selecionada para análise

  19. Dados Dados: são observações (tais como medidas, sexo, respostas de pesquisa) que tenham sido coletados Quantitativos: Quando é possível atribuir um valor numérico Qualitativos: Representam a informação que identifica alguma qualidade, categoria ou característica 

  20. Campos de Aplicação Estudos de mercado O gerente de uma fábrica de detergentes pretende lançar um novo produto para lavar a louça, pelo que, encarrega uma empresa especializada em estudos de mercado de "estimar" a percentagem de potenciais compradores desse produto. População: conjunto de todos as famílias do país Amostra: conjunto de algumas famílias, pesquisados pela empresa Problema: pretende-se, a partir da percentagem de respostas afirmativas, de entre os entrevistados sobre a compra do novo produto, obter uma estimativa do número de compradores na População.

  21. Campos de Aplicação Controle de qualidade O administrador de uma fábrica de parafusos pretende assegurar-se de que a percentagem de peças defeituosas não excede um determinado valor, a partir do qual determinada encomenda poderia ser rejeitada. População: conjunto de todos os parafusos fabricados ou a fabricar pela fábrica, utilizando o mesmo processo. Amostra: conjunto de parafusos escolhidos ao acaso de entre o lote de produzidos. Problema: pretende-se, a partir da percentagem de parafusos defeituosos presentes na amostra, "estimar" a percentagem de defeituosos em toda a produção.

  22. Analisando ... Frequências Média Mediana Desvio-Padrão

  23. Medidas de Posição Central

  24. Medidas úteis para a decisão • Medidas de posição central: • Média ou Valor Esperado • Moda • Mediana

  25. Média Aritmética Simples • Mais usual das medidas estatísticas • Relação entre soma e contagem • Centro geométrico de um conjunto de dados

  26. Exercícios 1 – Em março de 2009, os vendedores da Empresa Equilibrada Ltda. tiveram um aumento de 44% sobre os respectivos salários mensais. Ao final de junho, tendo em vista o considerável aumento das vendas da empresa, foi concedido um novo aumento a cada vendedor, de US$ 200 que começou a ser pago a partir de julho. Sabendo-se que, ao final do ano de 2009, o salário médio mensal dos vendedores da empresa passou a ser de US$ 1.100, pede-se calcular o salário médio mensal dos vendedores da empresa em fevereiro de 2009.

  27. Exercícios 2 – O salário médio mensal pago aos funcionários da Empresa ABC, foi de US$ 199 no primeiro semestre de 2009. Sabendo-se que a partir de julho houve um aumento que fez com que a média, ao final dos doze meses do ano subisse para US$ 217, pede-se calcular: A - O volume total gasto com o pagamento dos salários no mês de julho. B – Mantendo-se os valores do primeiro semestre e o valor encontrado para o mês de julho, caso a empresa queira reduzir os gastos com pessoal, de tal modo que a média ao final do ano de 2009 atinja US$ 180, qual deve ser a média mensal entre agosto e dezembro?

  28. Média aritmética ponderada É preciso considerar as frequências …

  29. Exercícios 3 – Um caminhão cujo peso vazio é de 3.200 kg será carregado com 470 caixas de 11 kg cada, 360 caixas de 9 kg cada, 500 caixas de 4 kg cada e 750 caixas de 6 kg cada. O motorista do caminhão pesa 75 kg e a lona de cobertura da carga pesa 48 kg. A – Sabendo-se que esse caminhão tem que passar por uma balança que só permite passagens a veículos com peso máximo de 16 toneladas, pergunta-se: ele passará pela balança? B – Qual o peso médio das caixas carregadas no caminhão?

  30. Exercícios 4 – O capital da Empresa Maguary Ltda. é formado pelo aporte dos acionistas, por financiamento de longo prazo e pela emissão de debêntures. Cada tipo de capital possui um custo anual diferente dado por uma taxa de juros anual, conforme o quadro: Calcular a taxa média do capital da empresa.

  31. Cuidado com as médias!!! Aparências podem enganar!

  32. Maior problema da média … Maldição dos extremos ou outliers Extremos distorcemalgumas medidas

  33. Solução para o problema … Remover os extremos!!

  34. Pesquisa sobre remuneração • Empresa paga $400,00 aos estagiários de Administração • Quer saber … É muito ou pouco? • Coletou amostra de dados • Dados: {300; 350; 6000; 340; 310; 380} Pouquíssimo!!! 7680 $1.280,00 6

  35. Organizando os dados … • Dados: {300; 350; 6000; 340; 310; 380} • Rol:{300; 310; 340; 350; 380; 6000} $400,00 Extremo distorce a média! • Rol sem extremo:{300; 310; 340; 350; 380} Alto! Média = 1680/5 = $336,00

  36. O centro dos dados ordenados Onde está ocentro???

  37. Mediana • Valor central de uma série ordenada de dados (Rol) {3; 7; 9; 10; 4; 8; 2} Ordenando no Rol 3 maiores {2; 3; 4; 7; 8; 9; 10} n par? 3 menores mediana = 6 {2; 3; 4; 8; 9; 10}

  38. O que é mais frequente Será que está namoda???

  39. Moda • Valor que se repete com maior frequência {2; 3; 4; 7; 7; 9; 10} unimodal {2; 2; 4; 7; 7; 9; 10} bimodal ou multimodal {2; 3; 4; 7; 8; 9; 10} amodal

  40. Medidas de Localização Não Centrais • Usadas para resumir ou descrever as propriedades de grandes conjuntos de dados numéricos: • Quartis • Percentis

  41. Quartis • Dividem os dados ordenados em quatro partes: • Primeiro Quartil (Q1): valor que faz com que 25% das observações sejam menores e 75% sejam maiores que Q1 • Segundo Quartil (Q2): é a MEDIANA – 50% das observações são menores que Q2 e 50% são maiores • Terceiro Quartil (Q3): valor que faz com que 75% das observações sejam menores e 25% sejam maiores que Q3

  42. Dados não agrupados Q1 = valor que corresponde à posição: Q2 = valor que corresponde à posição: Q3 = valor que corresponde à posição:

  43. Regras usadas para obter os valores do quartil • Se o ponto de posicionamento for um número inteiro, é só usar o número correspondente àquela posição • Se o ponto de posicionamento estiver na metade entre 2 números inteiros, a média dos dois números à direita e à esquerda será o quartil • Se o ponto de posicionamento não for a metade do caminho entre dois números inteiros, usamos o que estiver mais próximo.

  44. Exercícios 5 - Os salários mensais para uma amostra de 12 administradores são: 2.350 2.450 2.550 2.380 2.255 2.210 2.390 2.630 2.440 2.825 2.420 2.380 Determine os três quartis. 6 - Para estimar a quantidade de água que seria necessária para abastecer uma cidade na próxima década, a prefeitura precisa descobrir a quantidade de água que uma amostra de famílias utiliza atualmente. As famílias da amostra utilizaram o seguinte volume de água, em milhares de litros: 11,1 21,5 16,4 19,7 14,6 16,9 32,2 18,2 13,1 23,8 18,3 15,5 18,8 22,7 14,0 Encontre os três quartis.

  45. Exercícios 7 - Considere uma população constituída de profissionais liberais que foram, questionados sobre o número de revistas e/ou jornais que os mesmos são assinantes, obteve-se a seguinte tabela: Quais são os três quartis?

  46. Exercícios 8 - Uma empresa produz caixas de papelão para embalagens e afirma que o número de defeitos por caixa de distribui conforme a tabela da população: Determine o valor da moda, da mediana e da média

  47. Medidas de dispersão

  48. Medidas de Dispersão • Amplitude • Desvio médio • Variância • Desvio padrão

  49. Encontrando os extremos dos dados • Fundo de investimento, com retornos: {7, 3 e 2} • Amplitude • Maior menos menor • Range ou intervalo Maior - R = Menor - 2 R = 7 = 5

  50. Desvio médio • Desvio médio ou afastamento médio em relação à média Média = 4 Série 2 3 7 Desvios -2 -1 3 É preciso calcular osdesviosABSOLUTOS Soma 0 Média 0

More Related